当前位置: 首页 > news >正文

PPIO × UI-TARS:用自然语言操控电脑,AI Agent 的极致体验

Manus的爆火预示着AI 正在从单纯的文本生成和图像识别迈向更复杂的交互场景。字节跳动近期推出的开源项目 UI-TARS Desktop 为我们展示了一种全新的可能性:能够通过自然语言理解和处理来控制计算机界面。这款工具代表了人工智能与人机交互领域的重大突破,为用户提供了一种全新的、更加自然的方式来操作计算机系统。

在项目落地实践中,高效稳定的底层模型支撑很关键,PPIO派欧云作为一站式AIGC云服务平台,提供高性能的 API 服务,涵盖了最新的 DeepSeek、QwQ 等系列模型,低价、稳定、快速,仅需一行代码即可调用。

PPIO x UI-Tars 图文使用教程

  1. 配置前置条件

(1)获取 【API Base URL】:固定为:https://api.ppinfra.com/v3/openai

(2) 获取 【API Key】:登录派欧云控制台API密钥管理页面,点击创建按钮。注册账号填写邀请码【VOJL20】得代金券

(3)生成并保存【API密钥】

!!注意:密钥在服务端是加密存储,请在生成时保存好密钥;若遗失可以在控制台上删除并创建一个新的密钥。

(4)获取需要使用的模型ID,推荐使用:

  • deepseek/deepseek-v3-0324

  • deepseek/deepseek-r1-turbo

  • deepseek/deepseek-v3-turbo

  • qwen/qwq-32b

其他模型ID、最大上下文及价格可参考:模型列表

2. 安装和配置UI-Tars

👉前往:https://github.com/bytedance/UI-TARS-desktop/releases/tag/Agent-TARS-v1.0.0-alpha.5

下载安装最新版本的客户端(目前只支持mac系统)

(1)下载完成后点击左下角【设置】

(2)先打开【Use custom model name】的按钮,在【Model Name】处填写官网的模型名称,在【API Key】处填写创建的密钥,最后在【Custom Endpoint】填写官网的Base URL,最后点击Save即可

运行效果展示

输入我们准备好的prompt:

使用网络浏览器查询旧金山当前的天气情况。

UI - TARS 凭借其强大的自然语言理解与处理技术,精准地执行了我们 “获取旧金山天气信息” 的指令。当下达指令后,它通过浏览器查到旧金山地区的天气数据源。最终,清晰、准确地为我们呈现当下的天气信息,复杂交互场景中其执行能力与信息获取能力有所表现。

热门三方平台集成

PPIO支持在20+主流平台中调用最新模型。

👉 查看使用教程:https://ppinfra.com/docs/third-party/overview

通用对话客户端:Chatbox、LobeChat、Nextchat、ChatHub、CherryStudio

通用AI助手:OpenManus

代码开发工具:Cursor、CLINE

开发/API平台:Dify、OneAPI、RAGFlow、FastGPT

生产力套件集成:Word、WPS Office AI,这些是办公软件集成AI功能

智能翻译工具:沉浸式翻译、欧路词典、流畅阅读、沉浸式导读

知识管理工具:思源笔记、Obsidian、AnythingLLM

……

相关文章:

  • 郑州高端网站建设电子商务营销方法
  • 电子工程王粟北京seo关键词
  • 个人建站系统搜索引擎优化方式
  • wordpress 菜单css类宁波seo关键词排名优化
  • 广州网站定制服务seo外包公司费用
  • 网站优化建设扬州sem推广计划
  • 宝塔面板面试内容整理-宝塔面板插件系统
  • RBAC 权限控制:深入到按钮级别的实现
  • geoserver搭建Docker一键直接安装并上传tif影像预览
  • Java 集合有序性与重复性总结及记忆技巧
  • TreeMap 核心知识点与面试题解析
  • Docker 核心组件
  • 【教学类-102-03】自制剪纸图案(留白边、沿线剪)03——Python制作白色描边和黑点虚线间隔(透明png图片)
  • 【Introduction to Reinforcement Learning】翻译解读4
  • KWDB创作者计划—边缘计算:从概念到落地的技术解读
  • 荣耀90 GT信息
  • 【微机及接口技术】- 第八章 可编程并行接口
  • 软考中级-软件设计师 2023年上半年下午题真题解析:通关秘籍+避坑指南
  • R语言进行聚类分析
  • JBDC java数据库连接(2)
  • System V 信号量:控制进程间共享资源的访问
  • WPS JS宏编程教程(从基础到进阶)-- 第五部分:JS数组与WPS结合应用
  • 4.8学习总结 贪心算法+Stream流
  • 获取cookie的chrome插件:Get cookies.txt LOCALLY
  • 前端知识点---闭包(javascript)
  • 【设计模式】创建型 -- 单例模式 (c++实现)