PPIO × UI-TARS:用自然语言操控电脑,AI Agent 的极致体验
Manus的爆火预示着AI 正在从单纯的文本生成和图像识别迈向更复杂的交互场景。字节跳动近期推出的开源项目 UI-TARS Desktop 为我们展示了一种全新的可能性:能够通过自然语言理解和处理来控制计算机界面。这款工具代表了人工智能与人机交互领域的重大突破,为用户提供了一种全新的、更加自然的方式来操作计算机系统。
在项目落地实践中,高效稳定的底层模型支撑很关键,PPIO派欧云作为一站式AIGC云服务平台,提供高性能的 API 服务,涵盖了最新的 DeepSeek、QwQ 等系列模型,低价、稳定、快速,仅需一行代码即可调用。
PPIO x UI-Tars 图文使用教程
-
配置前置条件
(1)获取 【API Base URL】:固定为:https://api.ppinfra.com/v3/openai
(2) 获取 【API Key】:登录派欧云控制台API密钥管理页面,点击创建按钮。注册账号填写邀请码【VOJL20】得代金券
(3)生成并保存【API密钥】
!!注意:密钥在服务端是加密存储,请在生成时保存好密钥;若遗失可以在控制台上删除并创建一个新的密钥。
(4)获取需要使用的模型ID,推荐使用:
-
deepseek/deepseek-v3-0324
-
deepseek/deepseek-r1-turbo
-
deepseek/deepseek-v3-turbo
-
qwen/qwq-32b
其他模型ID、最大上下文及价格可参考:模型列表
2. 安装和配置UI-Tars
👉前往:https://github.com/bytedance/UI-TARS-desktop/releases/tag/Agent-TARS-v1.0.0-alpha.5
下载安装最新版本的客户端(目前只支持mac系统)
(1)下载完成后点击左下角【设置】
(2)先打开【Use custom model name】的按钮,在【Model Name】处填写官网的模型名称,在【API Key】处填写创建的密钥,最后在【Custom Endpoint】填写官网的Base URL,最后点击Save即可
运行效果展示
输入我们准备好的prompt:
使用网络浏览器查询旧金山当前的天气情况。
UI - TARS 凭借其强大的自然语言理解与处理技术,精准地执行了我们 “获取旧金山天气信息” 的指令。当下达指令后,它通过浏览器查到旧金山地区的天气数据源。最终,清晰、准确地为我们呈现当下的天气信息,复杂交互场景中其执行能力与信息获取能力有所表现。
热门三方平台集成
PPIO支持在20+主流平台中调用最新模型。
👉 查看使用教程:https://ppinfra.com/docs/third-party/overview
通用对话客户端:Chatbox、LobeChat、Nextchat、ChatHub、CherryStudio
通用AI助手:OpenManus
代码开发工具:Cursor、CLINE
开发/API平台:Dify、OneAPI、RAGFlow、FastGPT
生产力套件集成:Word、WPS Office AI,这些是办公软件集成AI功能
智能翻译工具:沉浸式翻译、欧路词典、流畅阅读、沉浸式导读
知识管理工具:思源笔记、Obsidian、AnythingLLM
……