智谱清言沉思智能体,天工智能体,agenticSeek等AI Agent测试记录
基本概念
AI Agent国内一般翻译为智能体,通常基于大语言模型,再加上规划、记忆和工具使用功能,形成一个完整的智能系统。比如,OpenAI提出的智能体公式“AI智能体 = LLM + 规划 + 记忆 + 工具”,这个公式说明,AI智能体不仅仅依赖于语言理解能力,还需要规划、记忆和工具调用能力来完成复杂任务。
智谱清言沉思智能体
https://chatglm.cn/main/autoglm?lang=zh
需要先安装浏览器插件才能用,这点增加了用户使用的难度,好处是用户可以控制并打断智能体对浏览器的操作。
比如下面,知乎需要登录才能访问,这时用户就可以介入,而下面其他的智能体由于在虚拟机中运行,访问zhihu专栏时就会报错;
天工智能体
https://www.tiangong.cn/
每天赠送1500积分,试了一下生成PPT
让用户进一步明确需求,这点相比上面的智谱清言较好:
侧边栏可以上传自己的文档,或者是自己已经获取的网页链接:
虚拟机中访问知乎专栏页面出错,很可能是因为没有登录造成的:
等了一个小时,生成是以html文件的格式进行的,最后可以导出pptx或pdf格式,导出限时免费,最后任务还没完成就让充值:
第二天又试了一次文档模式,,生成一个调研文档,跑了好长时间,最后积分耗光了也没完成。
agenticSeek安装测试
agenticSeek号称是本地版的Manus
测试主机使用的是Ubuntu系统,参考下文安装chrome和chromedriver
《ubuntu 安装 chrome 及 版本匹配的 chromedriver》来自 https://blog.csdn.net/u012561308/article/details/142301920
git clone https://github.com/Fosowl/agenticSeek.git
cd agenticSeek
mv .env.example .env
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv
./install.sh
准备好Ollama并拉取deepseek-r1:32b
修改config.ini文件
is_local = True
provider_name = ollama
provider_model = deepseek-r1:32b
source .venv/bin/activate
sudo ./start_services.sh
python3 api.py
开源的这个和智谱清言那个一样无法让用户进一步确认需求,browser view也是在虚拟机中,遇到需要登录,或者要校验是否机器人的网站,用户没法介入;
总结
以上AI智能体测试下来,整体的观感就是可以调用浏览器自动检索一些网页,对比一些基础大模型的联网搜素功能,就是把这个检索的过程可视化了,这样做是否有必要,目前来看并没有带来什么实际的好处,实际输出的结果只要标注好引用来源,那么用户应该并不关心这个检索过程的;这些AI智能体,这样一通操作,除了看起来有点炫酷:自动打开浏览器,自动搜素相关网站,查看内容,反而增加了耗时。
耗时对比
同样的任务,deepseek官网(chat.deepseek.com) < 智谱清言沉思智能体 <天工智能体 < agenticSeek
生成内容对比
同样的任务,智谱清言沉思智能体生成的内容(可导出pdf,带参考文献)长度 > deepseek官网(选择“深度思考”+“联网模式”) > agenticSeek(特别简短,无法导出文件) > 天工智能体(可生成ppt,word,excel,最终未生成结果,预测会比开源的长)