[Ai Agent] 从零开始搭建第一个智能体
相关专栏:AI Agent实战
前言:
Agent这个词出现的越来越广,但大多数人只知道agent是一个用到ai大模型的智能体,对它怎么运用以及如何将其商业化还一头雾水。但不用担心,从本文开始,笔者会在该专栏中不断更新相关Agent实战与知识讲解,力求让读者能明了Agent的各种详细使用方法与商业化的方式。
一、Agent是什么/商业价值在哪
ai Agent,又称ai智能体,即将仅各种ai语言大模型运用于各种场景下,真正完成它由纸面到实际场景的商业化。而我们在这个过程中的角色(ai工程师),就是拼接:将ai不断拼接给各种接口,最终打造出一个智能体出来。应为主要工作是拼接,所以其中大部分的活都是低代码甚至无代码。不过如果想做一个更高级的智能体,就还是必须要学习相关的编程语言将其优化。但那是后话了,现在的我们不需要这么费事儿,先捣鼓眼前的低代码智能体即可。
用最简单的方式总结ai agent:将chatgpt理解成一个懂很多的实习生,但不怎么会干活。Agent就是为chatgp装上了手和眼。
-
手 = 能点鼠标、敲键盘、调接口;
-
眼 = 能看网页、读表格、扫邮件。
于是,实习生秒变 7×24 小时不下线的“工具人”。
至于商业化,可以说任何地方都是agent的商业化,未来数年时间必定是ai商业化集中爆发的时候。比如几个现在已经跑通的例子:
-
客服:把公司 FAQ(常见问题解答)甩进去,10 分钟搭好自动回复,一年只要 2000 块,比请兼职还便宜。
-
财务对账:每天自动登录银行、下载流水、对 Excel,出错率比人低。
-
直播间场控:自动刷屏、回复“尺码怎么选”,一晚 50 块,效率奇高。
二、智能体是如何运行的
首先引入一个场景:假设我们想做一个智能ai客服,希望它能自动回答客户问题。它的智商的确够,但它能获取本地的一些数据吗。并不能,所以我们需要将这些本地数据库“喂”给ai,这里我们用一个图示来讲解下:
1. 把一大堆本地资料拆成很多的小段便利贴 | ① → ② |
2. 给每段便利贴写一张“地址卡”(把原文字换成数字坐标) | ③ |
3. 有人提问时,把他的问题也写成一张地址卡 | ⑤ |
4. 拿这张新卡去跟所有地址卡比对,挑出最像的几张 | ⑥ |
5. 按地址把对应的便利贴取出来 | ④ |
6. 把这些便利贴和问题一起递给讲解员 | ⑦(前半) |
7. ai客服看完给出答案 | ⑦(后半) |
如上,我们的工作就是调用各种接口,搭建好这个流程的各个部件,最终组成一个可以运行的成品框架。
三、创建一个智能体
百闻不如一见,下面我们就来创建一个最简智能体,亲自感受一下其中过程。
假设智能体需要实现这样一个简单功能: 我输出什么,它就给我返回什么
这里笔者用的是扣子。
完成页面的注册登录后,点击上面的开发平台
进来后,先点击左边的+,再点击创建。
填完相关信息,点击确认,进到下边页面:
分析下页面布局:
最左边是给这个ai加设定,告诉这个ai要干什么
中间是给ai搭积木的地方,让ai根据流程编排,按部就班的完成任务。其中我们最关注的还是这个工作流,其他都可以暂时忽略。
最右边就是跟ai对话,测试功能是否健全。
多Agents我们现在暂时用不到,第一种模式又过于简易,我们主要用的还是第二种对话流模式,点进来:
会发现,其中的人设回复列直接被取消了。因为这儿我们并不需要ai有什么设定,我们所需的就只是使ai按部就班的完成我们设置的工作。这里的对话流就可以简单理解为之前的工作流。
我们接着创建一个对话流:
这里描述可以随便写,不影响具体逻辑。
进来之后能看见开始与结束两个节点。
这里就是生成具体ai运行工作流的地方了。简单理解就是“拖拉硬拽”。搞多个节点,每个节点代表不同功能,并将这些功能用线头按顺序连接起来,就可以实现我们想要的逻辑了。
我们下面实际操作下:
点击开始,可以看到里面的变量名与对应类型,我们也可以自己为其设置默认值,这里暂且不动。
再点击结束看下:
这里可以选择输出哪个变量,但选择输出前必须得跟有这个变量的节点连线:
如图,连完线后就可以打印开始的一个节点。
不想连了就选中那个小圆点,任意往其他地方拖一下就行。
其中,这里的左边是指定从右边传入过来的值的名字,可以简单理解为编程中的变量赋值。
记住这里的回答内容必须要加上{{}},将其作为变量输出,不然的话就会直接输出output这个字符。
如上,我们现在试运行一下:
有个小对话窗口,我们输出字符↓
没问题,我输出的会被返回,这里就实现了一个简易功能的AI agent。
四、小结
我们现已初步了解并搭建了一个智能体,但还有很多功能亟待挖掘。在之后的文章里,我会继续讲解更多的agent功能项目。如有相关需求,建议给个关注~