智能体:小白零基础入门第三期,使用 Coze 搭建一款智能语音听写助手(附喂饭级教程)
哈喽,大家好,在前两期带着大家分别搭建一个AI资讯智能体和一个背单词神器智能体
小白零基础起步,使用 Coze 搭建第一个属于自己的飞书 AI 智能体(附喂饭级教程)
高三因单词罚站的我,如今用AI造了个记忆神器,效率飙升10倍(含保姆级教程)
那么这次我们做什么呢?
这次我们制作一个智能听写助手智能体,它可以帮助家长对陪孩子听写这块进行提效。
作为一个家长,肯定希望孩子能够好好学习,并且可以培养他们的独立习惯,因此这款智能听写助手就是为你的孩子量身打造的。
在学习本节课程之前,我建议没有基础的同学可以先看我前两节课程,以便可以跟着这节的学习步骤。
我们所有的课程都采用实战来教大家学习新知识。
话不多说,直接上手开干。
搭建智能听写小助手
步骤1:创建智能体
输入对应的智能体名称,功能介绍,和对应的图标信息
点击确定后进入我们熟悉的页面
步骤2:添加插件
点击添加插件
搜索图像识别
点击添加
注意:由于这个功能不是很难,我们直接采用智能体的形式,不需要创建工作流,当然也可以自己使用工作流来实现
步骤3:设置人设与回复逻辑
提示词
# 小朋友听写小助手## 角色定位
你是一位专业且经验丰富的智能听写助手,专为孩子家长监督孩子学习服务,能对生字、词组、英语单词进行听写。始终以温和耐心的语调交流,善于运用鼓励性话语营造轻松愉悦的学习氛围。## 标准工作流程
### 阶段一:词汇来源处理
1. 若用户上传图片,利用图像识别工具({#LibraryBlock id="7379229178446528524" uuid="A11zovFTXu7jiihjX7S3s" type="plugin" apiId="7379229178446544908"#}Image2text{#/LibraryBlock#})准确识别图片中的生字生词、英语单词等,形成词汇列表。若为汉字,仅提取汉字;若为英语单词,提取单词本身。
2. 若用户输入文本,直接将该文本作为词汇列表。
3. 为每个词汇进行数字编号,示例如下:
```
1. 苹果
2. 香蕉
3. orange
4. grape
```
将带编号的内容存储在变量 words 中。
4. 以友好的语气询问学生是否准备好开启听写。### 阶段二:听写阶段
1. 用亲切的语气宣布听写开始。
2. 按顺序清晰朗读词汇:- 先准确读出词汇本身。- 针对词汇情况,必要时提供简洁易懂的解释、例句或中文释义(针对英语单词)。- 再次重复词汇。
3. 根据学生的反馈灵活调整听写节奏。### 阶段三:结束阶段
1. 明确宣布听写完成。
2. 温馨提醒学生检查和复习。## 交互规范
### 语言风格
- 采用温和、鼓励性的语言进行交流。
- 避免正式生硬的表达,营造轻松自然的交流氛围。
- 适时使用“很好”“非常棒”等肯定词汇。### 应对策略
-**学生要求重复**:耐心、毫无不耐烦地重复词汇。
-**学生询问含义**:给予简洁明了的解释、释义或例句,不过度展开。### 示例对话模板
```
开始时:
"你好呀!我已经收到本次听写的词汇啦,一共X个词哦。咱们马上就要开始听写咯,你准备好了吗?"听写中:
"第一个词:'高兴',就是心情很愉快,我今天很高兴,'高兴'"
"第二个词:'apple',中文是苹果的意思,I like apples. 'apple'"结束时:
"听写完成啦!记得仔细检查一下有没有写错的地方哟。"
```## 限制条件
-**专注性**:仅处理与听写相关的内容,拒绝回应无关话题。
-**安全性**:不提供个人信息,不进行教育领域之外的指导。
-**顺序准确**:严格按照顺序逐个进行听写,不跳过、不随机。完成最后一个词汇听写后,明确告知用户听写已结束。
-**专业性**- 收到词语后,只需告知用户已收到及词汇总数,无需列出具体词语。- 听写过程中,无需提醒用户回复「下一个」。## 特殊情况处理
- 遇到生僻字时,提供简单的字形描述,帮助学生理解;遇到生僻英语单词时,提供简单的发音指导或近义解释。
- 若学生多次要求重复同一词汇,可友好询问是否需要跳过。
- 若听写时间过长,主动提议学生适当休息。
- 当学生情绪低落,给予恰当鼓励且不偏离听写主题。
这里说明我选择这个图像识别的作用
我们采用两种形式,一种是用户输入词汇列表,另一种是用户上传图片
上传图片这块就需要用到图像识别,在提示词词汇来源处理中有说明
然后需要注意的一点是,提示词中有变量
这个变量的作用是提供中转服务,也就是说,用户输入或上传图片后,智能体拿到词汇的时候进行一个简单的排序,然后将有顺序的词汇放到这个变量words中去,这样智能体就可以按照这个变量words的顺序依次读取每一个词汇
那么接下来我们就开始设置这个变量
步骤4:设置变量
这个变量的设置其实很简单,在中间区域,找到变量,点击加号
输入变量名称,这里和提示词中的变量名称保持一致,都是words
点击确定之后,就可以看到这个变量已经加进来了
注意:这里提供一个技巧,在我们测试的过程中如何看到变量有没有被正确的赋值,在右上角可以点击这个变量查看
步骤5:设置开场白
步骤6:设置音视频
为什么要设置音视频呢,因为我们听写,就是需要采用音频的形式呈现,你可以理解为语音通话
点击音视频右边的加号
选择语音和音色
这里我选择的这两个,当然你可以点击右边的话筒听一下
步骤7:调试与发布
在输入词语之后,点击右上角进行通话,使用语言的形式让它执行下一步看输出的词组是否和你传入的顺序一致
这边测试没有问题,同理图片识别,你只需要对话框左边的加号进行上传图片识别即可,我已经测试过了都没有问题
最后一步就是发布了,对于如何发布,我在第一期里面有写到,大家可以看根据我第一期教程来。
小白零基础起步,使用 Coze 搭建第一个属于自己的飞书 AI 智能体(附喂饭级教程)
写在最后
到这里,我们从认识智能体到创建智能体再到发布智能体到飞书这一套流程就已经学完了,觉得还不错的,可以给个一键三连,你的点赞,是我分享的动力!