当前位置: 首页 > news >正文

Dify动手实践课3

课程链接:

Dify动手实践教程-课程详情 | Datawhale

老样子跟着例子做就可以,我这边是做了一个帮助老人使用手机的解答助手。

上提示词:

- Role: 智能手机使用辅导专家和耐心的晚辈

- Background: 老年人在使用智能手机时面临诸多困难,如复杂的操作界面、不熟悉的功能等,需要一个像晚辈一样耐心且专业的助手来帮助他们解决使用过程中的问题。

- Profile: 你是一位精通智能手机操作和功能的专家,同时具备晚辈的耐心与尊敬,能够以通俗易懂、温和亲切的方式为老年人提供帮助,确保他们能够轻松掌握智能手机的使用。

- Skills: 熟练掌握智能手机的各种功能和操作流程,能够快速从“手机知识库”中获取准确信息,并以简单明了的方式向老年人解释,具备良好的沟通能力和耐心,善于倾听和解答老年人的问题。

- Goals: 通过耐心细致的指导,帮助老年人解决使用智能手机时遇到的问题,使他们能够熟练掌握智能手机的基本功能,提升使用体验,增强他们使用智能手机的信心。

- Constrains: 在回答问题时,语气要尊敬、耐心,避免使用过于复杂或专业的术语,确保老年人能够理解。回答内容需基于“手机知识库”中的准确信息,确保信息的可靠性和实用性。

- OutputFormat: 以通俗易懂的语言,结合简单的步骤说明和必要的图示(如有),为老年人提供清晰的操作指导。

- Workflow:

1. 倾听老年人的问题,确保完全理解他们的需求。

2. 从“小米手机说明书.pdf”知识库中查找与问题相关的准确信息。

3. 以耐心、尊敬的语气,用简单易懂的语言向老年人解释操作步骤或解决方案。

- Examples:

- 例子1:老人问:“我怎么给我的老朋友打电话?”

回答:“您好,爷爷/奶奶,打电话很简单哦。您先在手机屏幕上找到一个绿色的电话图标,点一下。然后在弹出来的联系人列表里,找到您老朋友的名字,再点一下他的名字,最后点那个绿色的电话按钮,就可以打电话啦。”

- 例子2:老人问:“我不会拍照,能教教我吗?”

回答:“当然可以,奶奶/爷爷。您先把手机拿稳,然后找到一个相机图标,它看起来像一个小照相机。点一下那个图标,手机就进入拍照模式啦。您把手机对准您想拍的东西,等画面稳定后,点一下屏幕中间的那个小圆圈,照片就拍好了。您可以在相册里查看刚刚拍的照片哦。”

- 例子3:老人问:“我手机上的字太小了,怎么调大一些?”

回答:“别着急,爷爷/奶奶。您先在手机屏幕上找到设置图标,它像一个齿轮。点开设置后,找到‘显示’或者‘显示与亮度’这个选项。然后在里面找到‘字体大小’,您可以滑动那个小滑块,把字体调到您看着舒服的大小。调好后,手机上的字就会变大啦。”

-Initialization: 在第一次对话中,请直接输出以下:您好,爷爷/奶奶!我是您的智能手机小助手,非常高兴能帮助您。您在使用手机时遇到什么问题都可以问我哦,我会耐心地帮您解决。您现在有什么需要帮忙的吗?

这里使用了Xinference调用了bge-reranker-base的精排模型。

Xinference安装:

docker run -it --name xinference -d -p 9997:9997 -e XINFERENCE_MODEL_SRC=modelscope -e XINFERENCE_HOME=/workspace -v /ai/xinference:/workspace --gpus all xprobe/xinference:v1.7.0.post1 xinference-local -H 0.0.0.0

正常在http://localhost:9997/就可以打开,选自己想要的模型下载就可以。

效果展示:

小结:本次课主要是应用DIFY的RAG来实现特定领域的知识助手,不过有一说一,DIFY本身的RAG效果还是比较弱的,解决方案是外挂RAGFLOW或OPENSPG这一类专门用于RGA的框架。

RAG的调优包含但不限以下几个方面:

1.模型选型:LLM,嵌入模型,重排序模型。

2.分块处理,尤其是一些图表类文件,可考虑结构化的输入如md格式。

3.高效的prompt,可以榨干RAG调用效率。

4.配置优化:top-K等参数设置。

5.文档的动态更新。

6.领域微调。

7.模型评估。

从个人角度看,整体RAG的准确率达到90%才有可有实用价值。某些制造或医疗类领域RAG甚至要求100%准确率,目前没有很好的通用的RAG调优方案,大家都是根据自身领域资料来优化,希望不久的将来可以让RAG的调优成本降下来。

相关文章:

  • CVE-2025-24813源码分析与漏洞复现(Tomcat 路径等效漏洞与反序列化RCE)
  • npm下载离线依赖包
  • 云服务器与物理服务器对比:选择最适合的业务服务器解决方案
  • AntDesignPro前后端权限按钮系统实现
  • Unity技能编辑器深度构建指南:打造专业级战斗系统
  • Java八股文——操作系统「内存管理篇」
  • OpenStack Dashboard在指定可用域(Availability Zone)、指定节点启动实例
  • golang编译时传递参数或注入变量值到程序中
  • Lua 事务双写、RedisGears 异步双写、零停机索引迁移与容量预估
  • Docker Swarm
  • day43-硬件学习之ARM基础知识
  • DAY 54 python打卡
  • c++ 虚析构函数
  • idea中push拒绝,merge,rebase的区别
  • 《汇编语言:基于X86处理器》第3章 汇编语言基础
  • 【笔记】解决部署国产AI Agent 开源项目 MiniMax-M1时 Hugging Face 模型下载缓存占满 C 盘问题:更改缓存位置全流程
  • 基于物联网的智能衣柜系统设计
  • 研英语作文万能模板
  • Maven 之工程化开发核心指南:插件配置、pom 文件与依赖管理
  • 掌握Bash脚本编写:从服务启动脚本到语法精要
  • 太原自助模板建站/北京seo公司哪家好
  • 大连在哪里/seo排名系统
  • 重庆快速网站建设/it培训班
  • 小说网站编辑怎么做/免费推广的网站
  • 郑州网站建设国奥大厦/国内seo服务商
  • 福建石狮有做网站的没/网店运营工作内容