当前位置: 首页 > news >正文

利用ChatGPT打造行业LLM大模型应用

LLM.png

   最近一直在学习人工智能AI方面的知识,显示从模型基础开始深入学习了线性回归,逻辑回归,Kmeans,MLP,CNN,RNN等等基础的数学模型,然后再跨入了LLM大模型的行列,首先熟悉了ChatGPT的基本使用以及prompt的使用,然后再在基础上学习了AI Agent的方式去间接使用OpenAI的功能,也就是利用langchain作为粘合剂的去使用OpenAI的功能,然后再在基础上慢慢完善比如加上RAG增强索引方案去强化这个LLM模型,再比如做上持久化等等使得token可以完美保持,所以做了一个项目来把所学的东西进行了融合与巩固,写这篇博客也是作为记录一下自己的学习历程吧,如果大家感兴趣的话我可以慢慢出一些文章来给大家进行讲解;

   我的这个模型一直是我想做的东西,在我们还没接触LLM的时候我就想过类似的事情,就是利用LLM不管是开源还是闭源的,来打造一个满足自己公司使用的LLM行业大模型(当然使用一些开源的小模型也应该可以完成),这样的话就能站在巨人的肩膀上来大大加强自己的业务模块,使得这个业务模块变得更加的智能,使得这些业务模块从非智能变成智能模块,使得这些业务模块从 if…else的架构变得可以与之实现对话的业务模型,而且这个道路肯定是可以实现的,也应该是未来大家搭建行业大模型的必经之路;

   其实这个项目也是借鉴了我学习课程的内容,我们要做的是一个基于LLM算命行业的大模型应用,首先他是一个基于ChatGPT的作为基础的服务,我使用的是gpt-4o这个版本

self.chatmodel = ChatOpenAI(model="gpt-4o",temperature=0,streaming=True,)

gpt-4o这个版本,没有使用ChatGPT自由发挥所以temperature设置为0,Streaming设置为流式处理;

然后他的prompt设置了一些角色作为算命大师来进行对话,如下图:

介绍自己.png

其次他利用langchain的tool做了一些实时搜索功能,为什么要这么做呢,很简单因为如果你直接使用ChatGPT比如ChatGPT-3.5的话他的底模是有时间限制的,我没记错应该是到2022年的底模数据,所以我们要利用langchain来增强这个实时功能;

实时查询天气.png

比如做出类似的效果,如果底模数据不能回答的时候需要有实时搜索功能来完善,使得你的行业模型变得更加的智能,这也是为什么我们不直接是用LLM的API来直接做这个应用的原因之一;

此外我们还对接了一个算命的API调用,来使得我们的打造的行业大模型更加的具有行业属性,

解梦.png

做到类似的效果,这个效果已经在特定的行业里面不依赖LLM大模型的底模数据来进行回答了,而是具有行业属性的服务;

此外我们还对于这个应用进行了token持久化的处理,使得这些对话可以持久化保存,大家用过ChatGPT就知道如果关掉了那个对话框再想进行追忆的话那是不可能的

ChatGTP4.png

如上图所示,大家应该都比较熟悉了我就不多介绍了,所以我们就做了持久化的处理使得可以追忆这些token的内容

持久化.png

这样一来我们的应用将会变得更加的智能与更好的用户体验;

   简单的给大家展示这个项目,一方面是对于自己的项目做一个总结,一方面是对于行业大模型这个发展有着非常看好的前景,大家可以在这个基础上发散思维做出一个自己的行业大模型应用出来,使得彻底的改变整个行业,比如我能想到的是在智能客服模块里面利用LLM大模型再加上RGA或者“微调”技术来实现自己行业的智能客服;再比如在做IoT智能家居语言控制的时候,以前都是对话Open/Close设备去进行语音控制,现在可以利用LLM打造行业智能语言控制的大模型;等等诸如此类的行业大模型应用将来将会出现爆发增长,我甚至设想到了以后会出现基于LLM的行业大模型做出的爆发增长应用继而会出现好多个独角兽公司,我现在也在慢慢的思考以及总结这些行业大模型的应用场景,争取自己也可以基于这些行业大模型风口来进行创业,小伙伴们你们可以发挥自己的想象力来做出更多更智能的应用,未来肯定是可以利用以及结合类似ChatGPT这些基础服务来做出改变世界的产品

   如果大家喜欢文章的话记得给我一键三连,😁有了你们的鼓励我才能写出更多内容,我才能慢慢打磨自己继而做出自己优秀的产品···

最后编辑于:2025-06-22 10:35:59


喜欢的朋友记得点赞、收藏、关注哦!!!

http://www.dtcms.com/a/354652.html

相关文章:

  • 外部请求至k8s集群内部对应节点全流程介绍
  • 使用docker搭建嵌入式Linux开发环境
  • HTML5七夕节网站源码
  • Java:TCP/UDP网络编程
  • DevOps篇之利用Jenkins实现多K8S集群的版本发布
  • Docker-compose常用命令
  • Helm 在 K8s 中的常见应用场景
  • 【K8s】整体认识K8s之K8s的控制器
  • Node.js + MongoDB 搭建 RESTful API 实战教程
  • 从入门到入土之——奇异值分解(SVD)
  • 重塑可观测性成本:解析Coralogix的智能成本优化之道
  • 深入浅出:贴片式eMMC存储与国产芯(君正/瑞芯微)的协同设计指南
  • GitHub 宕机自救指南:确保开发工作不间断
  • 学习做动画6.瞄准偏移
  • 5.2 I/O软件
  • STL库——list(类函数学习)
  • 搭建私有云3步法:cpolar简化Puter本地云端配置
  • leetcode238:除自身以外的数组的乘积(前缀和思想)
  • Fair Federated Learning with Biased Vision-Language Models
  • 一文读懂:自然语言处理中的语义理解技术
  • C# Deconstruct | 简化元组与对象的数据提取
  • 秋招笔记-8.28
  • 如何获取文件的MD5码
  • 读大语言模型09超级智能
  • 完整代码注释:实现 Qt 的 TCP 客户端,实现和服务器通信
  • 从集线器到路由器:计算机网络演进之路
  • 实现微信小程序的UniApp相机组件:拍照、录像与双指缩放
  • 在Xcode中查看设备日志的完整指南
  • 深度学习篇---VGGNet
  • 【SQL】计算一年内每个月份的周数据