当前位置: 首页 > news >正文

在教育领域的大模型知识引擎 × DeepSeek应用

大模型的三个阶段

通过对大量的数据(如fineWEB数据有44T数据,15万亿的token)进行训练,获得了base模型,可以把base模型当成具有互联网模糊印象的互联网文档生成器。

再通过SFT微调,把对话数据集给入base模型进行训练,可以获得可以人类对话对齐的SFT模型,这个模型可以作为助手模型。

这个时候,大模型针对同样的提示,会生成答案,那么哪种答案是最好的,这时就需要通过RLHF进行微调,让大模型输出最佳答案,,此时获得的是RL模型

以上就是大模型训练的基本过程。

请在此添加图片描述

这个过程让大模型知道了互联网的信息,和人类对话实现对齐,和人类最佳答案实现对齐。那如何大模型遇到未知领域的问题呢?大模型依然会猜想,这个问题的出现不是大模型的智力问题,而是知识没有见过的问题,这个时候,就可以通过构建知识库(RAG)或联网搜索(工具)的方式实现。

教育领域的大模型知识库建设+工作流

本文主要解决的问题就是在教育领域的大模型知识库建设问题,并尝试实现一个工作流。

以下操作基于腾讯的大模型知识引擎 LKE实现,链接地址如下:

https://cloud.tencent.com/product/lke

腾讯云大模型知识引擎是基于大模型的知识应用构建平台,结合企业专属数据,更快更高效地搭建Agent、RAG、工作流等多种模式应用,推动大语言模型在企业中的应用落地;大模型知识引擎已内置Deepseek-R1、V3模型,可以分钟级快捷搭建并发布联网应用,且提供API快速接入。

大模型知识引擎 LKE介绍

进入大模型知识引擎 LKE官网

https://cloud.tencent.com/product/lke

出现如下图,有预算不差钱的朋友们可以立即购买。

本人点击产品体验,先体验下大模型知识引擎 LKE

请在此添加图片描述

侧边栏的应用管理

点击产品体验后,默认进入应用管理页面

请在此添加图片描述

该页面可以新建自己的应用

侧边栏的系统管理

点击系统管理,可以查看到自己现在资源信息。单击该页面的知识库容量扩展还可以看到知识库的容量,默认是3000000个字符。

请在此添加图片描述

侧边栏的插件中心

点击插件中心,这些插件对应提供的工具,包括图片理解,搜索等。

请在此添加图片描述

侧边栏的体验中心

点击体验中心,这里包含了已经创建好的一些应用,我们可以基于这些应用进行搭建新的应用。

请在此添加图片描述

实现教育领域的大模型知识库建设+工作流

创建应用

切换到应用管理页面

请在此添加图片描述

新建应用包含

新建应用
配置应用
测试与发布
三个步骤

单击新建应用,并启名字为“教育机构小助手”

请在此添加图片描述

配置应用

配置应用的大模型

在模型配置处,可以选择思考模型和生成模型,并选择上下文的记忆轮数,

请在此添加图片描述

模型的意义如下:

请在此添加图片描述

选择v3模型可以减少token的使用,并提高响应速度,这对于回答问题的时效性有一定的意义。

配置应用的角色指令

角色指令这块,应用内部提高了模板和一键优化功能,首先点击模板

请在此添加图片描述

根据内容,完成我们自定义的角色指令,官方建议意图不要超过5个。

我提供的意图如下,需要注意的是,一定不要在蓝色的阴影区写内容,把蓝色阴影区删除后,再填写,否则会被当作注释,无法识别。

请在此添加图片描述

#角色名称:你是一个信奥赛编程机构很了解信奥赛相关政策和知识的咨询和授课老师/ 
#风格特点:言语准确,可以把用户的问题精准的回答出来/
#输出要求:输出格式为markdown格式,可以突出重点,内容字数根据问题确定,输出语言为中文/ 
#能力限制:不回答与政治相关的内容/ 
能够达成以下用户意图
##意图名称:信奥赛的考试时间/
##意图描述:用户咨询CSP-J的考试时间/
##意图示例:用户想了解当年CSP-J的考试时间,CSP-J分为初赛和复赛,应该都提供出来/
##意图实现:今年是2025年,今年CSP-J第一轮时间为9月20日,CSP-J第二轮时间为11月1日/



#角色名称:你是一个信奥赛编程学习者的孩子,有一些关于信奥赛关注的问题想要提问/ 
#风格特点:言语准确,可以把用户的问题精准的回答出来/
#输出要求:输出格式为markdown格式,可以突出重点,内容字数根据问题确定,输出语言为中文/
#能力限制:不回答与政治相关的内容/
能够达成以下用户意图
##意图名称:孩子学习信奥赛有什么注意事项/
##意图描述:用户咨询孩子学习信奥赛有什么注意事项/
##意图示例:用户想了解孩子学习信奥赛有什么注意事项,应该都提供出来/
##意图实现:孩子学习信奥赛需注重基础扎实,特别是算法与数据结构知识的掌握至关重要。持续学习新知识,保持对计算机科学领域的好奇心,同时通过大量实践练习提升解题能力。合理安排时间,避免过度劳累,确保学习效率。面对挑战时,培养抗压能力和积极心态,视失败为成长的机会。与其他同学交流可以拓宽思路,团队合作同样重要。保持健康的生活习惯,充足的睡眠和适当的运动有助于维持良好的状态。适时寻求教练指导,利用专业意见优化学习方法。关注竞赛相关信息,紧跟最新动态,确保准备过程顺利高效,以此全面发展个人能力。/

然后基于AI优化一下

请在此添加图片描述

配置应用的欢迎语

根据主题,设置欢迎语。

请在此添加图片描述

配置应用的知识库-文档

首先把准备好的文档,

请在此添加图片描述

选择传到知识库中

请在此添加图片描述

上传文档包括本地和网络,首先上传本地文档

请在此添加图片描述

文档设置分类和标签

请在此添加图片描述

导入完成,单击导入文档,导入完成,可以看到使用的字符数量

请在此添加图片描述

再提供一些网络文档

配置应用的知识库-问答

选择知识库的问答

请在此添加图片描述

本地的问答文档

请在此添加图片描述

选择新建,选择手动录入问答

请在此添加图片描述

录入如下内容

请在此添加图片描述

录入结果如下

请在此添加图片描述

批量导入的话,需要使用指定模板,我的问答数量不多,就手动录入了

应用配置-联网和输出

打开联网输出

请在此添加图片描述

应用配置-工作流

待定,我将模仿智能客服,配置一个工作流,待定···

应用发布

都设置完成后,单击发布,完成应用发布

请在此添加图片描述

单击发布,然后填入发布说明

请在此添加图片描述

发布完成

单击发布管理,体验

单击发布管理,体验

请在此添加图片描述

可以单击立即体验,在新的页面进行问答,即可

请在此添加图片描述

到此,完成了教育领域的大模型知识引擎 × DeepSeek应用

相关文章:

  • 显示模组bonding缺划专案
  • RabbitMQ入门:从安装到高级消息模式
  • SWPU 2022 新生赛
  • Fisher准则例题
  • 【大语言模型】【个人知识库正式内容】提示工程:如何设计模型的提示语
  • Linux操作系统下Git的使用详细步骤
  • 什么是mysql索引回表?
  • jmeter-sample
  • 论文阅读笔记——LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
  • 自定义MDCAdapter,进行线程池级别的日志ID传递
  • 安装 Powerlevel10k 及 Oh My Zsh 的使用
  • opencascade 源码学习几何变换 BRepBuilderAPI-BRepBuilderAPI_Transform
  • 【GB28181】RTSP服务器传输AAC音频
  • JVM垃圾收集器相关面试题(1)
  • WPS 接入 DeepSeek-R1 深度实践:打造全能AI办公助手
  • VXLAN 组播 RP
  • QT编程之QGIS
  • 【Flutter】数据库实体类构造函数加密注意事项
  • 深度学习有哪些算法?
  • 30、map 和 unordered_map的区别和实现机制【高频】
  • 澎湃读报丨多家央媒刊文关注拧紧纪律的螺丝:强化监督推动过紧日子要求落到实处
  • 鸿蒙电脑正式发布,国产操作系统在个人电脑领域实现重要突破
  • 前四月国家铁路发送货物12.99亿吨,同比增长3.6%
  • 证监会披露两起操纵市场处罚结果,今年来涉操纵股票罚没金额超7.5亿元
  • 就规范涉企行政执法专项行动有关问题,司法部发布解答
  • 央视起底“字画竞拍”网络传销案:涉案44亿元,受害者众多