当前位置: 首页 > news >正文

AI大模型介绍

大模型介绍

大模型是指具有大规模参数和复杂计算结构的机器学习模型,通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数

开发大模型不是从0开始,是建立在已有的大模型基座模型上做开发,构建企业知识库(向量数据库)Embedding 将词向量化 例如 我是一个人 向量化为132345435

AI应用错误回答

在AI应用输入之后,得到错误的回答,证明结果不准确,可能有以下原因

1、没问清楚(提示工程)

2、缺乏相关知识(RAG

3、能力不足(微调)

4、私有化部署

在大模型开发中要做的就是 提示工程、RAG 、微调、再加一个私有化部署

RAG原理

对个人、企业的知识库中的数据进行拆分并且向量化存入向量数据库, 用户问问题,在向量数据库中匹配,拿出相似度TopN个的段落,在结合问题,生成prompt(提示词)交给大模型得出结果。RAG的配置使大模型变得更聪明

大模型微调 

在拿到基座模型以后,会对大模型进行参数微调,不采用全参微调,针对基座模型进行微调以后,将会对企业内部的一些问题回答的更加正确,不适合做通用型的回答

模型微调等于小批量的训练模型

可用的免费商用授权的基座大模型

Ollama Search,可以选择阿里的Qwen、gem、deepseek r1 GLM等

 

相关文章:

  • Seata框架 分布式事务实战 Demo-1
  • 二叉树的层平均值
  • 企业信息化的“双螺旋”——IT治理和数据治理
  • 北京市大模型备案及登记分析报告
  • 【设计模式】SOLID 设计原则概述
  • oracle 索引
  • 【鸿蒙开发】Hi3861学习笔记- WIFI应用AP建立网络
  • Python---数据分析(Pandas六:二维数组DataFrame,DataFrame的创建,DataFrame的属性)
  • CSS实现当鼠标悬停在一个元素上时,另一个元素的样式发生变化的效果
  • 前端网络请求
  • 面向对象(进阶)(‘封装‘,‘多态‘,‘对象属性‘,‘类属性‘,‘类方法‘,‘对象方法‘及其应用场景)
  • 糊涂人寄信——递推
  • 算法设计与分析——动态规划
  • KnowGPT知识图谱整合
  • 深入浅出理解LLM PPO:基于verl框架的实现解析之一
  • Java并发编程面试题:锁(17题)
  • c++ 数组索引越界检查
  • 解决 C 盘空间不足,免费软件高效清理
  • Python 用户账户(创建用户账户)
  • GaussDB构建高性能Schema:分布式数据库架构设计与实战
  • 海昏侯博物馆展览上新,“西汉帝陵文化展”将持续展出3个月
  • 北方将现今年首场大范围高温天气,山西河南山东陕西局地可超40℃
  • 温州通报“一母亲殴打女儿致其死亡”:嫌犯已被刑拘
  • 泽连斯基已离开土耳其安卡拉
  • 【社论】打破“隐形高墙”,让老年人更好融入社会
  • 沧州低空经济起飞:飞行汽车开启千亿赛道,通用机场布局文旅体验