当前位置: 首页 > news >正文

面试相关的知识点

1 vllm

1.1常用概念

1 vllm:是一种大模型推理的框架,使用了张量并行原理,把大型矩阵分割成低秩矩阵,分散到不同的GPU上运行。

2 模型推理与训练:模型训练是指利用pytorch进行对大模型进行预训练。

模型推理是指用训练好的模型对新的输入生成输出的过程

3 大模型一般的训练过程:1 先对大模型进行无监督预训练。2 对模型进行微调

4 张量:向量到二维矩阵、三维矩阵等。

2 lora和qlora的原理

1 lora 又名low rank adaptation,低秩矩阵自适应。特别适用于微调大规模语言预训练模型。

2 优势:直接对大规模语言模型进行全参数微调(full finetuning)计算量非常大。lora通过引入两个低秩矩阵。具体来说是把非常大的权重矩阵,化为两个维度低的矩阵

3 function call和ReAct

1 function call:模型主动调用在外部工具或者api的能力

2 ReAct:

4 agent

1 agent是什么

4 deepseek模型训练步骤

第一步,进行大规模无监督预训练学习。目的是让模型学会语言的基本结构与模式

第二步,使用质量冷启动数据(cot数据)对模型进行有监督微调。获得基本的格式遵循和反思验证能力

第三步,强化学习

 

相关文章:

  • mmaction2——tools文件夹下
  • 从零基础到最佳实践:Vue.js 系列(4/10):《Vue Router 路由管理:深入探索与实战应用》
  • 深入浅出理解时间复杂度和空间复杂度
  • 学习黑客了解密码学
  • UML 活动图 (Activity Diagram) 使用案例
  • 【Java高阶面经:微服务篇】8.高可用全链路治理:第三方接口不稳定的全场景解决方案
  • 【C++】模板下(泛型编程)
  • java面试每日一背 day1
  • 深入解析应用程序分层及 BaseDao 的封装策略
  • 操作系统 第四章 -2
  • 2025上半年软考准考证打印入口已开放!
  • 黑色矩形大于6识别
  • 编程技能:字符串函数09,strncmp
  • Base64加密解密
  • C++:array容器
  • 十七、面向对象底层逻辑-MessageSource接口设计
  • 野火RK3588部署yolov8
  • html模板-源码免费下载-html通用模板-html建站模板
  • 大模型时代,Python 近红外光谱与 Transformer 模型:学习的必要性探究
  • 跨部门项目管理优化:告别邮件依赖
  • 太原网站建设baidu/谷歌paypal官网入口
  • 网站 如何做 同时在线/网站建站系统
  • 中小企业网站制作广州网络服务公司找赛合/市场推广是做什么的