当前位置: 首页 > news >正文

DeepSeek大语言模型下几个常用术语

昨天刷B站看到复旦赵斌老师说的一句话“科幻电影里在人脑中植入芯片或许在当下无法实现,但当下可以借助AI人工智能实现人类第二脑”(大概是这个意思)

基本概念

  • AI 人工智能
  • NLP 自然语言处理
  • LLM 大语言模型
  • Hugging Face 一个提供了丰富的预训练模型和工具库的平台网站
  • Ollama 开源的本地大语言模型运行框架,用来在本地部署调用大语言模型,如DeepSeek-R1
  • vLLM 一个专注于高性能LLM推理的工具,也可以调用大语言模型,还可作模型文件转化或量化操作
  • llama.cpp 基于纯C/C++实现的高性能大语言模型推理引擎,专为优化本地及云端部署而设计,上面的Ollama即是在此基础上的封装和优化
  • Chatbox 为大语言模型对话提供人机界面交互功能,当然也可使用纯命令行方式,随个人喜好

量化

一种通过降低模型参数的表示精度来减少模型大小和计算需求的方法

常用的模型文件格式

  • safetensors - 由 Hugging Face 推出的一种新型安全模型存储格式,特别关注模型安全性、隐私保护和快速加载,仅包含张量的文件格式 ,如model-00001-of-000002.safetensors
  • GGUF All-in-one 二进制模型文件 ,如DeepSeek-R1-Distill-Qwen-7B-Q3_K_L.gguf
    • Q(Quantization)量化(压缩),后面的数值表示“单个参数的平均bit数”,数值越大越智能
    • K(K Quant)即多个参数组合一Block做压缩,初衷是在同一个压缩级别上再补偿些精度回来
    • S L M 等用于区分混合精度的程度,字母顺序越小越精简

相关文章:

  • MySQL和Hive SQL 时间处理常用函数汇总
  • 字符串字典树-依依的瓶中信
  • 深度洞察!树莓集团南京产业园再布局的核心逻辑
  • 网络运维学习笔记(DeepSeek优化版) 013网工初级(HCIA-Datacom与CCNA-EI)ACL访问控制列表
  • 项目中同时使用Redis(lettuce)和Redisson的报错
  • 服务器带宽堵塞会对网站访问产生哪些影响?
  • 打破界限!家电行业3D数字化营销,线上线下无缝对接
  • Yashan DB 体系结构
  • 初识云计算
  • 【FastAPI】 AI场景快速学习指南
  • JS采集数据爬虫-Fetch API 和 XMLHttpRequest 有什么区别?
  • 影刀 RPA 实战开发阶段总结
  • Linux--如何安装rockyLinux9虚拟机
  • 3D匹配算法简述
  • OpenCV计算摄影学(19)非真实感渲染(Non-Photorealistic Rendering, NPR)
  • Vue入门常见指令
  • 【通义万相】蓝耘智算 | 开源视频生成新纪元:通义万相2.1模型部署与测评
  • 通过CycleGAN把不成对的可见光数据转换为红外数据
  • Debian系统grub新增启动项
  • 【Leetcode 每日一题 - 补卡】2588. 统计美丽子数组数目
  • 产品服务展示型网站有哪些/排名优化公司哪家好
  • 做地产网站/seo关键词排名在线查询
  • 网站建设的公司实习做什么/潍坊百度关键词优化
  • 做网站一般用什么语言/100种宣传方式
  • 泰州网站建设物美价廉/谷歌推广怎么操作
  • 怎么选择扬中网站建设/山东百搜科技有限公司