当前位置: 首页 > news >正文

DataWhale 组队学习 Ollama教程 task2 概念梳理

1. 核心知识概念
  • GGUF(GPT-Generated Unified Format)

    • 一种用于保存微调语言模型的文件格式,旨在方便模型在不同平台和环境之间的共享和导入。

    • 支持多种量化格式,能够有效减少模型文件大小。

    • 前身为 GGML(GPT-Generated Model Language),GGUF 解决了 GGML 的灵活性不足、兼容性差和难以维护的问题。

  • Safetensors

    • 一种用于存储深度学习模型权重的文件格式,注重安全性、效率和易用性。

    • 目前社区支持有限,但可以通过转换为 GGUF 格式后导入 Ollama。

  • 模型量化

    • 将高精度浮点数模型转换为低精度模型的技术,目的是减少模型大小和计算成本,同时尽量保持模型准确性。

    • 适用于资源有限的设备(如 CPU 或移动设备)。

  • 自定义 Prompt

    • 通过设置系统消息(SYSTEM)和参数(如温度、上下文窗口大小),调整模型生成文本的行为和风格。

    • 例如,可以让模型模仿特定角色(如超级马里奥)进行对话。

  • llama.cpp

    • 一个开源项目,支持将 HuggingFace 模型转换为 GGUF 格式,并提供模型量化和推理功能。

2. 操作流程概念
  1. 从 GGUF 导入模型

    • 下载 GGUF 文件。

    • 创建 Modelfile,指定模型路径。

    • 使用 ollama create 命令创建模型。

    • 运行模型进行测试。

  2. 从 Pytorch 或 Safetensors 导入模型

    • 下载模型文件(如 llama-3)。

    • 创建 Modelfile,指定模型路径。

    • 使用 ollama create 命令创建模型。

    • 运行模型进行测试(注意:此功能仍在社区开发中,可能存在不稳定性)。

  3. 由模型直接导入

    • 从 HuggingFace 下载模型。

    • 使用 llama.cpp 将模型转换为 GGUF 格式。

    • 对模型进行量化以减少资源占用。

    • 创建并运行模型。

  4. 自定义 Prompt

    • 创建 Modelfile,设置系统消息和参数(如温度、上下文窗口大小)。

    • 使用 ollama create 命令创建自定义模型。

    • 运行模型,观察生成文本是否符合预期行为。

  5. 模型上传与共享

    • 将本地生成的 GGUF 模型上传到 HuggingFace Hub。

    • 使用 HuggingFace API 完成上传,确保模型可被其他人访问和使用。

3. 关键操作工具与方法
  • Modelfile

    • 用于定义模型来源、参数和系统消息的配置文件。

    • 支持从本地文件、HuggingFace 模型或量化后的模型导入。

  • Ollama CLI 命令

    • ollama create:从 Modelfile 创建模型。

    • ollama run:运行已创建的模型。

    • ollama list:查看本地已创建的模型列表。

  • HuggingFace Hub API

    • 提供模型下载和上传功能,支持通过 snapshot_download 下载模型,通过 HfApi 上传模型。

  • llama.cpp

    • 提供模型转换、量化和推理功能,支持将 HuggingFace 模型转换为 GGUF 格式。

相关文章:

  • IntelliJ IDEA 接入 AI 编程助手(Copilot、DeepSeek、GPT-4o Mini)
  • Spring 事务及管理方式
  • 你需要了解的远程登录协议——Telnet
  • 236. 二叉树的最近公共祖先
  • 3.2 企业级AI Agent数据科学实战:从数据清洗到模型服务的全链路工业级方案
  • 前端性能优化实战:超大图片秒开方案——图像分割切片技术详解
  • AVA实战开源项目:课程答疑系统J(Vue+SpringBoot) 附源码
  • Flutter 的 Widget Key 提议大调整?深入聊一聊 Key 的作用
  • 切换镜像源(npm)
  • springboot和springframework版本依赖关系
  • 获取网站君子协议(robots协议)
  • python第七课
  • 【ISO 14229-1:2023 UDS诊断(会话控制0x10服务)测试用例CAPL代码全解析⑥】
  • 上位机学习之串口通信与温湿度项目实战
  • [高等数学]换元积分法
  • 【算法通关村 Day1】链表的增删改查及链表中双指针法应用
  • 讲讲Mysql主从复制原理与延迟
  • 代码随想录-训练营-day30
  • [转]Java面试近一个月的面试总结
  • 类加载机制及双亲委派模型
  • 经济日报:美国滥施汽车关税损人不利己
  • 习近平同巴西总统卢拉共同会见记者
  • 山东省市监局“你点我检”专项抽检:一批次“无抗”鸡蛋农兽药残留超标
  • 山东枣庄同一站点两名饿了么骑手先后猝死,当地热线:职能部门正调查
  • 中国科考船在钓鱼岛附近活动,外交部:完全是中国主权权利范围内的事
  • 浙江公开征集涉企行政执法问题线索,包括乱收费、乱罚款等