当前位置: 首页 > news >正文

kiln微调大模型-使用deepseek R1去训练一个你的具备推理能力的chatGPT 4o

前言

        随着deepseek的爆火,对于LLM的各种内容也逐渐步入我的视野,我个人认为,可能未来很长一段时间,AI将持续爆火,进入一段时间的井喷期,AI也会慢慢的走入我们每个家庭之中,为我们的生活提供便利,由此出发,我将在接下的内容里面给大家讲一下如何使用kiln.ai去微调你自己的大模型

微调工具介绍

        本文使用的为最简单的kiln AI,Kiln AI 是一款开源的 AI 开发工具,能够简化大型语言模型大型语言模型(LLM)的微调、合成数据生成和数据集协作。它提供直观的桌面应用程序,支持 Windows、MacOS 和 Linux,用户可以基于零代码方式对多种模型进行微调并自动部署。

        如果你看完本文觉得很简单,可以去尝试进阶版的unsloth和其他的微调工具,功能会更加强大,具备更多功能

(下图来自b站up九析,大家可以去up那学习一下,我讲的可能还有很多不到位的)

 安装kiln AI

下载连接:Kiln 的 GitHub 发布页面大型语言模型

(因为是github链接,需要翻墙)

下图为Windows安装包

 下载解压好后双击运行就行

安装运行之后会在网页打开一个标签页

这样就安装好了 

开始训练微调数据集 

接下来我们需要用到ollama蒸馏的deepseek R1 14b模型(因为低于14b在继续数据集训练时会出错)和open ai的key

【我后面会专门出一个安装ollama,并在本地上跑的教程,暂时不会的小伙伴可以先了解流程后续实践一下】

 

点击GET STARTED我们开始kiln AI微调的大门

 在这里连接本地的ollama和openAI的key

 

创建你的项目名 ,也可以直接用案例

接着编写你这个项目的要求和任务(可以理解为你想这个智能体成为什么样的人),我这也是直接使用的案例(创建一个笑话生成器) 

 

run这里写入你的主题,然后选择你的模型,他会根据你的要求生成一个回答

 

生成的数据会在dataset里面显示

 

在这里使用openAI去生成你要生成的主题和他对应的子主题,然后生成你需要的数据,当所有数据生成完毕时点击save all

 

 在弹出的面板里点击你需要的微调的模型,比如我们这边就是deepseek R1(因为我们需要把open AI的训练出自主思考的能力)

然后点击run and save去用deepseek R1讲数据集进行整合 (需要等待一段时间)

由此我们就将数据集准备好了,下一篇讲如何运用这个数据集去训练我们的微调模型

http://www.dtcms.com/a/38624.html

相关文章:

  • 【十二】Golang 映射
  • 【多模态大模型学习】位置编码的学习记录
  • 【FFmpeg】拉流
  • 【架构师从入门到进阶】第五章:DNSCDN网关优化思路——第四节:请求链路中代理的作用
  • 设计模式-行为型-责任链模式
  • easy云盘笔记
  • 总结一下Java中的Synchronized同步锁的常见面试题
  • Java基础第14天-坦克大战【1】
  • 【C++修炼之路】C++类与对象:面向对象编程的第一步
  • 【JavaEE】SpringMVC获取HTTP中的元素
  • C# 弃元的使用
  • 决策树-分类
  • 鸿蒙OS特点对测试的影响
  • JVM垃圾回收器深度底层原理分析与知识体系构建
  • DDS技术分享(一)
  • std::ranges::ref_view,std::ranges::owning_view, std::ranges::views::all
  • 【TypeScript】ts在vue中的使用
  • 电脑显示屏亮度怎么调?电脑屏幕亮度调节步骤介绍
  • laravel11设置中文语言包
  • 技术架构和工程架构区别
  • 【论文解读】《C-Pack: Packed Resources For General Chinese Embeddings》
  • 深入探讨K8s资源管理和性能优化
  • 深入解析 Spring 中的 BeanDefinition 和 BeanDefinitionRegistry
  • 链表理论基础
  • Java并发编程面试题:并发工具类(10题)
  • [2/11]C#性能优化-不要使用空析构函数-每个细节都有示例代码
  • Windows和AD域提权枚举脚本及工具介绍
  • python-leetcode-乘积最大子数组
  • 【CI/CD】Jenkins + Docker +SpringCloud微服务项目持续集成
  • 项目总结nk