当前位置：首页 > news >正文

kiln微调大模型-使用deepseek R1去训练一个你的具备推理能力的chatGPT 4o

news 2025/7/3 17:31:34

前言

随着deepseek的爆火，对于LLM的各种内容也逐渐步入我的视野，我个人认为，可能未来很长一段时间，AI将持续爆火，进入一段时间的井喷期，AI也会慢慢的走入我们每个家庭之中，为我们的生活提供便利，由此出发，我将在接下的内容里面给大家讲一下如何使用kiln.ai去微调你自己的大模型

微调工具介绍

本文使用的为最简单的kiln AI，Kiln AI 是一款开源的 AI 开发工具，能够简化大型语言模型大型语言模型（LLM）的微调、合成数据生成和数据集协作。它提供直观的桌面应用程序，支持 Windows、MacOS 和 Linux，用户可以基于零代码方式对多种模型进行微调并自动部署。

如果你看完本文觉得很简单，可以去尝试进阶版的unsloth和其他的微调工具，功能会更加强大，具备更多功能

（下图来自b站up九析，大家可以去up那学习一下，我讲的可能还有很多不到位的）

安装kiln AI

下载连接：Kiln 的 GitHub 发布页面：大型语言模型

（因为是github链接，需要翻墙）

下图为Windows安装包

下载解压好后双击运行就行

安装运行之后会在网页打开一个标签页

这样就安装好了

开始训练微调数据集

接下来我们需要用到ollama蒸馏的deepseek R1 14b模型（因为低于14b在继续数据集训练时会出错）和open ai的key

【我后面会专门出一个安装ollama，并在本地上跑的教程，暂时不会的小伙伴可以先了解流程后续实践一下】

点击GET STARTED我们开始kiln AI微调的大门

在这里连接本地的ollama和openAI的key

创建你的项目名，也可以直接用案例

接着编写你这个项目的要求和任务（可以理解为你想这个智能体成为什么样的人），我这也是直接使用的案例（创建一个笑话生成器）

run这里写入你的主题，然后选择你的模型，他会根据你的要求生成一个回答

生成的数据会在dataset里面显示

在这里使用openAI去生成你要生成的主题和他对应的子主题，然后生成你需要的数据，当所有数据生成完毕时点击save all

在弹出的面板里点击你需要的微调的模型，比如我们这边就是deepseek R1（因为我们需要把open AI的训练出自主思考的能力）

然后点击run and save去用deepseek R1讲数据集进行整合（需要等待一段时间）

由此我们就将数据集准备好了，下一篇讲如何运用这个数据集去训练我们的微调模型

查看全文

http://www.dtcms.com/a/38624.html

【十二】Golang 映射

【多模态大模型学习】位置编码的学习记录

【FFmpeg】拉流

【架构师从入门到进阶】第五章：DNSCDN网关优化思路——第四节：请求链路中代理的作用

设计模式-行为型-责任链模式

easy云盘笔记

总结一下Java中的Synchronized同步锁的常见面试题

Java基础第14天-坦克大战【1】

【C++修炼之路】C++类与对象：面向对象编程的第一步

【JavaEE】SpringMVC获取HTTP中的元素

C# 弃元的使用

决策树-分类

鸿蒙OS特点对测试的影响

JVM垃圾回收器深度底层原理分析与知识体系构建

DDS技术分享（一）

std::ranges::ref_view，std::ranges::owning_view， std::ranges::views::all

【TypeScript】ts在vue中的使用

电脑显示屏亮度怎么调？电脑屏幕亮度调节步骤介绍

laravel11设置中文语言包

技术架构和工程架构区别

【论文解读】《C-Pack: Packed Resources For General Chinese Embeddings》

深入探讨K8s资源管理和性能优化

深入解析 Spring 中的 BeanDefinition 和 BeanDefinitionRegistry

链表理论基础

Java并发编程面试题：并发工具类（10题）

[2/11]C#性能优化-不要使用空析构函数-每个细节都有示例代码

Windows和AD域提权枚举脚本及工具介绍

python-leetcode-乘积最大子数组

【CI/CD】Jenkins + Docker +SpringCloud微服务项目持续集成

项目总结nk

前言

微调工具介绍

安装kiln AI

开始训练微调数据集

相关文章：