当前位置: 首页 > news >正文

小样本微调大模型

一、环境搭建

conda create -n dseek python=3.10
conda activate dseek
pip install bitsandbytes
Pip install numpy
python -m pip install --upgrade pip setuptools wheel

安装cuda,torch,Unsloth, huggingface,wandb等,见前述章节;

微调服务器配置:单机笔记本显卡4060,32GB ram,8GB vram,

二、下载模型

       可以基于任何模型微调,如deepseek v3或r1;也可针对任何量化的版本,用deepseek 8b 4位量化模型:unsloth/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit。

        set HF_ENDPOINT = "https://hf-mirror.com"
        huggingface-cli download unsloth/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit --

http://www.dtcms.com/a/91607.html

相关文章:

  • 【Go万字洗髓经】Golang中sync.Mutex的单机锁:实现原理与底层源码
  • 一文速通Python并行计算:03 Python多线程编程-多线程同步(上)—基于互斥锁、递归锁和信号量
  • 3.3 Taylor公式
  • ROC 曲线与 AUC 计算:模型评估的深度解析
  • Spring----ioc
  • 解读GM2D二维码在线平台:全球二维码迁移计划的创新
  • WEB安全--SQL注入--利用log写入webshell
  • 您的数据是如何出现在暗网上的?
  • 深度学习论文: Image Segmentation Using Text and Image Prompts
  • 2025年IT行业技术革命全景解析:从AI到量子计算的落地实践
  • C - 创建初级通讯录(详细解析一)
  • MySQL--主从复制--原理
  • (UI自动化测试web端)第三篇:元素的常用操作方法_浏览器操作
  • QT编程之CAN协议
  • DeepSeek与GPT的全方位对比及其为编程工作带来的巨大变革
  • 熊猫精灵脚本助手官网_找图找色-脚本精灵2025最新版下载
  • 深入解析 Java 类加载机制及双亲委派模型
  • 【MARK-2小车】小车教程、上位机教程
  • 高等数学-第七版-上册 选做记录 习题5-4
  • 表的约束及代码练习
  • django入门教程之templates和static资源【五】
  • 八纲辨证总则
  • 如何优化 docker 镜像体积?
  • 【深度学习基础 2】 PyTorch 框架
  • EMQX Dashboard
  • Java 大视界 -- Java 大数据在智能金融区块链跨境支付与结算中的应用(154)
  • C#多态性入门:从零到游戏开发实战
  • Unity URP自定义Shader支持RenderLayer
  • 【Unity3D实现UI轮播效果】
  • 无人机+evtol:低空经济市场硬通货技术详解