当前位置: 首页 > news >正文

小样本微调大模型

一、环境搭建

conda create -n dseek python=3.10
conda activate dseek
pip install bitsandbytes
Pip install numpy
python -m pip install --upgrade pip setuptools wheel

安装cuda,torch,Unsloth, huggingface,wandb等,见前述章节;

微调服务器配置:单机笔记本显卡4060,32GB ram,8GB vram,

二、下载模型

       可以基于任何模型微调,如deepseek v3或r1;也可针对任何量化的版本,用deepseek 8b 4位量化模型:unsloth/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit。

        set HF_ENDPOINT = "https://hf-mirror.com"
        huggingface-cli download unsloth/DeepSeek-R1-Distill-Llama-8B-unsloth-bnb-4bit --

相关文章:

  • 【Go万字洗髓经】Golang中sync.Mutex的单机锁:实现原理与底层源码
  • 一文速通Python并行计算:03 Python多线程编程-多线程同步(上)—基于互斥锁、递归锁和信号量
  • 3.3 Taylor公式
  • ROC 曲线与 AUC 计算:模型评估的深度解析
  • Spring----ioc
  • 解读GM2D二维码在线平台:全球二维码迁移计划的创新
  • WEB安全--SQL注入--利用log写入webshell
  • 您的数据是如何出现在暗网上的?
  • 深度学习论文: Image Segmentation Using Text and Image Prompts
  • 2025年IT行业技术革命全景解析:从AI到量子计算的落地实践
  • C - 创建初级通讯录(详细解析一)
  • MySQL--主从复制--原理
  • (UI自动化测试web端)第三篇:元素的常用操作方法_浏览器操作
  • QT编程之CAN协议
  • DeepSeek与GPT的全方位对比及其为编程工作带来的巨大变革
  • 熊猫精灵脚本助手官网_找图找色-脚本精灵2025最新版下载
  • 深入解析 Java 类加载机制及双亲委派模型
  • 【MARK-2小车】小车教程、上位机教程
  • 高等数学-第七版-上册 选做记录 习题5-4
  • 表的约束及代码练习
  • “十五五”时期长三角需创新机制,形成高水平一体化合作路径
  • 不赚“快钱”的佳沛:蒋时杰解密新西兰国果如何在中国“慢养”出43亿生意
  • 蒲慕明院士:好的科普应以“质疑、讨论公众关切的科学问题”为切入点
  • 广西鹿寨一水文站“倒刺扶手”存安全隐患,官方通报处理情况
  • 学者三年实地调查被判AI代笔,论文AI率检测如何避免“误伤”
  • 土耳其、美国、乌克兰三边会议开始