当前位置: 首页 > wzjs >正文

武汉定制公交app上海营销seo

武汉定制公交app,上海营销seo,湛江网站定制,网站建设策划书目录如本教程有问题,感谢大家在评论区指出。 如操作过程中遇到解决不了的问题,可以在评论区提问,作者看到了会回复。 微调简介 模型微调通过在特定任务数据集上继续训练预训练模型来进行,使得模型能够学习到与任务相关的特定领域知识…

如本教程有问题,感谢大家在评论区指出。
如操作过程中遇到解决不了的问题,可以在评论区提问,作者看到了会回复。

微调简介

模型微调通过在特定任务数据集上继续训练预训练模型来进行,使得模型能够学习到与任务相关的特定领域知识。

微调步骤

  • 准备数据集,数据集格式如下:
    {
    “instructions”: “你好”,
    “input”: “”,
    “output”: “你好,我是DeepseekR1模型,很高兴为您服务!”
    }

instructions:这里包含的是对模型的指示或者说是任务描述,告诉模型应该做什么。
input:这是具体的输入数据,基于上面的指示(instructions),模型将根据这部分内容来生成回答或执行特定的任务。在这个例子中,input字段是空的,意味着没有特定的额外信息或数据提供给模型处理。
output:这是模型基于instructions和input生成的回答或结果。

  • 模型选择
  • 迁移学习:在新数据集上继续训练模型,同时保留预训练模型的知识
  • 参数调整
  • 模型评估:在验证集上评估模型的性能

微调的优势

显著减少所需的数据量和计算资源

环境准备

https://modelscope.cn/my/mynotebook

在这里插入图片描述

LLaMA-Factory 讲解

  • 下载 LLaMA-Factory 仓库
git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
  • 安装
cd LLaMA-Factory
pip uninstall -y vllm
pip install -e ".[torch,metrics]"
  • 若出现环境冲突,执行如下命令安装
pip install --no-deps -e .
  • 检查
llamafactory-cli version
  • 启动
export USE_MODELSCOPE_HUB=1 && llamafactory-cli webui

配置内网穿透

https://natapp.cn

  • 下载 natapp
    在这里插入图片描述
  • 上传到服务器

在这里插入图片描述

  • 配置 natapp 客户端

在这里插入图片描述

  • 在服务器执行如下命令
cd natapp
chmod a+x natapp
./natapp -authtoken=
  • authtoken 通过如下位置获取
    在这里插入图片描述

chmod 是 Change Mode 的缩写
a 表示 “all”(所有用户),包括文件的所有者(owner)、所属组(group)和其他用户(others)。
+x 表示为这些用户添加“可执行”权限(execute permission)。

  • 访问链接

在这里插入图片描述

  • 看到如下页面

在这里插入图片描述

微调实践

下载模型

export HF_ENDPOINT=https://hf-mirror.com
export HF_HOME=/mnt/workspace/huggingface
echo $HF_HOME
huggingface-cli download --resume-download deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
llamafactory-cli webui

进入 web-ui

deepseek-r1模型位置:

/mnt/workspace/huggingface/hub/models--deepseek-ai--DeepSeek-R1-Distill-0wen-1.5B/
snapshots/ad9f0ae0864d7fbcd1cd905e3c6c5b069cc8b562

—— 下面内容大家通过 web-ui 自己探索就好了 ~~ 这里不过多截图了 ~~

训练

  • 数据集准备
    • LLaMA-Factory/data
    • dataset_info.json 所有数据集信息,在此处添加自定义数据集
      • train_data.json
      • eval_data.json
    • 使用 easy-dataset 构造数据集
      https://github.com/ConardLi/easy-dataset/blob/main/README.zh-CN.md

导出

  • 导出位置:/mnt/workspace/LLaMA-Factory/merge
http://www.dtcms.com/wzjs/199624.html

相关文章:

  • 国外被墙网站免费关键词优化工具
  • 政府网站建设四个定位谷歌浏览器 免费下载
  • 手机网站模板代码网页代码大全
  • 建设网站的需求分析网络营销顾问招聘
  • 庆阳市西峰区做网站百度推广公司怎么代理到的
  • 做网页游戏网站需要什么网站网页的优化方法
  • 局域网的常用技术是什么厦门网站搜索引擎优化
  • wordpress链接转换重庆百度关键词优化软件
  • 商家网站建设模板头条新闻
  • 邯郸菜鸟网站建设软文广告是什么
  • 南磨房做网站公司包括哪些内容
  • 图书馆网站建设方案设计论文自己在家怎么做跨境电商
  • wordpress 仿站小工具百度官网
  • 电子商务网站建设的主要风险谷歌google官网下载
  • 网站怎样排名靠前如何进行搜索引擎优化 简答案
  • 北京外贸网站制作公司网站怎么接广告
  • 学校网站建设目标营销是做什么
  • ui设计一个页面多少价格合适seo优化网站推广
  • 门户网站怎么做seo短视频seo排名
  • 网站备案要拍照大家怎么做的啊百度邮箱登录入口
  • 免费 网站 空间seo推广软件排行榜前十名
  • wordpress转发微信搜索引擎优化的各种方法
  • 南宁制作网站多少钱网站关键词优化建议
  • 网站开发外包方案广州最新疫情通报
  • 大气网站模板免费下载谷歌浏览器网页版入口手机版
  • 烟台优化网站建设中国职业培训在线
  • 门头沟青岛网站建设西安seo全网营销
  • 成都快速做网站网络推广运营外包公司
  • 建设农家书屋官方网站合肥正规的seo公司
  • 政府网站管理推进集约建设东莞百度快照优化排名