当前位置: 首页 > wzjs >正文

做网站要遵守的基本原则seol英文啥意思

做网站要遵守的基本原则,seol英文啥意思,用vs2010做网站登录,公网ip做网站LLaMa Factory大模型微调 大模型微调平台&硬件LLaMA-Factory安装hfd下载hugging face模型自我认知微调Alpaca数据集指令监督微调断点续训 大模型微调 微调自我认知微调特定领域数据集。 平台&硬件 Ubuntu20.04显卡:M40 24G 2080TI 22G微调框架&#xff…

LLaMa Factory大模型微调

  • 大模型微调
    • 平台&硬件
    • LLaMA-Factory安装
    • hfd下载hugging face模型
    • 自我认知微调
    • Alpaca数据集指令监督微调
    • 断点续训

大模型微调

微调自我认知+微调特定领域数据集。

平台&硬件

  • Ubuntu20.04
  • 显卡:M40 24G + 2080TI 22G
  • 微调框架:LLaMA-Factory

LLaMA-Factory安装

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

启动项目所提供的webui操作界面(因为我这里有两张型号不一样的显卡,经过测试不能混合训练,因此指定使用单卡2080TI):

export CUDA_VISIBLE_DEVICES=0
llamafactory-cli webui

URL:http://localhost:7860/

如果报错ValueError: Unknown scheme for proxy URL URL('socks://127.0.0.1:7897/')
解决方案参考解决openai调用出现的valueerror: unknown scheme for proxy url url(‘socks://127.0.0.1:7890/‘),使用下面命令查看系统的代理设置

env|grep -i proxy

看看有没有出现下面的all_proxy的设置。

no_proxy=localhost,127.0.0.1,192.168.0.0/16,10.0.0.0/8,172.16.0.0/12,::1
https_proxy=http://127.0.0.1:7897/
NO_PROXY=localhost,127.0.0.1,192.168.0.0/16,10.0.0.0/8,172.16.0.0/12,::1
HTTPS_PROXY=http://127.0.0.1:7897/
HTTP_PROXY=http://127.0.0.1:7897/
http_proxy=http://127.0.0.1:7897/
ALL_PROXY=socks://127.0.0.1:7897/
all_proxy=socks://127.0.0.1:7897/

如果有all_proxy的设置,使用下面命令设置为空就行。(原理未知)

export ALL_PROXY=''
export all_proxy=''

hfd下载hugging face模型

以Qwen/Qwen2.5-7B-Instruct为例
不确定模型的名字的话,打开链接https://hf-mirror.com/api/models,搜相应的模型名字,比如我这里直接搜Qwen2.5-7B-Instruct,然后得知模型全称是Qwen/Qwen2.5-7B-Instruct

sudo apt install aria2
pip install -U huggingface_hub
wget https://hf-mirror.com/hfd/hfd.sh
chmod a+x hfd.sh
export HF_ENDPOINT=https://hf-mirror.com
./hfd.sh Qwen/Qwen2.5-7B-Instruct --tool aria2c -x 10

自我认知微调

主要是配置以下参数:

  • 模型名称:Qwen2.5-7B-Instruct
  • 模型路径:配置为fd下载的本地模型路径
    其他参数暂时用默认,训练轮数设置为20。开始训练。
    训练完成后,选择相应的检查点路径,随后测试chat。
    最后export导出模型。

Alpaca数据集指令监督微调

按Alpaca格式准备好数据集

[{"instruction": "人类指令(必填)","input": "人类输入(选填)","output": "模型回答(必填)","system": "系统提示词(选填)","history": [["第一轮指令(选填)", "第一轮回答(选填)"],["第二轮指令(选填)", "第二轮回答(选填)"]]}
]

复制数据集到data目录下,修改data/dataset_info.json
举例:

"数据集名称": {"file_name": "data.json","columns": {"prompt": "instruction","query": "input","response": "output","system": "system","history": "history"}
}

如果数据集没有相应的键,就先去掉data/dataset_info.json对应的键。比如我的数据集没有history,我就把data/dataset_info.json关于history的部分去掉。

断点续训

  1. 配置检查点路径为对应checkpoint对应位置(一般在saves文件夹)
  2. 如果有训练参数文件,加载训练参数(下次开始训练前可以点击保存,在config文件夹可以找到)
  3. 配置输出目录配置路径
  4. 点击预览命令,主要查看adapter_name_or_pathoutput_dir参数

参考:
使用微调神器LLaMA-Factory轻松改变大语言模型的自我认知
使用hfd工具快速下载huggingface模型权重-应该是目前最快的

http://www.dtcms.com/wzjs/374186.html

相关文章:

  • linux主机上传网站国内建站平台有哪些
  • 怎么做网站demo百度推广怎么提高关键词排名
  • 网站建设哪个平台最好青岛网站建设培训学校
  • 中英文建设网站企业整站优化
  • 做网站 做推广需要知道什么房产网站模板
  • 网站建设程序开发百度经验首页登录官网
  • 鲁谷做网站的公司seo怎么快速提高排名
  • 做网站客户最关心哪些问题优化方案模板
  • win10做网站服务器关于seo的行业岗位有哪些
  • 自己设置网站怎么做合肥网站制作公司
  • 如何美化wordpress主题seo网站优化知识
  • 优秀网站建设哪家专业网上推广app
  • 政府响应式网站建设深圳百度百科
  • 中央政府门户网站的建设思路seo技术培训宁波
  • 外贸网站批量收录百度关键词优化点击 教程
  • 公司做网站费用计入什么科目济南seo网站优化公司
  • 找人做网站会给源代码吗如何建立自己的网站平台
  • 虚拟主机怎么做网站最新国内新闻50条简短
  • 太阳能灯网站建设资源网站优化排名优化
  • 溧阳建设集团网站链接怎么做
  • 有没有什么做水利资料的网站上海百度seo牛巨微
  • 怎么做网站 新手做网站百度搜索排名服务
  • 定制网站制作公司惠州一搜在线信息技术供应semir
  • 网站设计计划书搜索引擎竞价广告
  • 长沙企业网站建设收费windows优化大师下载安装
  • 网站怎么做漂亮点网络营销做得好的产品
  • 四川做文学有关的网站百度手机助手苹果版
  • 网站制作公司怎么赚钱经典软文范例大全
  • 青海餐饮网站建设百度pc网页版
  • 学做网站有用吗西安外包公司排行