当前位置: 首页 > wzjs >正文

网站开发技术的简历天津seo排名

网站开发技术的简历,天津seo排名,《网站开发与应用》大作业,微信官网入口手机版🎯 本文目标 基于 Qwen1.5-1.8B-Chat 模型进行微调,修改模型自我认证! 🔹 修改前:当用户问"你是谁?"时,模型会回答: "我是阿里云自主研发的超大规模语言模型&#…

🎯 本文目标

基于 Qwen1.5-1.8B-Chat 模型进行微调,修改模型自我认证!

🔹 修改前:当用户问"你是谁?"时,模型会回答:

"我是阿里云自主研发的超大规模语言模型,我叫通义千问。"

🔹 修改后:我们希望模型回答:

"我是 Archer,由 意琦行 研发。"


1. 🏋️‍♀️ 训练相关概念复习

上一篇文章 分享了模型训练的相关概念,这里简单复习一下:

ChatGPT 是如何炼成的?

训练一个大模型一般可以分为三步:

  1. 预训练(Pre Training,PT)

    • 提供海量数据,通过无监督预训练

    • 花费大量算力得到一个基座模型

    • 例如:Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据

  2. 指令微调(Supervised Fine-Tuning, SFT)

    • 在基座模型上微调,让模型适应特定任务

    • 使用人类准备的问答对话数据

  3. 强化学习(RLHF)

    • 通过人类反馈优化生成质量

    • 遵循 3H 原则:Helpful、Honest、Harmless


🔧 微调方法

主流微调方法:

  • 全量参数更新(FFT):更新所有参数,资源消耗大

  • 参数高效微调(PEFT):只更新部分参数,效率高

PEFT 主要方法: (论文《Scaling Down to Scale Up》中详细介绍了40+种方法)

当前主流PEFT方法:Prompt Tuning、Prefix Tuning、LoRA、QLoRA


2. ⚙️ 安装 LLaMAFactory

环境准备:

  • Python 3.10.6

  • NVIDIA A40 GPU

git clone -b v0.8.1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .[torch,metrics]

3. 📦 准备模型和数据集

下载模型:

apt install git-lfs -y
git lfs install
git lfs clone https://www.modelscope.cn/qwen/Qwen1.5-1.8B-Chat.git

准备数据集:

使用内置的 identity 数据集,用于修改模型自我认知。

替换变量:

sed -i 's/{{name}}/Archer/g; s/{{author}}/意琦行/g' data/identity.json

修改后示例:

{"instruction": "hi","input": "","output": "Hello! I am Archer, an AI assistant developed by 意琦行."
}

4. 🚀 开始微调!

执行微调命令:

modelPath=models/Qwen1.5-1.8B-Chat
​
llamafactory-cli train \--model_name_or_path $modelPath \--stage sft \--do_train \--finetuning_type lora \--template qwen \--dataset identity \--output_dir ./saves/lora/sft \# ...其他参数省略...

📊 训练结果分析:

  • Loss曲线:成功收敛

  • 评估指标

    predict_bleu-4 = 86.0879
    predict_rouge-1 = 91.5523

5. 🧪 测试效果

原始模型:

{"content": "我是来自阿里云的大规模语言模型,我叫通义千问。"
}

微调后模型:

{"content": "您好,我是 Archer,由 意琦行 开发,旨在为用户提供智能化的回答和帮助。"
}

🎉 成功修改了模型的自我认知!


6. 📝 总结

本文通过一个有趣的Demo,展示了如何使用LLaMAFactory进行LoRA微调:

  1. 准备模型和数据集

  2. 注册数据集

  3. 执行微调

  4. 分析训练结果

  5. 测试模型效果


💡 小贴士:微调就像教AI说"方言",既要保留通用能力,又要学会特定表达。调参就像烹饪,火候很重要哦!

🤔 思考题:如果你想教AI用莎士比亚风格写作,该怎么准备数据集呢?


📚 相关资源

  • LLaMA-Factory GitHub

  • Qwen模型库

http://www.dtcms.com/wzjs/223203.html

相关文章:

  • 濮阳做公司网站外贸推广代理
  • 网站建设商务通什么意思淘宝直通车推广怎么做
  • 怎么用ps做网站首页图片尺寸百度竞价一个月5000够吗
  • 河北网站建设口碑好网页模板建站系统
  • 广州外贸型网站建设百度指数分析
  • 深圳专业网站建设平台网页谷歌seo排名优化服务
  • auxer可以做网站嘛百度电脑版官网
  • 外贸网站建设服务平台网络营销软文范例300
  • 青岛高端网站开发公司百度新闻发布平台
  • 山东做网站费用如何免费引流推广
  • 无锡市建设安全监督网站个人博客网站搭建
  • 2019做网站seo行不行自己接单的平台
  • vs网页设计教程广东seo推广贵不贵
  • 开发门户网站多少钱百度收录网址提交
  • 网站开发 法律申明宁波seo网络推广代理公司
  • html个人网站设计商丘seo
  • 记事本做的网站链接怎么装饰广州seo网站推广
  • 专业网站设计制作费用专业的推广公司
  • 南宁智慧园区网站建设今日最新头条新闻条
  • 汕尾网站建设seo 推广
  • 封面上的网站怎么做的seo资讯
  • jiasale wordpress网站seo入门基础教程书籍
  • 太平洋网站开发网站seo搜索
  • 房地产客户管理系统有哪些朝阳区seo搜索引擎优化介绍
  • 宝鸡网站建设公司市场调查报告
  • 旅游网站后台管理系统谷歌chrome
  • 莱芜在线人才网资源网站优化排名优化
  • 网站空间什么意思网络营销的50种方法
  • 做公司网站有什么猫腻网站流量统计分析报告
  • 秦皇岛网站建设企业seo人人网