当前位置：首页 > wzjs >正文

网站开发技术的简历天津seo排名

wzjs 2025/8/5 2:51:05

网站开发技术的简历,天津seo排名,《网站开发与应用》大作业,微信官网入口手机版🎯 本文目标基于 Qwen1.5-1.8B-Chat 模型进行微调，修改模型自我认证！ 🔹 修改前：当用户问"你是谁？"时，模型会回答： "我是阿里云自主研发的超大规模语言模型&#…

🎯 本文目标

基于 Qwen1.5-1.8B-Chat 模型进行微调，修改模型自我认证！

🔹 修改前：当用户问"你是谁？"时，模型会回答：

"我是阿里云自主研发的超大规模语言模型，我叫通义千问。"

🔹 修改后：我们希望模型回答：

"我是 Archer，由意琦行研发。"

1. 🏋️‍♀️ 训练相关概念复习

上一篇文章分享了模型训练的相关概念，这里简单复习一下：

ChatGPT 是如何炼成的？

训练一个大模型一般可以分为三步：

预训练（Pre Training，PT）：
- 提供海量数据，通过无监督预训练
- 花费大量算力得到一个基座模型
- 例如：Llama 3 在 24K GPU 集群上训练，使用了 15T 的数据
指令微调（Supervised Fine-Tuning, SFT）：
- 在基座模型上微调，让模型适应特定任务
- 使用人类准备的问答对话数据
强化学习（RLHF）：
- 通过人类反馈优化生成质量
- 遵循 3H 原则：Helpful、Honest、Harmless

🔧 微调方法

主流微调方法：

全量参数更新（FFT）：更新所有参数，资源消耗大
参数高效微调（PEFT）：只更新部分参数，效率高

PEFT 主要方法： (论文《Scaling Down to Scale Up》中详细介绍了40+种方法)

当前主流PEFT方法：Prompt Tuning、Prefix Tuning、LoRA、QLoRA

2. ⚙️ 安装 LLaMAFactory

环境准备：

Python 3.10.6
NVIDIA A40 GPU

git clone -b v0.8.1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .[torch,metrics]

3. 📦 准备模型和数据集

下载模型：

apt install git-lfs -y
git lfs install
git lfs clone https://www.modelscope.cn/qwen/Qwen1.5-1.8B-Chat.git

准备数据集：

使用内置的 identity 数据集，用于修改模型自我认知。

替换变量：

sed -i 's/{{name}}/Archer/g; s/{{author}}/意琦行/g' data/identity.json

修改后示例：

{"instruction": "hi","input": "","output": "Hello! I am Archer, an AI assistant developed by 意琦行."
}

4. 🚀 开始微调！

执行微调命令：

modelPath=models/Qwen1.5-1.8B-Chat

llamafactory-cli train \--model_name_or_path $modelPath \--stage sft \--do_train \--finetuning_type lora \--template qwen \--dataset identity \--output_dir ./saves/lora/sft \# ...其他参数省略...

📊 训练结果分析：

Loss曲线：成功收敛

评估指标：

predict_bleu-4 = 86.0879
predict_rouge-1 = 91.5523

5. 🧪 测试效果

原始模型：

{"content": "我是来自阿里云的大规模语言模型，我叫通义千问。"
}

微调后模型：

{"content": "您好，我是 Archer，由 意琦行 开发，旨在为用户提供智能化的回答和帮助。"
}

🎉 成功修改了模型的自我认知！

6. 📝 总结

本文通过一个有趣的Demo，展示了如何使用LLaMAFactory进行LoRA微调：

准备模型和数据集
注册数据集
执行微调
分析训练结果
测试模型效果

💡 小贴士：微调就像教AI说"方言"，既要保留通用能力，又要学会特定表达。调参就像烹饪，火候很重要哦！

🤔 思考题：如果你想教AI用莎士比亚风格写作，该怎么准备数据集呢？

📚 相关资源：

LLaMA-Factory GitHub
Qwen模型库

查看全文

http://www.dtcms.com/wzjs/223203.html

濮阳做公司网站外贸推广代理

网站建设商务通什么意思淘宝直通车推广怎么做

怎么用ps做网站首页图片尺寸百度竞价一个月5000够吗

河北网站建设口碑好网页模板建站系统

广州外贸型网站建设百度指数分析

深圳专业网站建设平台网页谷歌seo排名优化服务

auxer可以做网站嘛百度电脑版官网

外贸网站建设服务平台网络营销软文范例300

青岛高端网站开发公司百度新闻发布平台

山东做网站费用如何免费引流推广

无锡市建设安全监督网站个人博客网站搭建

2019做网站seo行不行自己接单的平台

vs网页设计教程广东seo推广贵不贵

开发门户网站多少钱百度收录网址提交

网站开发法律申明宁波seo网络推广代理公司

html个人网站设计商丘seo

记事本做的网站链接怎么装饰广州seo网站推广

专业网站设计制作费用专业的推广公司

南宁智慧园区网站建设今日最新头条新闻条

汕尾网站建设seo 推广

封面上的网站怎么做的seo资讯

jiasale wordpress网站seo入门基础教程书籍

太平洋网站开发网站seo搜索

房地产客户管理系统有哪些朝阳区seo搜索引擎优化介绍

宝鸡网站建设公司市场调查报告

旅游网站后台管理系统谷歌chrome

莱芜在线人才网资源网站优化排名优化

网站空间什么意思网络营销的50种方法

做公司网站有什么猫腻网站流量统计分析报告

秦皇岛网站建设企业seo人人网