当前位置：首页 > news >正文

LLM模型微调方法

news 2025/8/24 4:04:33

（一）Freeze 方法

Freeze 方法即参数冻结，通过冻结原始模型的大部分参数，仅训练少部分参数，大幅减少显存占用，从而实现对大模型的微调。该方法实现简单，在代码中只需设置需要微调的层的参数。例如，可通过循环遍历模型参数，依据层名判断是否冻结，如冻结除特定层（如 “layers.27”“layers.26” 等）之外的参数，使得模型训练时仅特定层参数参与更新。

for name, param in model.named_parameters():
    if "layers.27" in name or "layers.26" in name:
        param.requires_grad = True
    else:
        param.requires_grad = False

如此，模型训练时仅特定层参数参与更新。近期研究还发现，冻结底层参数可显著缓解 “虚假遗忘” 现象。在持续学习场景下，模型学习新任务时旧任务性能常骤降，但通过冻结底层参数，能低成本且有效地维持旧任务的性能。

http://www.dtcms.com/a/96849.html

相关文章：

高压NPN

【大模型基础_毛玉仁】5.2 模型编辑经典方法

记一次系统单点登录、模拟web系统登录方式的开发过程,使用AES加密

JavaScript中的Web Workers

Eplan许可管理与其他PLM工具的集成

Activity 避免销毁重建的方案

跨境电商封号的根源分析：AI反检测技术的应对策略

大模型（LLMs）微调面

TF-IDF——自然语言处理——红楼梦案例

nginx配置页面缓存,前端每次打包生成新的js文件

docker安装mongoDB

卷积神经网络的传播及参数用法

【React】基于 React+Tailwind 的 EmojiPicker 选择器组件

第R9周：阿尔兹海默症诊断（优化特征选择版）

小林coding-10道Java集合面试题

基础认证-单选题（三）

湖南（源点咨询）市场调研商业综合体定位调研分享（上篇）

Proxmox配置显卡直通

深入理解 dispatchEvent：前端事件触发的艺术

ICLR 2025｜华科OVTR：首次实现端到端开放词汇多目标跟踪，刷新性能SOTA！

PyQt6基础_界面控件简单介绍II

使用Selenium和lxml库搜房网爬取某地区房屋信息（python、pycharm爬虫）

直流充电桩“数据心脏“：四大核心使命驱动充电网络智能化升级

AI 与 IT 从业者：共舞还是取代？

python学习笔记（2）

docker构建并启动前端

多层感知机（MLP）全面指南

C语言：关于ctype库常用函数使用方法

多智能体功能分化的核心优势是什么:提升效率，查漏补缺

光谱相机的光谱信息获取