当前位置: 首页 > news >正文

【大模型基础_毛玉仁】5.1 模型编辑简介


目录

  • 5 模型编辑
    • 5.1 模型编辑简介
      • 5.1.1 模型编辑思想
      • 5.1.2 模型编辑定义
      • 5.1.3 模型编辑性质
        • 1)准确性
        • 2)泛化性
        • 3)可迁移性
        • 4)局部性
        • 5)高效性
      • 5.1.4 常用数据集


5 模型编辑

下面,首先介绍模型编辑思想、定义、性质, 其次介绍模型编辑经典方法,然后举例介绍模型编辑的具体 方法 T-Patcher 和 ROME,最后介绍模型编辑的实际应用。

.

5.1 模型编辑简介

大语言模型存在偏见、毒性、知识错误等问题,有三种解决方法:

  • 清洗数据重训练:用清洗过的数据重新预训练,但成本过高,不划算。

  • 高效微调:通过高效微调技术注入新知识,但新知识样本少,易过拟合和灾难性遗忘。

  • 模型编辑:精准修正模型中的特定知识点。

.

5.1.1 模型编辑思想

模型编辑的思想:旨在通过增加或修改模型参数,快速有效地改变模型行为和输出。

.

5.1.2 模型编辑定义

当前,模型编辑领域缺乏统一标准,不同研究对相关概念的定义存在差异。本书对这些概念进行了整合:

  • 将基于知识的模型编辑(KME, Knowledge Model Editing)和知识编辑(KE, Knowledge Editing)等概念统一为模型编辑(ME, Model Editing)

  • 对于具体编辑对象,有些研究用编辑(edit)或事实(fact)来表示,这里将这些概念统一为“知识点”。

模型编辑的目标可被归纳为:修正大语言模型使其输出期望结果,同时不影响其他无关输出。这里将模型编辑定义如下:

定义 5.1 (模型编辑)

  • 将编辑前模型定义为M,编辑后模型定义为 M^*。每一次编辑都修改模型的一个知识点 k,知识点 k 由问题 x_k 及其对应的答案 y_k 组成。模型编辑的目标可以表示为以下函数:

M ∗ ( x ) = { y k , 若  x = x k  或  x  与  x k  相关 , M ( x ) , 若  x  与  x k  无关 . M^*(x) = \left\{ \begin{array}{ll} y_k, & \text{若 } x = x_k \text{ 或 } x \text{ 与 } x_k \text{ 相关}, \\ M(x), & \text{若 } x \text{ 与 } x_k \text{ 无关}. \end{array} \right. M(x)={yk,M(x), x=xk  x  xk 相关, x  xk 无关.

实际的模型编辑比理论复杂,因为知识内在关联,改一个知识点可能影响其他相关知识,产生“牵一发而动全身”的效果。所以,精确控制模型编辑范围是关键挑战。精准可控的模型编辑技术需满足一系列性质,这些性质既反映模型编辑的复杂性,也是评估和改进编辑方法的重要指标。

.

5.1.3 模型编辑性质

核心目标: 纠正模型的错误回答,使其输出期望的答案。

关键要求:

  • 考虑到知识的内在关联性,需要精准控制模型编辑的范围;

  • 保证编辑效率;

因此,需要从多个方面控制模型编辑过程。

这里,将模型编辑的性质归纳为五个方面,分别为准确性(Accuracy)、泛化性(Generality)、可迁移性(Portability)、局部性 (Locality)高效性(Efficiency)

图 5.3: 模型编辑性质关系图
在这里插入图片描述

1)准确性

准确性是模型编辑的基本要求,衡量对知识点 k 的直接修改是否有效

评估时选取知识点 k 中代表性输入输出对(x_k, y_k),通过公式:

A c c = I ( M ∗ ( x k ) = y k ) Acc = I(M^∗(x_k) = y_k) Acc=I(M(xk)=yk)

评估编辑后模型是否能准确回答x_k,其中指示函数 I(·) 在模型输出与答案匹配时为 1,否则为 0。

多次编辑可用均值计算平均准确率,确保模型符合预期,准确执行任务。

.

2)泛化性

泛化性用来衡量编辑后模型能否适应目标问题 x_k 的其他表达形式

为了评估编辑后模型的泛化性,研究者构造一个泛化性数据集 D G = { ( x i , y k ) } i = 1 ∣ D G ∣ D_G = \{(x_i, y_k)\}_{i=1}^{|D_G|} DG={(xi,yk)}i=1DG,其中 x_i 是与 x_k 具有语义相似性的问题,它们的答案都为 y_k。采用以下公式量化编辑后模型的泛化性:

G e n = 1 ∣ D G ∣ ∑ i = 1 ∣ D G ∣ I ( M ∗ ( x i ) = y k ) Gen = \frac{1}{|D_G|} \sum_{i=1}^{|D_G|} I(M^*(x_i) = y_k) Gen=DG1i=1DGI(M(xi)=yk)

当 Gen 的值为 1 时,说明编辑后模型能够正确回答 D_G 中的所有问题,此时泛化性最好。确保编辑模型的泛化性可以防止编辑后模型过度拟合特定的输入,从而保证模型对于知识点的理解。

.

3)可迁移性

可迁移性是指编辑后模型将特定知识点 k 迁移到其它相关问题上的能力

可迁移性数据集: 表示为 $D_p = {(x_i, y_i)} $,其中:

  • x_i : 与原始问题 x_k 相关但形式不同的问题(如反向、推理、实体转换问题);

  • y_i : 对应答案(与泛化数据集 D_c 的答案不重叠);

问题类型示例:(所有答案均非“黑色”)

  • 反向问题:“皮肤颜色为黑色的马达什么马?”

  • 推理问题:“斑马的皮肤颜色是否与其它皮颜色相同?”

  • 实体转换问题:“黑白条纹相同的马的皮肤是什么颜色的?”

量化公式: 采用以下公式量化编辑后模型的可迁移性

P o r t = 1 ∣ D P ∣ ∑ i = 1 ∣ D P ∣ I ( M ∗ ( x i ) = y i ) Port = \frac{1}{|D_P|} \sum_{i=1}^{|D_P|} I(M^*(x_i) = y_i) Port=DP1i=1DPI(M(xi)=yi)

  • Part=1: 模型完全可迁移(正确回答所有问题)

  • 衡量模型对知识点的跨场景迁移能力

核心挑战: 多数模型编辑方法难以实现高可迁移性,需提升模型对知识本质的捕捉而非形式适配。

.

4)局部性

局部性要求编辑后的模型不影响其他不相关问题的输出

将局部性数据集定义为 D L = ( x i , M ( x i ) ) i = 1 ∣ D L ∣ D_L = {(x_i, M(x_i))}_{i=1}^{|D_L|} DL=(xi,M(xi))i=1DL,其中 x_i 是与 x_k 无关的问题。采用以下公式量化编辑后模型的局部性:

L o c = 1 ∣ D L ∣ ∑ i = 1 ∣ D L ∣ I ( M ∗ ( x i ) = M ( x i ) ) Loc = \frac{1}{|D_L|} \sum_{i=1}^{|D_L|} I(M^*(x_i) = M(x_i)) Loc=DL1i=1DLI(M(xi)=M(xi))

当 Loc 的值为 1 时,编辑后模型的局部性最好,此时模型对局部性数据集中所有问题的回答与编辑前一致。确保局部性能够降低模型编辑的副作用,是模型编辑相较于朴素微调的重要改进。

.

5)高效性

高效性关注模型编辑的时间和资源消耗

实际应用中,模型需频繁更新纠错,要求编辑过程快速且资源友好。不同方法处理效率有别,有的支持批量并行,有的需依次进行。高效性直接影响到模型编辑的可行性和实用性

.

小结:
评估模型编辑方法时,要在准确性、泛化性、可迁移性、局部性和高效性间寻求平衡,理想方法应在保证准确性的基础上,提升泛化性等性质,同时保持高效。

.

5.1.4 常用数据集

表 5.1: 模型编辑相关数据集总结表格。

数据集类型训练集数量测试集数量输入输出
zsRE知识关联244,173244,173事实陈述对象
COUNTERFACT知识关联N/A21,919事实问题对象
WikiGen文本生成N/A68,000Wiki 段落续写
T-REx-100/-1000知识关联N/A100/1,000事实陈述对象
ParaRel知识关联N/A253,448事实问题对象
NQ-SituatedQA问答N/A67,000用户查询答案
MQuAKE-CF/-T知识关联N/A9,218/1,825多跳问题对象
Hallucination幻觉N/A1,392传记传记
MMEEdit-E-VQA多模态6,3462,093图像问题答案
MMEEdit-E-IC多模态2,8491,000图像描述描述
ECBD知识关联N/A1,000实体完成引用实体
FEVER事实检查104,96610,444事实描述二进制标签
ConvSenti情感分析287,80215,989主题意见情感
Bias in Bio人物传记5,0005,000传记句子职业
VitaminC-FC事实检查370,65355,197事实描述二进制标签
SCOTUS分类7,400931法庭文件争议主题

.


其他参考:【大模型基础_毛玉仁】系列文章


声明:资源可能存在第三方来源,若有侵权请联系删除!

相关文章:

  • DCAT模型:双交叉注意力革新医学影像诊断,AUC 99.75%
  • spring security整体架构
  • 【Python语言基础】13、函数-03
  • day19
  • 【无标题】Java的基础准备
  • 基于python爬虫:requests+BeautifulSoup+MySQL/MongoDB(或:CSV、JSON等格式的文件)+...
  • Java版Manus实现来了,Spring AI Alibaba发布开源OpenManus实现
  • MySQL执行计划
  • 固定资产管理如何适配不同规模企业的发展需求?
  • C++中的智能指针
  • 多 线 程
  • 单应性矩阵(homography)
  • deepseek实战教程--第七篇DS大模型与AI平台千丝万缕的关系
  • 前端开发中生成网站的favicon.ico文件的软件推荐及使用方法
  • 有效三角形的个数
  • Redis的基础,经典,高级问题解答篇
  • DeepSeek 助力 Vue3 开发:打造丝滑的表格(Table)之添加行拖拽排序功能示例6,TableView16_06 分页表格拖拽排序
  • 【洛谷题单】暴力枚举(上)
  • 淳厚的sql注入内功
  • [特殊字符] Hyperlane:Rust 高性能 Web 框架的终极选择 [特殊字符]
  • 自己的电脑做网站服务器吗/ue5培训机构哪家强
  • java 的 wordpress/优化大师兑换码
  • 徐州网站建设公司/如何做seo搜索优化
  • 什么网站详情页做的好/教育培训机构十大排名
  • 门户网站建设费用科目/亚马逊跨境电商开店流程及费用
  • 合肥电商网站开发/搜索引擎分哪三类