当前位置：首页 > news >正文

模型之FIM（Fill-In-the-Middle）补全

news 2025/11/4 23:38:42

文章目录

模型之FIM（Fill-In-the-Middle）补全
- 什么是FIM（Fill-In-the-Middle）
- - FIM 的工作原理
  - FIM 示例：代码补全场景
- 常见模型fim 测试
- - deepseek fim
  - 阿里completions 接口
- 要判断模型是否支持特定的特殊标记
- - **1. 模型可以自动推断生成区域**
  - **2. `suffix` 是可选的**
  - **3. 模型的训练方式**
  - **4. `suffix` 的影响**
  - **5. 示例对比**
  - - **有 `suffix` 的请求**
    - **没有 `suffix` 的请求**
  - **6. 模型的灵活性**
  - **7. 适用场景**
  - **总结**

模型之FIM（Fill-In-the-Middle）补全

什么是FIM（Fill-In-the-Middle）

背景：传统训练的 GPT 模型只能根据前文内容预测后文内容，但有些应用比如代码生成器，需要我们给出上文和下文，使模型可以预测中间的内容，传统训练的 GPT 就不能完成这类任务。

FIM 是一种强大的生成技术，特别适合需要在上下文中间插入内容的场景。通过明确的前缀和后缀，模型可以更好地理解上下文，从而生成高质量的中间内容。这种技术在代码生成、文档编辑和自然语言生成中都有广泛的应用。

使用 FIM 训练的能够正确填充中间部分，FIM 是一种新的训练技巧，使得 GPT 类模型能够根据上下问填充中间部分。

FIM 的工作原理

输入分为三部分:
- 前缀 (Prefix): 输入文本的开头部分，提供上下文。
- 后缀 (Suffix): 输入文本的结尾部分，提供补充信息。
- 中间部分 (Hole): 需要模型生成的部分。
模型任务:
模型根据前缀和后缀的上下文，生成中间部分的内容。
标记 (Special Tokens):
通常会使用特殊标记（如 <fim_begin>、<fim_end> 和 <fim_hole>）来明确区分前缀、后缀和中间部分。

如果需要使用 FIM，通常需要明确指定 FIM 的相关配置，例如在 prompt 中提供前缀和后缀，并在模型配置中启用 FIM 模式。
模型本身需要支持 FIM 模式。如果模型不支持 FIM，即使提供了相关标记，模型也无法正确生成中间部分。

在 FIM 模式下，模型会根据 prompt 和 suffix 的上下文，自动推断需要生成的中间部分（即 <fim_hole>）

FIM 示例：代码补全场景

场景描述
假设你正在编辑一段代码，需要在函数体的中间插入逻辑。FIM 的目标是根据函数的上下文（前缀和后缀）生成中间部分的代码。

<fim_begin>
func calculateSum(a int, b int) int {// Start of function
<fim_end>return result
}
<fim_hole>

<fim_begin>: 标记前缀的开始。
前缀内容是函数的开头部分：
<fim_end>: 标记前缀的结束。
后缀内容是函数的结尾部分：
<fim_hole>: 标记需要生成的中间部分。
在某些实现中，<fim_hole> 是可选的，主要用于标记生成区域。如果省略 <fim_hole>，模型仍然可以通过上下文（prompt 和 suffix）推断出需要生成的部分。

{"prompt": "<fim_begin>func calculateSum(a int, b int) int {\n    // Start of function\n<fim_end>","suffix": "    return result\n}"
}

模型会自动识别 <fim_end> 和 suffix 之间的区域为生成目标。
如果显式添加 <fim_hole>:

查看全文

http://www.dtcms.com/a/168033.html

12.多边形的三角剖分 (Triangulation) ： Fisk‘s proof

销售预测业务优化设计方案汇报P99（99页PPT）（文末有下载方式）

总结C++中的STL

C++笔记-继承(下)(包含派生类的默认成员函数，菱形继承等)

代码随想录单调栈part1

使用CubeMX新建DMA工程——存储器到存储器模式

计网_PPP协议

MOOS-ivp使用（一）——水下机器人系统的入门与使用

【STM32单片机】#12 SPI通信（软件读写）

Ollama 本地运行 Qwen 3

连接linux虚拟机并运行C++【从0开始】

【Day 14】HarmonyOS分布式数据库实战

Hibernate与MybatisPlus的混用问题(Invalid bound statement (not found))

C++11新特性_Lambda 表达式

【C++】类和对象【中下】

kmodel文件分析

类成员函数编译链接的过程

机器视觉开发-摄像头扫描二维码

浅谈高校教育改革

学习笔记：Qlib 量化投资平台框架 — MAIN COMPONENTS Part Ⅳ

新能源行业供应链规划及集成计划报告（95页PPT）（文末有下载方式）

深入理解C语言中的整形提升与算术转换

【业务领域】PCIE协议理解

LintCode第652题-递归版

1996-2022年全国31省ZF干预度数据/财政干预度数据（含原始数据+计算过程+结果）

算法笔记.试除法判断质数

网络编程——TCP和UDP详细讲解

Adam（Adaptive Moment Estimation）

Python数据分析课程实验-2

前端八股 5

文章目录

模型之FIM（Fill-In-the-Middle）补全

什么是FIM（Fill-In-the-Middle）

FIM 的工作原理

FIM 示例：代码补全场景

相关文章：