用于感知图像超分辨率的自编码监督(易于理解版本)
Auto-Encoded Supervision for Perceptual Image Super-Resolution
作者: M. Lee, S. Hyun, W. Jun and J. -P. Heo
发表期刊: 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition
论文地址: https://ieeexplore.ieee.org/abstract/document/11094304
鉴于对于原文的专业术语以及学术论述理解的困难的的问题,本文将通过一系列的例子以及通俗易懂的语言对原文进行一番解读。
1. 一句话总结这篇论文的创新点
这篇文章发明了一种“聪明的评分标准”,让AI在把模糊图片变清晰时,既能画出逼真的细节,又不会因为“画得和标准答案不一样”而被扣分,从而解决了以往方法“要么清晰但呆板,要么生动但容易出错”的矛盾。
1.1. 用一个故事来理解:两个画画的学生
想象一下,你是一位美术老师,你的任务是让学生把一张非常模糊的风景照片,重新画成一幅清晰、逼真的油画。
你有两个学生:
-
学生A(追求“保真度”):他是个描图高手。他会努力让自己的画在每一个像素点上都和“标准答案”(原始高清照片)一模一样。
- 优点:他的画从大体轮廓、颜色上看,和标准答案的误差极小(学术上叫 PSNR/SSIM 分数高)。
- 缺点:因为他太追求像素级的完全一致,不敢大胆画出细节(比如草地里的每一根草,水面的波纹),所以他的画看起来总是有点模糊、缺乏生气,像是隔了一层毛玻璃。
-
学生B(追求“感知质量”):他是个艺术家。他不在乎像素是否完全对上,他追求的是让画看起来“感觉就像真的一样”。
- 优点:他的画细节丰富,草地生机勃勃,水面波光粼粼,非常有视觉冲击力(学术上叫 感知分数高)。
- 缺点:因为他自由发挥了很多细节,这些细节和“标准答案”里的细节位置、形状肯定不一样。如果你拿他的画和标准答案一个像素一个像素地对比,会发现“错误”百出。有时他甚至会画出一些奇怪的东西(学术上叫 GAN伪影)。
1.2. 以前的教学方法(传统方法的困境)
以前的老师(比如 SRGAN 等方法)是这样教学生B的:
“你要画得生动逼真,但同时,我也要用尺子一个像素一个像素地量你的画,跟标准答案不像的地方都要扣分!”
这个教学方法很矛盾,学生B会很痛苦。
- 他想画出逼真的草,但标准答案里的草是A形状,他画的是B形状,老师就会扣分。
- 为了不被扣太多分,他只好妥协,把草画得模糊一点,这样既不像A也不像B,但至少“错得不离谱”。
- 结果:学生B的创造力被压制了,画作虽然比学生A的生动,但总感觉不够完美,细节上畏手畏脚。
1.3. 这篇文章的“神仙教学法”(核心创新点:AESOP)
这篇文章的作者,也就是新的美术老师,想出了一个绝妙的办法。他说:
“我再也不用那种死板的尺子(学术上叫 逐像素损失 LpixL_{pix}Lpix)来衡量你的画了。我发明了一个新的评分工具。”
这个新工具就是 自编码器 (Auto-Encoder, AE),你可以把它理解成一个 “细节橡皮擦”。
这个“细节橡皮擦”是怎么工作的?
-
训练橡皮擦:老师先拿大量的高清照片和它们的模糊版进行训练。他让这个“橡皮擦”学会一件事:不管拿到多清晰的画,都把它变成“只保留基本轮廓和颜色,擦掉所有精细纹理”的模糊版本。
- 比如,输入一张高清的草地照片,它会输出一张只有一片绿色色块的图,草的细节全没了。
- 这个“只保留基本轮廓和颜色”的东西,论文里叫 “保真度偏差 (Fidelity Bias)”。
- 那些被擦掉的“精细纹理”(比如草的形状、水的波纹),论文里叫 “感知方差 (Perceptual Variance)”。
-
新的评分方式:现在,当学生B交上他那幅充满细节的画作时,老师是这样评分的:
- 步骤一:把学生B的画,用“细节橡pre擦”擦一遍,得到一张“学生画的模糊版”。
- 步骤二:把“标准答案”高清照片,也用同一个“细节橡皮擦”擦一遍,得到一张“标准答案的模糊版”。
- 步骤三:只比较这两张模糊版!
这种新方法好在哪里?
绝妙之处就在于,现在比较的两个东西,都已经没有细节了!
- 评分时,老师只关心:“你画的这片草地,整体颜色对不对?位置对不对?山的轮廓对不对?” (只考核 保真度偏差)。
- 老师完全不在乎:“你画的这根草的朝向,跟标准答案里的那根草是不是一样?” (不再惩罚 感知方差)。
结果:
学生B(艺术家AI)彻底解放了!他可以尽情地发挥创造力去画那些逼真的细节,因为他知道老师只会检查他的“大方向”有没有画错,而不会因为细节上的“自由创作”而扣他的分。
这就解决了之前的矛盾。AI可以同时做到:
- 基本内容正确:因为“模糊版”的对比保证了画的整体不出错。
- 细节生动逼真:因为AI在画细节时不再被死板的规则束缚。
最终,AI生成的图片既清晰、细节丰富,又没有奇怪的瑕疵,效果远超以往。
2. 用一个更具体的比喻:修复破损的古画
想象一下,你是一个文物修复专家,拿到了一张破损严重的古代人物画。画中人物的脸部区域变得非常模糊,你看不清他/她的具体表情。你的任务是把这张脸修复清晰。
现在,你面临一个核心难题:“这个人的表情到底是什么样的?”
- 他可能在微笑。
- 他可能很严肃。
- 他也可能在沉思。
这些都是合理的猜测,因为原始的清晰信息已经永远丢失了。这个问题,在学术上就叫做 “不适定性 (ill-posedness)” —— 它没有唯一的、标准的正确答案。
面对这个难题,修复专家们分成了两个流派:
2.1. 流派一:保真度派(Fidelity-oriented)
这一派的专家非常严谨、保守。他们的首要原则是:“宁可不够好,绝不能出错。”
- 他们的做法:他们不会去猜这个人在微笑还是严肃。他们会把所有可能的表情(微笑、严肃、沉思等)在脑中进行“平均”。最后,他们会画出一个没有任何表情的、最中性的脸。
- 对应文中的概念:
- 这种做法叫 “采用逐像素重建损失 LpixL_{pix}Lpix”,意思就是他们追求修复后的每一个像素点和所有可能性的“平均值”误差最小。
- 这个“没有任何表情的中性脸”,就是文中的 “最优保真度点” (图1a中的棕色点)。它是所有可能解的数学平均,是最安全、最不会犯大错的答案。
- 结果:修复出的画,从整体上看,位置、肤色都对,但因为缺乏明确的表情和细节,所以显得呆板、模糊、没有灵魂。
2.2. 流派二:感知质量派(Perceptual SR)
这一派的专家非常大胆、富有艺术感。他们的首要原则是:“不管对不对,首先要看起来像个真人!”
- 他们的做法:他们会根据画作的整体风格和背景,大胆地猜测一个表情。
- “我觉得这幅画的氛围很祥和,我给他画一个微笑的表情吧!”
- “不,我觉得背景很凝重,我给他画一个严肃的表情!”
- 于是,不同的专家修复出了很多个版本:有微笑版的、有严肃版的、有沉思版的……
- 对应文中的概念:
- 这些不同的、看起来都很真实的修复版本,就是文中的 “一系列不同的现实解” (图1a中的多个紫色点)。
- 每一个版本都非常生动、逼真、有感染力,远比那个“中性脸”好看。
- 结果:虽然每个版本看起来都很好,但问题是,我们永远不知道哪个才是最初的“正确答案”。而且,因为是“猜”出来的,这些细节和原始的细节肯定有出入。
2.3. 两个流派的关系
文中最后一句“每一个解都围绕着前述的最优保真度点”,用我们的比喻来解释就是:
虽然感知派的专家们画出了微笑、严肃等不同表情(紫色点),但他们画的终究还是**“一张人脸”**,而不是猫脸或狗脸。这张脸的基本轮廓、肤色等,还是和那个“中性脸”(棕色点)差不多的。也就是说,这些生动的解,都是在“基本正确”的框架下进行的艺术发挥。
3. 关于SRGAN 框架的通俗解释
作者指出,以前的方法就像一个精神分裂的老师,一边鼓励学生画出创意细节,一边又因为这些细节和标准答案不一样而惩罚学生。本文的创新就是发明了一种新的教学方法,能精准地只检查“基本功”是否扎实,而完全不管“创意细节”怎么画,从而解决了这个根本矛盾。
3.1. 现状:精神分裂的老师 (SRGAN 框架)
我们回到那个美术班的故事。现在的教学主流方法 (SRGAN) 是这样的:班里有两个老师同时教一个学生(AI)。
- 老师A(感知老师):他鼓励学生大胆创作,画出逼真的纹理和细节。“画得越生动越好!”
- 老师B(LpixL_{pix}Lpix 老师):他拿着尺子,一个像素一个像素地检查作业,要求和标准答案一模一样。“任何不一样的地方都是错的!”
这就是矛盾所在 (Perceptual-Distortion Trade-off):
学生(AI)非常痛苦。当他听从A老师的话,画出了一根生动的、但和标准答案里形状不同的草时,B老师立刻过来扣分,说他画错了。为了不被B老师扣太多分,学生只好把草画得模糊一点,这样虽然不生动,但至少“错得不明显”。
结果:学生的潜力被严重限制了。他永远无法画出最顶尖的作品,因为两个老师的要求是根本冲突的。
3.2. 以前的“妥协方案”(规避方法)
为了缓解这个矛盾,以前的人想了两个“和稀泥”的办法:
- 给 LpixL_{pix}Lpix 老师降级:让B老师(LpixL_{pix}Lpix)说话声音小一点,扣分少一点(给他乘以一个很小的系数)。但这治标不治本,B老师还在那里指指点点,学生还是不敢放开手脚。
- 让 LpixL_{pix}Lpix 老师戴上墨镜:在B老师检查作业前,先用一个“低通滤波器(LPF)”把作业和标准答案都弄模糊一点。这样B老师就看不清细节了,自然也不会因为细节不同而扣分。但这个方法太粗暴了,可能会把一些重要的、本该画对的轮廓也弄模糊,导致B老师看不清,无法给出正确的指导。
作者认为,这两种方法都是次优的,因为它们没有真正理解问题的根源。
3.3. 作者的深刻洞察:问题到底出在哪?
作者说,要解决问题,我们必须先搞清楚学生画作的两个组成部分:
- 保真度偏差因子 (Fidelity Bias Factor):这相当于画作的 “基本骨架” 或 “草稿”。比如,画人脸,眼睛、鼻子、嘴巴的位置和基本形状必须正确。这个“骨架”画得准不准,决定了这幅画的“保真度”。这部分是AI必须学对的,错了就要扣分。
- 感知方差因子 (Perceptual Variance Factor):这相当于画作的 “血肉和灵魂”。比如,皮肤的纹理、头发的光泽、眼睛里的神采。这些细节让画看起来逼真、生动。这部分没有标准答案,AI可以自由发挥,只要“看起来真实”就行,不应该因为和标准答案不一样而被扣分。
现在,问题的根源清晰了:
那个死板的 LpixL_{pix}Lpix 老师,他分不清什么是“基本骨架”,什么是“血肉灵魂”。他把所有和标准答案不一样的地方,不管是骨架画歪了,还是血肉画得太逼真,都当成错误来惩罚!
- 惩罚“骨架”画歪(保真度偏差),这是应该的。
- 惩罚“血肉”太逼真(感知方差),这是完全错误的,因为它扼杀了创造力,导致了模糊。
而感知老师的目标,恰恰是鼓励AI画出丰富的“血肉”(感知方差)。所以,只要 LpixL_{pix}Lpix 老师还在用老方法评分,他和感知老师就永远是敌人。
3.4. 作者的解决方案:聪明的校长 (AESOP)
作者提出的新方法 AESOP,就像是来了一位聪明的校长。他说:
“好了,都别吵了。我们不能再用这种粗暴的评分方式了。我要发明一个**‘骨架提取器’**。”
这个“骨架提取器”就是 自编码器 (AE)。
校长的计划是这样的:
-
训练“骨架提取器”:校长想,怎么才能让一个机器学会只看“骨架”忽略“血肉”呢?他想到了一个绝妙的主意:利用 LpixL_{pix}Lpix 老师的缺点! 他知道 LpixL_{pix}Lpix 老师最擅长的就是把任何生动的画都逼成模糊的“平均脸”。于是,他就让 LpixL_{pix}Lpix 老师去训练这个AE。经过训练,AE就成了一个完美的“细节擦除器”——你给它任何一张画,它都能精准地擦掉所有“血肉”,只留下“基本骨架”。
- 这里是全文最巧妙的地方:作者把 LpixL_{pix}Lpix 的缺点(导致模糊),反过来用作训练工具,来达到分离骨架和血肉的目的。
-
全新的评分流程:
- 学生(AI)交上他画的充满“血肉”的生动画作。
- 校长先把这幅画用“骨架提取器”处理一下,得到 “学生画作的骨架”。
- 然后,校长把“标准答案”也用同一个“骨架提取器”处理一下,得到 “标准答案的骨架”。
- 最后,校长只比较这两个“骨架”!
这个新流程完美地解决了所有问题:
- AI的“基本功”(骨架)画得准不准,能得到精确的反馈。
- AI在“血肉”上的所有自由创作,完全不会被评分,感知老师可以尽情地鼓励AI去创新。
- 两个老师(保真度指导和感知指导)再也不冲突了,可以齐心协力教出一个最优秀的学生。
最终,AI就能生成既“骨架”精准,又“血肉”丰满的顶级画作了。
4. SE (system error)和 VE (variance error)的通俗理解
作者把AI画画时产生的“误差”分成了两种:一种是必须修正的“基本功错误”(SE),另一种是值得鼓励的“创意细节差异”(VE)。以前的方法分不清这两种误差,一锅端地全都惩罚,导致画作模糊。而理想的方法应该只修正“基本功错误”,同时保护好“创意细节”。
4.1. 详细解释:两种不同性质的“错误”
想象一下,学生(AI)画完了一幅画,现在我们要拿他的画和“标准答案”去比较,找出“错误”。作者说,这些“错误”其实可以分为两种,性质完全不同。
4.1.1. VE (Variance Error):不可避免的“创意误差”(好的误差)
- 这是什么? 这就是我们之前说的“血肉和灵魂”带来的差异。比如,标准答案里模特的头发是向左飘的,学生画的头发是向右飘的。你用尺子一量,像素肯定对不上,这就是一个“误差”。但这个误差是坏事吗?不是!正是因为这些充满随机性、无法预测的细节,画作才显得生动、真实。
- 为什么叫 VE (方差误差)? “方差”在统计学里代表数据的离散程度。在这里,它代表了所有可能的、逼真的细节(向左飘的头发、向右飘的头发、卷曲的头发……)围绕着“头发”这个概念的分布范围。VE 就是你画的某个具体细节和标准答案那个具体细节之间的距离。
- 如果强行消除 VE 会怎样? 如果你跟学生说:“你必须消除这个误差!你的头发必须和标准答案里的一模一样!” 学生做不到,因为细节太复杂了,无法精确复制。他唯一的办法就是把头发画成一团模糊的色块,这样既不像左飘也不像右飘,“误差”反而变小了。这就是导致模糊的根源!
- 结论:VE 是创造真实感的源泉,它是一种“好的误差”。我们必须保留 (preserve) 它,保护它,绝不能试图消除它。
4.2.2. SE (Systematic Error):必须修正的“系统误差”(坏的误差)
- 这是什么? 这就是我们之前说的“基本骨架”画错了。比如,标准答案里的人脸是正的,学生画的整张脸都歪了5度。或者,标准答案里的人是黄皮肤,学生画成了白皮肤。这是一个系统性的、根本性的对齐错误。
- 为什么叫 SE (系统误差)? 因为它代表了学生对“画什么”这个基本问题的理解偏差。他画的“人脸”这个概念的中心(质心),和标准答案的“人脸”这个概念的中心,没有对齐。
- 如果修正 SE 会怎样? 如果你跟学生说:“你的脸画歪了,把它摆正!” 学生照做了。这个修正过程会影响他画的头发细节吗?不会!他只是把已经画好的、充满生动细节的脸整体旋转了5度而已。修正 SE 不会扼杀创意,只会让作品更准确。
- 一个重要的补充:作者特意指出,这个“基本骨架”(保真度偏差)并不仅仅是模糊的轮廓。它也包含一些清晰的、可以被准确学习的边缘,比如建筑物的笔直轮廓。这些虽然是高频细节,但它们是确定的、没有随机性的,所以也属于“骨架”的一部分,画错了就必须改。
- 结论:SE 是一个真正的错误,它拉低了画作的整体质量。我们必须最小化 (minimize) 它。
4.2. 理想的教学方法(理想的损失函数)
现在,我们明白了:
- VE 是朋友,要保护。
- SE 是敌人,要消灭。
一个理想的老师(也就是一个理想的AI训练算法),就应该具备一双“火眼金睛”,能够准确地区分这两种误差。当他看到学生作业和标准答案有差异时,他能判断出:
- “哦,这个地方是头发细节不一样,这是 VE,是好事,表扬!”
- “嗯?这个地方是鼻子位置画错了,这是 SE,是坏事,必须改正!”
通过只修正 SE,同时保留 VE,AI 就能在保持“基本功”扎实的前提下,最大程度地发挥创造力,画出最逼真、最生动的图像。这就是本文追求的终极目标,也是他们提出的 AESOP 方法所要实现的功能。
5. 对具体的训练过程的通俗解释
作者分两步实现他们的创新:第一步,专门训练一个“细节擦除器”(自编码器),让它学会只提取图像的“基本骨架”;第二步,在训练AI时,用这个擦除器处理AI的画和标准答案,然后只比较两个“骨架”的差异,从而实现精准、无副作用的指导。
5.1. 详细解释:校长的两步走计划
这位聪明的校长(作者)要推行他的新教学法,他把计划分成了两个清晰的阶段:
5.1.1. 阶段一:打造完美的“骨架提取器” (4.1. 自编码器预训练)
目标: 制造一个机器,你给它任何一张画,它都能自动擦掉所有生动的“血肉”(感知方差),只留下最基本的“骨架”(保真度偏差)。
方法: 他选择用一个叫做 自编码器 (Auto-Encoder, AE) 的东西来做这个机器。这个机器由两部分组成:
- 编码器 (Encoder):负责“压缩”,把一张大画变成一张小总结。
- 解码器 (Decoder):负责“解压”,根据小总结把画还原出来。
天才的训练过程:
校长想了一个绝妙的训练方法,他利用了我们之前提到的那个“死板的 LpixL_{pix}Lpix 老师”的缺点。
-
设置一个“信息瓶颈”:他故意把编码器压缩后的“小总结”设计得非常小,尺寸和原始的模糊照片一样大。这就好比强迫你用一条140字的微博来概括一部2小时的电影,你必然要舍弃大量的细节,只保留最核心的剧情。这个“瓶颈”强迫机器在压缩时必须扔掉那些复杂的、随机的纹理细节(血肉/VE)。
-
用 LpixL_{pix}Lpix 老师来当教练:他让机器进行这样的练习:
- 输入一张高清原画 (
I_HR)。 - 先用编码器压缩成一张极小的总结(目标是让这张总结和低分辨率图像
I_LR一样)。 - 再用解码器把这张小总结还原成一张高清画。
- 最后,让 LpixL_{pix}Lpix 老师来评分,比较还原后的画和原始的高清画,任何像素差异都要扣分。
- 输入一张高清原画 (
训练结果:
由于有“信息瓶颈”的存在,机器知道自己不可能完美还原所有细节。为了在 LpixL_{pix}Lpix 老师那里拿到高分(即最小化像素误差),机器学会了最聪明的“偷懒”方法:它干脆不画任何细节,只画出最模糊、最安全的“平均骨架”。
就这样,校长巧妙地利用了 LpixL_{pix}Lpix 会导致模糊的“缺点”,把它变成了一个优点,成功训练出了一个完美的“细节擦除器”/“骨架提取器”。这个机器现在的功能就是:输入任何画,输出它的“骨架”。
5.1.2. 阶段二:实施全新的“骨架评分法” (4.2. 自编码监督 AESOP)
现在,完美的评分工具已经造好了,校长开始在美术班(超分辨率网络训练)里正式使用它。
新的评分标准 (L_AESOP):
当学生(AI)交上一幅他画的超分辨率作品 (I_SR) 时,评分流程如下:
-
旧方法 (
L_pix):直接比较I_SR和标准答案I_HR。L_pix= ||I_HR-I_SR|| (这会同时惩罚“骨架错误SE”和“创意差异VE”)
-
新方法 (
L_AESOP):- 第一步:把标准答案
I_HR扔进“骨架提取器”,得到 “标准骨架” (ψ_AE(I_HR))。 - 第二步:把学生作品
I_SR也扔进同一个“骨架提取器”,得到 “学生画的骨架” (ψ_AE(I_SR))。 - 第三步:只比较这两个“骨架”的差异。
L_AESOP= || “标准骨架” - “学生画的骨架” || (这几乎只惩罚“骨架错误SE”,因为“创意差异VE”已经被擦掉了)
- 第一步:把标准答案
最终的教学大纲 (L_total):
校长的最终教学方案是:
- 把原来那个讨人嫌的 LpixL_{pix}Lpix 老师彻底开除。
- 用全新的
L_AESOP评分法来指导学生的基本功。 - 同时,保留其他鼓励创意的老师(感知损失、对抗损失等)。
带来的巨大优势:
- 指导更强力:以前为了不让 LpixL_{pix}Lpix 老师扼杀创意,只能让他小声说话(权重系数设为0.01)。现在
L_AESOP完全没有副作用,校长可以理直气壮地把它的权重设为1,大声告诉学生:“基本功最重要,必须画准!” - 效果更好:因为基本功的指导又强又准,AI画出的画很少出现奇怪的瑕疵(伪影),同时因为创意部分被完全解放,画面的真实感和细节也大大增强。
两个小插曲(防止机器偷懒):
- 瓶颈坍塌:在训练“骨架提取器”时,为了防止编码器偷懒(比如直接复制低分辨率图像),需要让编码器和解码器一起接受训练和优化。
- 自编码器坍塌:在用
L_AESOP训练学生AI时,为了防止“骨架提取器”本身被学生“带坏”(比如无论输入什么都输出一张白纸,导致误差永远为0),需要把这个提取器的参数冻结,让它作为一个固定的、公正的裁判。
6. 概念通俗解释
- 图像超分辨率:把模糊图片变清晰的技术。
- 不适定性 (ill-posedness):一个问题没有唯一正确答案。就像从模糊的脸上猜表情,有很多种可能性。
- 面向保真度的超分辨率:追求“数学上最正确”的修复方法。结果是所有可能答案的平均值,虽然误差小,但看起来模糊。
- 面向感知质量的超分辨率:追求“看起来最真实”的修复方法。结果是很多个生动逼真的版本,但细节不一定和原始的一样。
- 最优保真度点 (棕色点):那个“平均”出来的、最安全但最模糊的答案。
- 一系列不同的现实解 (紫色点):那些“猜”出来的、看起来都很真实但细节各不相同的答案。
- 逐像素损失 (LpixL_{pix}Lpix):一种“死板”的评分标准。一个像素一个像素地对比生成图片和标准答案,任何不一样都算错误。它会压制细节的生成,导致模糊。
- 保真度偏差 (Fidelity Bias):图像中“必须正确”的部分,比如物体的基本形状、颜色、位置。这是我们希望AI学对的。
- 感知方差 (Perceptual Variance):图像中那些带有随机性、让画面看起来逼真的细节,比如纹理、毛发、水波。这些细节“看起来对”就行,不必和标准答案一模一样。LpixL_{pix}Lpix 会错误地惩罚这些细节。
- 自编码器 (Auto-Encoder, AE):本文中,它被训练成一个“细节擦除器”,能提取出一张图的“保真度偏差”,扔掉“感知方差”。
- AESOP (Auto-Encoded Supervision):本文提出的新方法。它不用 LpixL_{pix}Lpix,而是通过比较两张图经过“细节擦除器”处理后的结果,来实现一种更聪明的监督,只监督“保真度偏差”,放飞“感知方差”。
- 感知-失真 (PD) 权衡:一个两难的困境,要么图片清晰但呆板(低失真、低感知),要么生动但可能出错(高感知、高失真)。
- 保真度偏差因子:画的“基本骨架”,必须画对。
- 感知方差因子:画的“血肉灵魂”,可以自由发挥。
- LpixL_{pix}Lpix 的根本错误:分不清“骨架”和“血肉”,错误地惩罚了“血肉”,导致模糊。
- AESOP 的核心思想:用一个工具(AE)把“骨架”和“血肉”分开,然后只对“骨架”进行评分,从而解放了“血肉”的创造力。
