当前位置: 首页 > news >正文

用于感知图像超分辨率的自编码监督(易于理解版本)

Auto-Encoded Supervision for Perceptual Image Super-Resolution

作者: M. Lee, S. Hyun, W. Jun and J. -P. Heo
发表期刊: 2025 IEEE/CVF Conference on Computer Vision and Pattern Recognition
论文地址: https://ieeexplore.ieee.org/abstract/document/11094304

鉴于对于原文的专业术语以及学术论述理解的困难的的问题,本文将通过一系列的例子以及通俗易懂的语言对原文进行一番解读。


1. 一句话总结这篇论文的创新点

这篇文章发明了一种“聪明的评分标准”,让AI在把模糊图片变清晰时,既能画出逼真的细节,又不会因为“画得和标准答案不一样”而被扣分,从而解决了以往方法“要么清晰但呆板,要么生动但容易出错”的矛盾。


1.1. 用一个故事来理解:两个画画的学生

想象一下,你是一位美术老师,你的任务是让学生把一张非常模糊的风景照片,重新画成一幅清晰、逼真的油画。

你有两个学生:

  1. 学生A(追求“保真度”):他是个描图高手。他会努力让自己的画在每一个像素点上都和“标准答案”(原始高清照片)一模一样。

    • 优点:他的画从大体轮廓、颜色上看,和标准答案的误差极小(学术上叫 PSNR/SSIM 分数高)。
    • 缺点:因为他太追求像素级的完全一致,不敢大胆画出细节(比如草地里的每一根草,水面的波纹),所以他的画看起来总是有点模糊、缺乏生气,像是隔了一层毛玻璃。
  2. 学生B(追求“感知质量”):他是个艺术家。他不在乎像素是否完全对上,他追求的是让画看起来“感觉就像真的一样”。

    • 优点:他的画细节丰富,草地生机勃勃,水面波光粼粼,非常有视觉冲击力(学术上叫 感知分数高)。
    • 缺点:因为他自由发挥了很多细节,这些细节和“标准答案”里的细节位置、形状肯定不一样。如果你拿他的画和标准答案一个像素一个像素地对比,会发现“错误”百出。有时他甚至会画出一些奇怪的东西(学术上叫 GAN伪影)。

1.2. 以前的教学方法(传统方法的困境)

以前的老师(比如 SRGAN 等方法)是这样教学生B的:
“你要画得生动逼真,但同时,我也要用尺子一个像素一个像素地量你的画,跟标准答案不像的地方都要扣分!”

这个教学方法很矛盾,学生B会很痛苦。

  • 他想画出逼真的草,但标准答案里的草是A形状,他画的是B形状,老师就会扣分。
  • 为了不被扣太多分,他只好妥协,把草画得模糊一点,这样既不像A也不像B,但至少“错得不离谱”。
  • 结果:学生B的创造力被压制了,画作虽然比学生A的生动,但总感觉不够完美,细节上畏手畏脚。

1.3. 这篇文章的“神仙教学法”(核心创新点:AESOP)

这篇文章的作者,也就是新的美术老师,想出了一个绝妙的办法。他说:

“我再也不用那种死板的尺子(学术上叫 逐像素损失 LpixL_{pix}Lpix)来衡量你的画了。我发明了一个新的评分工具。”

这个新工具就是 自编码器 (Auto-Encoder, AE),你可以把它理解成一个 “细节橡皮擦”

这个“细节橡皮擦”是怎么工作的?
  1. 训练橡皮擦:老师先拿大量的高清照片和它们的模糊版进行训练。他让这个“橡皮擦”学会一件事:不管拿到多清晰的画,都把它变成“只保留基本轮廓和颜色,擦掉所有精细纹理”的模糊版本。

    • 比如,输入一张高清的草地照片,它会输出一张只有一片绿色色块的图,草的细节全没了。
    • 这个“只保留基本轮廓和颜色”的东西,论文里叫 “保真度偏差 (Fidelity Bias)”
    • 那些被擦掉的“精细纹理”(比如草的形状、水的波纹),论文里叫 “感知方差 (Perceptual Variance)”
  2. 新的评分方式:现在,当学生B交上他那幅充满细节的画作时,老师是这样评分的:

    • 步骤一:把学生B的画,用“细节橡pre擦”擦一遍,得到一张“学生画的模糊版”。
    • 步骤二:把“标准答案”高清照片,也用同一个“细节橡皮擦”擦一遍,得到一张“标准答案的模糊版”。
    • 步骤三只比较这两张模糊版!
这种新方法好在哪里?

绝妙之处就在于,现在比较的两个东西,都已经没有细节了!

  • 评分时,老师只关心:“你画的这片草地,整体颜色对不对?位置对不对?山的轮廓对不对?” (只考核 保真度偏差)。
  • 老师完全不在乎:“你画的这根草的朝向,跟标准答案里的那根草是不是一样?” (不再惩罚 感知方差)。

结果:
学生B(艺术家AI)彻底解放了!他可以尽情地发挥创造力去画那些逼真的细节,因为他知道老师只会检查他的“大方向”有没有画错,而不会因为细节上的“自由创作”而扣他的分。

这就解决了之前的矛盾。AI可以同时做到:

  1. 基本内容正确:因为“模糊版”的对比保证了画的整体不出错。
  2. 细节生动逼真:因为AI在画细节时不再被死板的规则束缚。

最终,AI生成的图片既清晰、细节丰富,又没有奇怪的瑕疵,效果远超以往。


2. 用一个更具体的比喻:修复破损的古画

想象一下,你是一个文物修复专家,拿到了一张破损严重的古代人物画。画中人物的脸部区域变得非常模糊,你看不清他/她的具体表情。你的任务是把这张脸修复清晰。

现在,你面临一个核心难题:“这个人的表情到底是什么样的?”

  • 他可能在微笑。
  • 他可能很严肃。
  • 他也可能在沉思。

这些都是合理的猜测,因为原始的清晰信息已经永远丢失了。这个问题,在学术上就叫做 “不适定性 (ill-posedness)” —— 它没有唯一的、标准的正确答案。

面对这个难题,修复专家们分成了两个流派:

2.1. 流派一:保真度派(Fidelity-oriented)

这一派的专家非常严谨、保守。他们的首要原则是:“宁可不够好,绝不能出错。”

  • 他们的做法:他们不会去猜这个人在微笑还是严肃。他们会把所有可能的表情(微笑、严肃、沉思等)在脑中进行“平均”。最后,他们会画出一个没有任何表情的、最中性的脸
  • 对应文中的概念
    • 这种做法叫 “采用逐像素重建损失 LpixL_{pix}Lpix,意思就是他们追求修复后的每一个像素点和所有可能性的“平均值”误差最小。
    • 这个“没有任何表情的中性脸”,就是文中的 “最优保真度点” (图1a中的棕色点)。它是所有可能解的数学平均,是最安全、最不会犯大错的答案。
  • 结果:修复出的画,从整体上看,位置、肤色都对,但因为缺乏明确的表情和细节,所以显得呆板、模糊、没有灵魂

2.2. 流派二:感知质量派(Perceptual SR)

这一派的专家非常大胆、富有艺术感。他们的首要原则是:“不管对不对,首先要看起来像个真人!”

  • 他们的做法:他们会根据画作的整体风格和背景,大胆地猜测一个表情。
    • “我觉得这幅画的氛围很祥和,我给他画一个微笑的表情吧!”
    • “不,我觉得背景很凝重,我给他画一个严肃的表情!”
    • 于是,不同的专家修复出了很多个版本:有微笑版的、有严肃版的、有沉思版的……
  • 对应文中的概念
    • 这些不同的、看起来都很真实的修复版本,就是文中的 “一系列不同的现实解” (图1a中的多个紫色点)。
    • 每一个版本都非常生动、逼真、有感染力,远比那个“中性脸”好看。
  • 结果:虽然每个版本看起来都很好,但问题是,我们永远不知道哪个才是最初的“正确答案”。而且,因为是“猜”出来的,这些细节和原始的细节肯定有出入。

2.3. 两个流派的关系

文中最后一句“每一个解都围绕着前述的最优保真度点”,用我们的比喻来解释就是:

虽然感知派的专家们画出了微笑、严肃等不同表情(紫色点),但他们画的终究还是**“一张人脸”**,而不是猫脸或狗脸。这张脸的基本轮廓、肤色等,还是和那个“中性脸”(棕色点)差不多的。也就是说,这些生动的解,都是在“基本正确”的框架下进行的艺术发挥。


3. 关于SRGAN 框架的通俗解释

作者指出,以前的方法就像一个精神分裂的老师,一边鼓励学生画出创意细节,一边又因为这些细节和标准答案不一样而惩罚学生。本文的创新就是发明了一种新的教学方法,能精准地只检查“基本功”是否扎实,而完全不管“创意细节”怎么画,从而解决了这个根本矛盾。


3.1. 现状:精神分裂的老师 (SRGAN 框架)

我们回到那个美术班的故事。现在的教学主流方法 (SRGAN) 是这样的:班里有两个老师同时教一个学生(AI)。

  • 老师A(感知老师):他鼓励学生大胆创作,画出逼真的纹理和细节。“画得越生动越好!”
  • 老师B(LpixL_{pix}Lpix 老师):他拿着尺子,一个像素一个像素地检查作业,要求和标准答案一模一样。“任何不一样的地方都是错的!”

这就是矛盾所在 (Perceptual-Distortion Trade-off)
学生(AI)非常痛苦。当他听从A老师的话,画出了一根生动的、但和标准答案里形状不同的草时,B老师立刻过来扣分,说他画错了。为了不被B老师扣太多分,学生只好把草画得模糊一点,这样虽然不生动,但至少“错得不明显”。

结果:学生的潜力被严重限制了。他永远无法画出最顶尖的作品,因为两个老师的要求是根本冲突的。

3.2. 以前的“妥协方案”(规避方法)

为了缓解这个矛盾,以前的人想了两个“和稀泥”的办法:

  1. LpixL_{pix}Lpix 老师降级:让B老师(LpixL_{pix}Lpix)说话声音小一点,扣分少一点(给他乘以一个很小的系数)。但这治标不治本,B老师还在那里指指点点,学生还是不敢放开手脚。
  2. LpixL_{pix}Lpix 老师戴上墨镜:在B老师检查作业前,先用一个“低通滤波器(LPF)”把作业和标准答案都弄模糊一点。这样B老师就看不清细节了,自然也不会因为细节不同而扣分。但这个方法太粗暴了,可能会把一些重要的、本该画对的轮廓也弄模糊,导致B老师看不清,无法给出正确的指导。

作者认为,这两种方法都是次优的,因为它们没有真正理解问题的根源。


3.3. 作者的深刻洞察:问题到底出在哪?

作者说,要解决问题,我们必须先搞清楚学生画作的两个组成部分:

  • 保真度偏差因子 (Fidelity Bias Factor):这相当于画作的 “基本骨架”“草稿”。比如,画人脸,眼睛、鼻子、嘴巴的位置和基本形状必须正确。这个“骨架”画得准不准,决定了这幅画的“保真度”。这部分是AI必须学对的,错了就要扣分。
  • 感知方差因子 (Perceptual Variance Factor):这相当于画作的 “血肉和灵魂”。比如,皮肤的纹理、头发的光泽、眼睛里的神采。这些细节让画看起来逼真、生动。这部分没有标准答案,AI可以自由发挥,只要“看起来真实”就行,不应该因为和标准答案不一样而被扣分。

现在,问题的根源清晰了:
那个死板的 LpixL_{pix}Lpix 老师,他分不清什么是“基本骨架”,什么是“血肉灵魂”。他把所有和标准答案不一样的地方,不管是骨架画歪了,还是血肉画得太逼真,都当成错误来惩罚!

  • 惩罚“骨架”画歪(保真度偏差),这是应该的
  • 惩罚“血肉”太逼真(感知方差),这是完全错误的,因为它扼杀了创造力,导致了模糊。

而感知老师的目标,恰恰是鼓励AI画出丰富的“血肉”(感知方差)。所以,只要 LpixL_{pix}Lpix 老师还在用老方法评分,他和感知老师就永远是敌人。


3.4. 作者的解决方案:聪明的校长 (AESOP)

作者提出的新方法 AESOP,就像是来了一位聪明的校长。他说:

“好了,都别吵了。我们不能再用这种粗暴的评分方式了。我要发明一个**‘骨架提取器’**。”

这个“骨架提取器”就是 自编码器 (AE)

校长的计划是这样的:

  1. 训练“骨架提取器”:校长想,怎么才能让一个机器学会只看“骨架”忽略“血肉”呢?他想到了一个绝妙的主意:利用 LpixL_{pix}Lpix 老师的缺点! 他知道 LpixL_{pix}Lpix 老师最擅长的就是把任何生动的画都逼成模糊的“平均脸”。于是,他就让 LpixL_{pix}Lpix 老师去训练这个AE。经过训练,AE就成了一个完美的“细节擦除器”——你给它任何一张画,它都能精准地擦掉所有“血肉”,只留下“基本骨架”。

    • 这里是全文最巧妙的地方:作者把 LpixL_{pix}Lpix缺点(导致模糊),反过来用作训练工具,来达到分离骨架和血肉的目的
  2. 全新的评分流程

    • 学生(AI)交上他画的充满“血肉”的生动画作。
    • 校长先把这幅画用“骨架提取器”处理一下,得到 “学生画作的骨架”
    • 然后,校长把“标准答案”也用同一个“骨架提取器”处理一下,得到 “标准答案的骨架”
    • 最后,校长只比较这两个“骨架”

这个新流程完美地解决了所有问题:

  • AI的“基本功”(骨架)画得准不准,能得到精确的反馈。
  • AI在“血肉”上的所有自由创作,完全不会被评分,感知老师可以尽情地鼓励AI去创新。
  • 两个老师(保真度指导和感知指导)再也不冲突了,可以齐心协力教出一个最优秀的学生。

最终,AI就能生成既“骨架”精准,又“血肉”丰满的顶级画作了。


4. SE (system error)和 VE (variance error)的通俗理解

作者把AI画画时产生的“误差”分成了两种:一种是必须修正的“基本功错误”(SE),另一种是值得鼓励的“创意细节差异”(VE)。以前的方法分不清这两种误差,一锅端地全都惩罚,导致画作模糊。而理想的方法应该只修正“基本功错误”,同时保护好“创意细节”。


4.1. 详细解释:两种不同性质的“错误”

想象一下,学生(AI)画完了一幅画,现在我们要拿他的画和“标准答案”去比较,找出“错误”。作者说,这些“错误”其实可以分为两种,性质完全不同。

4.1.1. VE (Variance Error):不可避免的“创意误差”(好的误差)
  • 这是什么? 这就是我们之前说的“血肉和灵魂”带来的差异。比如,标准答案里模特的头发是向左飘的,学生画的头发是向右飘的。你用尺子一量,像素肯定对不上,这就是一个“误差”。但这个误差是坏事吗?不是!正是因为这些充满随机性、无法预测的细节,画作才显得生动、真实。
  • 为什么叫 VE (方差误差)? “方差”在统计学里代表数据的离散程度。在这里,它代表了所有可能的、逼真的细节(向左飘的头发、向右飘的头发、卷曲的头发……)围绕着“头发”这个概念的分布范围。VE 就是你画的某个具体细节和标准答案那个具体细节之间的距离。
  • 如果强行消除 VE 会怎样? 如果你跟学生说:“你必须消除这个误差!你的头发必须和标准答案里的一模一样!” 学生做不到,因为细节太复杂了,无法精确复制。他唯一的办法就是把头发画成一团模糊的色块,这样既不像左飘也不像右飘,“误差”反而变小了。这就是导致模糊的根源!
  • 结论:VE 是创造真实感的源泉,它是一种“好的误差”。我们必须保留 (preserve) 它,保护它,绝不能试图消除它。
4.2.2. SE (Systematic Error):必须修正的“系统误差”(坏的误差)
  • 这是什么? 这就是我们之前说的“基本骨架”画错了。比如,标准答案里的人脸是正的,学生画的整张脸都歪了5度。或者,标准答案里的人是黄皮肤,学生画成了白皮肤。这是一个系统性的、根本性的对齐错误。
  • 为什么叫 SE (系统误差)? 因为它代表了学生对“画什么”这个基本问题的理解偏差。他画的“人脸”这个概念的中心(质心),和标准答案的“人脸”这个概念的中心,没有对齐。
  • 如果修正 SE 会怎样? 如果你跟学生说:“你的脸画歪了,把它摆正!” 学生照做了。这个修正过程会影响他画的头发细节吗?不会!他只是把已经画好的、充满生动细节的脸整体旋转了5度而已。修正 SE 不会扼杀创意,只会让作品更准确。
  • 一个重要的补充:作者特意指出,这个“基本骨架”(保真度偏差)并不仅仅是模糊的轮廓。它也包含一些清晰的、可以被准确学习的边缘,比如建筑物的笔直轮廓。这些虽然是高频细节,但它们是确定的、没有随机性的,所以也属于“骨架”的一部分,画错了就必须改。
  • 结论:SE 是一个真正的错误,它拉低了画作的整体质量。我们必须最小化 (minimize) 它。

4.2. 理想的教学方法(理想的损失函数)

现在,我们明白了:

  • VE 是朋友,要保护。
  • SE 是敌人,要消灭。

一个理想的老师(也就是一个理想的AI训练算法),就应该具备一双“火眼金睛”,能够准确地区分这两种误差。当他看到学生作业和标准答案有差异时,他能判断出:

  • “哦,这个地方是头发细节不一样,这是 VE,是好事,表扬!”
  • “嗯?这个地方是鼻子位置画错了,这是 SE,是坏事,必须改正!”

通过只修正 SE,同时保留 VE,AI 就能在保持“基本功”扎实的前提下,最大程度地发挥创造力,画出最逼真、最生动的图像。这就是本文追求的终极目标,也是他们提出的 AESOP 方法所要实现的功能。

5. 对具体的训练过程的通俗解释

作者分两步实现他们的创新:第一步,专门训练一个“细节擦除器”(自编码器),让它学会只提取图像的“基本骨架”;第二步,在训练AI时,用这个擦除器处理AI的画和标准答案,然后只比较两个“骨架”的差异,从而实现精准、无副作用的指导。


5.1. 详细解释:校长的两步走计划

这位聪明的校长(作者)要推行他的新教学法,他把计划分成了两个清晰的阶段:

5.1.1. 阶段一:打造完美的“骨架提取器” (4.1. 自编码器预训练)

目标: 制造一个机器,你给它任何一张画,它都能自动擦掉所有生动的“血肉”(感知方差),只留下最基本的“骨架”(保真度偏差)。

方法: 他选择用一个叫做 自编码器 (Auto-Encoder, AE) 的东西来做这个机器。这个机器由两部分组成:

  1. 编码器 (Encoder):负责“压缩”,把一张大画变成一张小总结。
  2. 解码器 (Decoder):负责“解压”,根据小总结把画还原出来。

天才的训练过程:
校长想了一个绝妙的训练方法,他利用了我们之前提到的那个“死板的 LpixL_{pix}Lpix 老师”的缺点。

  1. 设置一个“信息瓶颈”:他故意把编码器压缩后的“小总结”设计得非常小,尺寸和原始的模糊照片一样大。这就好比强迫你用一条140字的微博来概括一部2小时的电影,你必然要舍弃大量的细节,只保留最核心的剧情。这个“瓶颈”强迫机器在压缩时必须扔掉那些复杂的、随机的纹理细节(血肉/VE)。

  2. LpixL_{pix}Lpix 老师来当教练:他让机器进行这样的练习:

    • 输入一张高清原画 (I_HR)。
    • 先用编码器压缩成一张极小的总结(目标是让这张总结和低分辨率图像 I_LR 一样)。
    • 再用解码器把这张小总结还原成一张高清画。
    • 最后,让 LpixL_{pix}Lpix 老师来评分,比较还原后的画和原始的高清画,任何像素差异都要扣分。

训练结果:
由于有“信息瓶颈”的存在,机器知道自己不可能完美还原所有细节。为了在 LpixL_{pix}Lpix 老师那里拿到高分(即最小化像素误差),机器学会了最聪明的“偷懒”方法:它干脆不画任何细节,只画出最模糊、最安全的“平均骨架”

就这样,校长巧妙地利用了 LpixL_{pix}Lpix 会导致模糊的“缺点”,把它变成了一个优点,成功训练出了一个完美的“细节擦除器”/“骨架提取器”。这个机器现在的功能就是:输入任何画,输出它的“骨架”。


5.1.2. 阶段二:实施全新的“骨架评分法” (4.2. 自编码监督 AESOP)

现在,完美的评分工具已经造好了,校长开始在美术班(超分辨率网络训练)里正式使用它。

新的评分标准 (L_AESOP):
当学生(AI)交上一幅他画的超分辨率作品 (I_SR) 时,评分流程如下:

  1. 旧方法 (L_pix):直接比较 I_SR 和标准答案 I_HR

    • L_pix = || I_HR - I_SR || (这会同时惩罚“骨架错误SE”和“创意差异VE”)
  2. 新方法 (L_AESOP)

    • 第一步:把标准答案 I_HR 扔进“骨架提取器”,得到 “标准骨架” (ψ_AE(I_HR))。
    • 第二步:把学生作品 I_SR 也扔进同一个“骨架提取器”,得到 “学生画的骨架” (ψ_AE(I_SR))。
    • 第三步:只比较这两个“骨架”的差异。
    • L_AESOP = || “标准骨架” - “学生画的骨架” || (这几乎只惩罚“骨架错误SE”,因为“创意差异VE”已经被擦掉了)

最终的教学大纲 (L_total):
校长的最终教学方案是:

  • 把原来那个讨人嫌的 LpixL_{pix}Lpix 老师彻底开除。
  • 用全新的 L_AESOP 评分法来指导学生的基本功。
  • 同时,保留其他鼓励创意的老师(感知损失、对抗损失等)。

带来的巨大优势:

  • 指导更强力:以前为了不让 LpixL_{pix}Lpix 老师扼杀创意,只能让他小声说话(权重系数设为0.01)。现在 L_AESOP 完全没有副作用,校长可以理直气壮地把它的权重设为1,大声告诉学生:“基本功最重要,必须画准!”
  • 效果更好:因为基本功的指导又强又准,AI画出的画很少出现奇怪的瑕疵(伪影),同时因为创意部分被完全解放,画面的真实感和细节也大大增强。

两个小插曲(防止机器偷懒):

  1. 瓶颈坍塌:在训练“骨架提取器”时,为了防止编码器偷懒(比如直接复制低分辨率图像),需要让编码器和解码器一起接受训练和优化。
  2. 自编码器坍塌:在用 L_AESOP 训练学生AI时,为了防止“骨架提取器”本身被学生“带坏”(比如无论输入什么都输出一张白纸,导致误差永远为0),需要把这个提取器的参数冻结,让它作为一个固定的、公正的裁判。

6. 概念通俗解释

  • 图像超分辨率:把模糊图片变清晰的技术。
  • 不适定性 (ill-posedness):一个问题没有唯一正确答案。就像从模糊的脸上猜表情,有很多种可能性。
  • 面向保真度的超分辨率:追求“数学上最正确”的修复方法。结果是所有可能答案的平均值,虽然误差小,但看起来模糊。
  • 面向感知质量的超分辨率:追求“看起来最真实”的修复方法。结果是很多个生动逼真的版本,但细节不一定和原始的一样。
  • 最优保真度点 (棕色点):那个“平均”出来的、最安全但最模糊的答案。
  • 一系列不同的现实解 (紫色点):那些“猜”出来的、看起来都很真实但细节各不相同的答案。
  • 逐像素损失 (LpixL_{pix}Lpix):一种“死板”的评分标准。一个像素一个像素地对比生成图片和标准答案,任何不一样都算错误。它会压制细节的生成,导致模糊。
  • 保真度偏差 (Fidelity Bias):图像中“必须正确”的部分,比如物体的基本形状、颜色、位置。这是我们希望AI学对的。
  • 感知方差 (Perceptual Variance):图像中那些带有随机性、让画面看起来逼真的细节,比如纹理、毛发、水波。这些细节“看起来对”就行,不必和标准答案一模一样。LpixL_{pix}Lpix 会错误地惩罚这些细节。
  • 自编码器 (Auto-Encoder, AE):本文中,它被训练成一个“细节擦除器”,能提取出一张图的“保真度偏差”,扔掉“感知方差”。
  • AESOP (Auto-Encoded Supervision):本文提出的新方法。它不用 LpixL_{pix}Lpix,而是通过比较两张图经过“细节擦除器”处理后的结果,来实现一种更聪明的监督,只监督“保真度偏差”,放飞“感知方差”。
  • 感知-失真 (PD) 权衡:一个两难的困境,要么图片清晰但呆板(低失真、低感知),要么生动但可能出错(高感知、高失真)。
  • 保真度偏差因子:画的“基本骨架”,必须画对。
  • 感知方差因子:画的“血肉灵魂”,可以自由发挥。
  • LpixL_{pix}Lpix 的根本错误:分不清“骨架”和“血肉”,错误地惩罚了“血肉”,导致模糊。
  • AESOP 的核心思想:用一个工具(AE)把“骨架”和“血肉”分开,然后只对“骨架”进行评分,从而解放了“血肉”的创造力。
http://www.dtcms.com/a/600783.html

相关文章:

  • 地图可视化实践录:空间分析库Turf.js的学习
  • 长沙制作网站公司哪家好广州seo推广营销
  • 11、prometheus-PromQL-5-聚合计算函数
  • (114页PPT)上海x友集团管理咨询及IT规划项目第一期报告管理诊断分析咨询报告(附下载方式)
  • C语言编译器 Visual Studio:实现高效编程与调试环境优化
  • 王树森深度强化学习 DRL(六)连续控制 DDPG + 随机策略
  • 【SatWetCH4 第一期】全球湿地甲烷排放通量估算过程模型 SatWetCH4 介绍
  • Opencv(十一) : 图像缩放
  • 开源 Objective-C IOS 应用开发(四)Xcode工程文件结构
  • 儿童网站 源码html5网站开发教学
  • 编译类语言的特点与应用
  • Python 数组使用方法总结
  • 网站风格变化免费logo在线制作头像
  • 第三章深度解析:智能体“大脑”的底层逻辑——大语言模型技术基石全拆解
  • 100个云计算基础知识
  • 对比 DeepSeek(MLA)、Qwen 和 Llama 系列大模型在 Attention 架构/算法层面的核心设计及理解它们的本质区别。
  • 【C++】List容器模拟实现(超详细)
  • 湖南火电建设有限公司网站龙采哈尔滨建站公司
  • 【PHP反序列化】css夺旗赛
  • ServletLess架构简介
  • 安卓C语言编译器的选择与使用技巧 | 优化C语言编程体验,提升开发效率
  • (三)自然语言处理笔记——Transformer
  • iOS性能分析工具,有UI卡顿、app启动、内存、webview等性能优化解析
  • 电商网站建设 数商云招商码头无忧查询系统
  • 开源 Objective-C IOS 应用开发(三)第一个iPhone的APP
  • (11)(2.2.2) BLHeli32,AM32, and BLHeli_S ESCs(二)
  • Google Chrome v142.0.7444.135 便携增强版
  • [Windows] PDF文件浏览OCR工具1.0
  • 2025人形机器人产业链全景分析报告:核心技术与市场趋势|附130+份报告PDF、数据、可视化模板汇总下载
  • 长春教做网站带维护的培训机构淮安网站建设