当前位置：首页 > news >正文

客观与主观评估扩散模型在构音障碍语音增强中的应用

news 2025/9/24 7:45:23

原文链接：Objective and Subjective Evaluation of Diffusion-Based Speech Enhancement for Dysarthric Speech
作者：Dimme de Groot 等 | Interspeech 2025

我们每天都在用语音助手、语音输入法、智能客服……但你有没有想过，如果一个人因为脑瘫、帕金森或ALS（渐冻症）导致说话含糊不清——也就是医学上说的构音障碍（dysarthria），这些技术还能正常工作吗？

很遗憾，大多数时候不能。现有的自动语音识别系统（ASR），比如Whisper、Siri、讯飞等，都是基于大量“标准发音”训练出来的，对异常语音的适应能力非常弱。

为了解决这个问题，研究人员开始尝试使用**语音增强技术（Speech Enhancement, SE）来“清理”和“优化”构音障碍者的语音，让它更接近普通人说话的样子。最近几年，一种叫扩散模型（Diffusion Models）**的新方法在图像生成领域大放异彩，现在也被引入到语音处理中。

这篇发表于Interspeech

Xcode 26 error

半导体网站建设装饰公司网页设计

InnoDB Undo Log机制全解析

K8s学习笔记(三) kubectl 常用命令

第二章：Java到Go的思维转变

es的java调用

Jenkins运维之路(初次调试共享库)

离线下载npm包

伊春seo公司seo网站页面诊断

贪心算法之分数背包问题

贪心算法之船舶装载问题

面试_常见大厂面试题