当前位置: 首页 > news >正文

基于文本与声学特征的渐冻症言语障碍严重程度分类研究

基于文本与声学特征的渐冻症言语障碍严重程度分类研究

原文链接:https://www.isca-archive.org/interspeech_2025/ys25_interspeech.html


引言:当说话变得困难——用AI读懂“渐冻人”的声音

你有没有试过听一个口齿不清的人讲话?可能一开始完全听不懂,但如果你熟悉他、知道他在说什么话题,也许能慢慢猜出他的意思。这种现象在肌萎缩侧索硬化症(ALS,俗称“渐冻症”)患者中尤为明显。

随着病情发展,ALS患者的肌肉逐渐失去控制,包括负责说话的口腔和喉部肌肉,导致一种叫做构音障碍(dysarthria)的语言障碍。他们的语音会变得含糊、缓慢甚至无声。目前,医生主要依靠人工评估来判断言语障碍的严重程度,比如让语言治疗师反复聆听并打分。这种方法不仅耗时费力,还容易受到主观因素影响。

那么问题来了:我们能不能用人工智能自动判断ALS患者的说话能力有多差?过去的研究大多聚焦于分析声音本身的声学特征,比如音调、响度、语速等。但最近一项发表在Interspeech 2025上的新研究提出了一个有趣的问题:

如果把病人说的话转成文字,再用AI分析这些文字的“语言特征”,能不能也预测出他们的言语障碍程度?

http://www.dtcms.com/a/389710.html

相关文章:

  • 基于语音合成的数据增强在独立说话人构音障碍严重程度分类中的应用
  • vscode 设置
  • vscode关闭coplit功能
  • ICML 2025|GAPrompt:用于3D视觉模型的几何感知点云提示
  • OCCI使用
  • 如何在命令列将.brd转成.siw
  • 贪心算法应用:欧拉路径(Fleury算法)详解
  • 第13章 时间处理
  • Python 抓包工具有哪些,抓包失败怎么办?(Python 抓包工具清单 + 常见失败原因与逐步排查)
  • 数据库模式演进的利器:Alembic 深度解析
  • 用 JMeter 打通“异步入队 + 网关限流”的高并发压测实践
  • Linux服务器从零开始-服务器安装配置
  • Python第三节基本数据类型详解与使用指南
  • 【indextts2】之四:ubuntu24.04 经常跑满12G 显存、音色与录制关系很大
  • 【学习笔记】稳定币的技术原理与信任逻辑
  • 为 Elasticsearch Ruby Client 引入 ES|QL 查询生成器
  • 平安养老险陕西分公司积极开展“保障金融权益,助力美好生活”金融教育宣传周活动
  • 多线程的特点与同步、互斥锁
  • 将npm run dev 冷启动从 90s 优化到 8.5s的实践
  • 【附源码】基于SSM的小型银行贷款系统设计与实现
  • X-Forwarded-For
  • 中科大DSAI Lab团队多篇论文入选ICCV 2025,推动三维视觉与泛化感知技术突破
  • GitHub 上 Star 数量前 10 的开源项目管理工具
  • axios函数封装
  • NewSQL——核心原理与内部机制
  • 《从 0 到 1 打通网络服务任督二脉:域名、服务器与多站点配置全攻略》​
  • vue3学习日记(十七):动态路由使用解析
  • SpringBoot 启动流程
  • .NET驾驭Word之力:结构化文档元素操作
  • 解密F5负载均衡:优化网络性能的关键