活动预告|海天瑞声与您相约 NCMMSC 2025
10月16日-19日,第二十届全国人机语音通讯学术会议(National Conference on Man-Machine Speech Communication,NCMMSC 2025)将在江苏镇江明都大饭店举行。本次会议由中国中文信息学会与中国计算机学会联合主办,中国中文信息学会语音信息专业委员会、中国计算机学会语音对话与听觉专业委员会、江苏大学及镇江市计算机学会共同承办。
海天瑞声作为本次大会银牌赞助商,与“中文连续视觉语音识别挑战赛(CNVSRC 2025)”的组织方之一,将携手业界专家学者,共探语音与多模态大模型交互技术的前沿趋势,助力推动我国语音技术的创新发展与产业应用。
本次会议的主题是“声动千年古城,智启语音未来”,大会除了邀请国内外著名学者进行大会报告和教程报告之外,还将举行青年学者论坛、学生论坛、企业论坛、产品和技术展示等活动。除主会外,将组织科普教育活动、基金申请经验交流活动以及多个特殊议题(Special Sessions)。诚挚欢迎国内外从事语音、语言科学与技术相关行业的学者、企事业单位以及公司积极参与,共同促进我国语音、语言科学与技术的不断创新和发展。
大会共设有10个特殊议题,其中,特殊议题2是中文连续视觉语音识别挑战赛(CNVSRC 2025)。
视觉语音识别,也称唇语识别,是一项通过口唇动作来推断发音内容的技术。该技术在公共安全、助老助残、视频验真等领域具有重要应用。当前,唇语识别的研究方兴未艾,虽然在独立词、短语等识别上取得了长足进展,但在大词表连续识别方面仍面临巨大挑战。为推动这一研究方向的发展,清华大学联合北京邮电大学、海天瑞声和语音之家举办第三届中文连续视觉语音识别挑战赛 (Chinese Continuous Visual Speech Recognition Challenge, CNVSRC 2025)。
更多赛事详情请访问:https://cnceleb.org/competition
赛事结果公布时间:10月18日 16:45 – 18:15
地点:研发楼 308
工业论坛主题分享:Dolphin 语音大模型技术框架及底层数据构建
王冠博现任海天瑞声算法中心研发专家,拥有扎实的教育背景与丰富的行业实践经验。他本科毕业于清华大学电子工程系,硕士阶段就读于约翰霍普金斯大学语言与语音处理研究中心(CLSP)。
本次分享将以 Dolphin 语音大模型为核心,系统介绍其技术框架与底层数据构建方法,并展示海天瑞声作为全球领先的 AI 数据解决方案企业在高质量数据建设方面的实践成果。大规模高质量数据是语音大模型性能提升的核心驱动力。Dolphin 语音大模型在构建过程中,采用系统化的数据工程方法,涵盖跨语言、多场景的语音语料采集,精细化的清洗与标注,以及多维度的数据处理与增强策略。这一完整的数据体系不仅保障了模型在语音识别与生成中的鲁棒性和泛化能力,也为上层架构的优化提供了坚实支撑。
大会日程
NCMMSC 2025 官网:https://www.ncmmsc.org.cn