打造多模态交互新范式|彩讯股份中标2025年中国移动和留言平台AI智能体研发项目
近日,中移互联网有限公司正式公示【2025年和多号及和留言平台研发公开比选项目】中标结果,彩讯科技股份有限公司成功中标标段二“和留言平台AI能力集成和智能对话能力研发”项目。
此次中标不仅标志着彩讯股份与中国移动在 “5G 新通话 + AI” 融合创新领域的合作再度深化,更彰显彩讯以自研 AI 多模态大模型技术为核心的智能化解决方案,正成为运营商服务升级的重要引擎。
随着5G技术全面成熟,用户通信需求正从“基础语音连接”向“个性化、场景化、智能化交互”跃迁。中国移动以“5G新通话”战略为引领,通过视频化、富媒体与信息增强技术,持续革新用户体验。据中国移动2024年度业绩报告显示,其5G 新通话全场景月活跃用户已达 1.5 亿,凸显出未来广阔的市场增长潜力。
在此背景下,AI 技术成为激活场景价值的关键变量。彩讯股份依托自主研发的 AI 多模态大模型技术,推出语音智能体解决方案,实现三大维度创新突破:首先,集成数字人、图生音乐/视频、AI通话名片、AI来电秘书等创新AI产品,构建出多模态交互矩阵;其次,该方案支持用户实时提问、智能留言,通过AI生成精准应答,实现“言之有物、拟真自然”的对话交互;最后在效率层面,它显著简化了传统通信操作流程,将服务效率与人性化设计深度融合,切实提升用户的使用体验,真正赋能用户日常生活。
彩讯在智能语音技术方面拥有深厚的技术积累,并深度洞悉5G新通话真实场景需求。例如在智能语音交互过程中,用户随时打断或补充说明的情况极为常见。若系统响应不及时或无法恢复上下文,极易造成用户体验中断,降低智能秘书的实用性与可信度。为提升语音交互系统对自然通话节奏的适应能力,彩讯设计并实现了基于语音活动检测(VAD)与语义识别协同机制的“快速打断与恢复响应”技术方案,确保在通话中被用户打断后系统能快速判断、即时中止、精准应对,并顺畅恢复原流程。
除此之外,彩讯语音智能体还进行了多项技术升维,让“虚拟秘书”具备更加真实、更加灵活、更加稳定的用户服务能力:
- 富媒体融合推送:构建基于实时图层合成与多模态协同渲染技术的富媒体融合推送能力,实现虚拟形象与富媒体内容的无缝集成,为用户提供更加生动、直观且信息密度更高的交互方式。
- 动态数字人体系:构建支持实时视频生成、人物走动、镜头转场与个性化风格塑造的动态数字人体系,实现虚拟秘书在不同场景下的自然过渡、多镜头动态呈现与个性表达。
- 情感智能体:通过声纹信号分析与文本语义理解相结合的多模态识别架构,实现对用户情绪状态(如愉快、愤怒、悲伤等)的实时识别,实现基于用户语音的情绪识别与拟人化响应机制,构建具备情绪感知与表达能力的“情感智能体”,打造更具人性化的数字秘书交互体验。
- 推流协议多样化:通过推流协议的多样化支持,实现WebRTC、RTMP、RTP等协议间的高效兼容与互通,确保视频秘书系统在不同网络环境、不同设备终端下均可稳定运行、清晰呈现、快速响应。
未来,彩讯股份将持续深化与中国移动及各行业伙伴的协同合作,聚焦 “5G 新通话+AI”融合创新领域,共同打造更多融合多模态交互能力的创新 AI 产品。通过语音智能体的技术赋能,降低用户使用门槛、升级通话体验、提升运营商服务效率,真正实现“AI 让通话更精彩”。