当前位置: 首页 > news >正文

AI in Game,大模型能力与实时音视频技术融合,交出AI应用新答卷

随着AI的技术进步和工具普及,尤其是在这两年的跃进之后,AI在游戏行业内的应用已经逐步由理念设想推向落地实践。从蔡浩宇披露的AI新游《Whispers From The Star》到GDC上各大厂家呈现的游戏+AI新亮点,我们看到了更多AI与游戏的结合方式,不仅是制作端AIGC能力的融入,连游戏内互动体验也正因AI的崛起而卷入这场革命。

AI交互进化,打破传统边界

从“工具”到“伙伴”,重塑互动体验

游戏行业很早便已经开始使用“AI”一词,然而,这类所谓的AI从本质上来说还是“提线木偶”——它们的行为被预设脚本牢牢束缚,在庞大的行为库中排列组合,构建出与玩家的互动。而大语言模型和AI实时语音对话技术在游戏中的应用,彻底打破了传统互动模式的边界。角色能够从话语中思考理解玩家的意图并实时给出个性化反馈,不再只能根据明确的指令导向固定的行为,这为游戏中的虚拟角色赋予了高度拟人化的交互能力。

无论是游戏内的NPC、你的队友亦或是你的游戏小助手,都将成为有温度、有智慧、有个性的 “数字生命”,为玩家以及社区带来全新的情感化、智能化交互体验,提供独有的情绪价值。

|AI NPC:从“工具人”到“游戏原住民”,打破传统叙事边界

传统NPC的“机械感”始终是打破沉浸体验的顽疾——玩家早已厌倦了预设脚本和复读机般重复台词的角色,这同时也大大降低了游戏的重玩价值。而AI技术的介入,尤其是AI实时对话能力的加持正在颠覆这种单向交互模式,让NPC真正成为游戏世界的“原住民”,能够与玩家一同构建出丰富且个性化的剧情体验。

通过AI技术加持,《Whispers from the Star》支持玩家实时使用自然语言发送指令,而游戏的主角Stella也会随着玩家的指令作出或愤怒或欣喜的个性化反馈。这款以AI语音交互为核心玩法的太空生存游戏展现出了与传统游戏截然不同的创新性,尤其是AI实时对话对剧情走向的深度影响,为游戏互动性带来了新的维度。跳脱传统游戏的叙事边界,玩家不必拘泥于游戏提供的选项,而是可以真正与Stella自由交流,通过对话帮助她完成逃离。每一次对话,都可能将游戏引入未知的方向,并激发全新的故事。

在社交推理游戏《太空杀》中,AI NPC的融入也为游戏带来了全新玩法和更多变数。独特的“内鬼挑战”玩法由两位真人玩家共同对抗8名AI NPC。游戏中,AI NPC能够独立思考,结合实时且自然的语音对话,他们会像真人一样,充分表达自己的观点和推理,并根据局势变化临场伪装、结盟、指控,与玩家一同动态演绎故事。复杂的互动、真实的交流与推理,AI NPC为《太空杀》玩家带来了打破剧本瓶颈的持续新鲜体验。

图片

|AI 助手:从“说明书”到“外置大脑”,懂游戏也懂你

随着游戏技术和基础设施的不断迭代,游戏本身的复杂性也在不断增长,这为教学系统,尤其是新手引导带来了持续的挑战。以《王者荣耀》为例,游戏内已有近百位技能各异的英雄搭配百件功能各异的装备,玩家需要较长时间去熟悉。而游戏内的各种英雄介绍就像“说明书”,内容生硬,很难在实战中应用。如今,结合AI实时对话能力,AI成了玩家的“外置大脑”,彻底改变了新手玩家进游学习期的体验模式。

《王者荣耀》的AI Coaching可在训练对决中结合玩家及对局数据精准给出当前所使用英雄的技能与装备教学,并会进行实时对线指导,在逆风局、带线局等各种不同情况下给出不同的游戏策略,甚至预测局势走向,为玩家提供大局观指导,真正做到边玩边学。同时,AI还能够复刻各个英雄的音色,带来更沉浸的教学体验,强大的多语言能力可支持中、英、西、葡、阿、土等多语种,助力游戏全球化运营。

图片

除了《王者荣耀》,另一款国民级手游《和平精英》的数字代言人吉莉经过升级迭代,也将以语音对话的形式加入到玩家的实时对局中。玩家不仅能在游戏大厅与吉莉交流,在游戏中也能通过自由麦语音与吉莉实时对话,像是提问如何调节灵敏度、突击步枪与冲锋枪哪个秒伤更高等等,在游戏中遇到的任何问题,都能通过语音向吉莉发问并得到合理解答。吉莉还能够通过玩家语言中的语气词强度(如 "艹!这都能输")以及上下文语义特征(如反复提及 "队友太坑"),实时判断玩家的情绪状态,并针对不同情绪类型,调用差异化的响应策略,比如对沮丧玩家给予鼓励,为兴奋玩家打call……情绪价值拉满,与用户主动建立具有深度共鸣的互动关系。

图片

|AI 队友:从“人机操作”到“开黑大腿”,自然沟通并肩作战

多人竞技游戏中,队友的质量往往决定了游戏的成败和体验的优劣。但当玩家不想社交时,游戏匹配的人机队友却很难填补真人玩家的空缺。“人机操作”已经成了很多游戏中离谱操作的代名词。而AI驱动的智能队友,正在重新定义这一社交生态。

以往FPS玩家只能通过快捷键和指令轮盘,向AI队友下达"攻击"或"跟随"等简单命令。但这些命令缺乏目标和细节,很难实现玩家与人机队友之间的战术配合。而在《暗区突围》中,玩家可以用自然语言与自己的AI队友交流,AI队友可以观察实时的战斗环境,真正理解玩家的战术意图,进而灵活应对战场变化。“我清一楼你清二楼”、“正面牵制等我绕后”这些复杂的长序列战术指令AI 队友F.A.C.U.L.都可以听懂执行并推测玩家意图进行实时语音反馈。

图片

在《和平精英》的海岛地图中,玩家也可以与AI队友匹配共同战斗,而且有三个不同性格的队友可选。玩家可以尽情与AI交流或指挥,如果问他们能否给自己一些子弹,AI队友还会迅速跑过来响应玩家需求。对于不熟悉玩法的新人而言,AI队友的存在还具有优秀的引导能力,帮助玩家度过新手阶段。例如缩圈的时候他们会提醒玩家跑进安全区,附近如果有敌人的脚步声出现也会提醒玩家防守警戒。这种 AI 驱动的队友,不仅降低了玩家的社交门槛,还为那些不擅长团队协作的玩家提供了一个包容和支持的环境。它让玩家在游戏中感受到的不再是孤独,而是一种被陪伴、被支持的温暖。

图片

轻松实现全开麦实时语音交互

腾讯云 GME AI 实时对话解决方案

作为行业领先的RTC厂商,腾讯云实时音视频(TRTC)此前已依托腾讯海量游戏开发运营经验,基于真实游戏场景专门优化推出了一站式游戏语音解决方案——游戏多媒体引擎(GME)。随着AI能力的快速突破,以及腾讯内部在游戏AI方向上的超前探索,腾讯云TRTC进一步将GME与AI实时通话能力整合,为游戏行业用户搭建出性能最优、延时最低的对接通道,在内嵌腾讯云ASR的同时,整合业内领先的LLM/TTS方案进行深度优化,将AI对话总延迟低至1000ms,媲美人类对话反应速度,并融入声纹识别、语义断句、背景音、承接语等创新能力,使对话效果更自然、拟真。

图片

在实现音视频数据高效采集、处理、传输的基础上,GME AI实时对话解决方案叠加了智能降噪、智能打断、上下文管理等游戏场景所需的核心能力,只需少量开发就可快速实现全开麦的AI实时语音交互,方便游戏行业开发者快速将AI NPC、AI 游戏助手、AI 队友等AI新能力应用到自己的游戏中,为用户带来游戏交互新体验。

图片

RTC协议,全链路深度优化

全球AI对话总延迟低至1000ms以内

GME AI实时对话解决方案针对社交、游戏等场景的音视频编解码器进行深度优化,码率、延时、系统资源消耗等关键技术指标均为业界领先,通过流式分片传输、连接池等机制,全球端到端音视频传输延时可控制在300ms内,AI对话全链路总延迟低于1000ms。六大洲服务可用,全球3200+加速节点,且具备多服务容灾能力,保障业务全球高质量稳定运行。

基于真实游戏场景优化

全开麦自由交流,AI对话媲美真人

利用回声消除、噪声抑制等专利算法,强力抑制键盘声、鼠标声等游戏场景常见噪音。引入全新降噪引擎,输入端音视频实时AI降噪,提升ASR识别准确度。针对口语化表达、游戏专有名词识别困难等挑战,方案基于真实游戏场景音频数据进行标注与模型微调,并可针对不同游戏客户定制专属热词词库,实现包括英语、西班牙语、日语、韩语、中文以及23种方言和130种国际语言的ASR精准识别

方案内置双讲打断、上下文管理等AI实时对话核心能力。玩家可以用全开麦的方式与AI自由沟通。不需要玩家定义一句话是否说完,AI也能很清晰地识别玩家想表达的意思,在AI发言过程中,玩家也能随时打断AI,开启新话题或下达新指令,真正实现媲美真人的沟通交互体验。

3D空间音频等独有技术

带来更多有趣的游戏AI语音玩法

GME AI实时对话解决方案提供独有的3D语音技术,通过范围音频、人声模糊、空气衰减模拟等效果,完整还原声音的方位细节,玩家可根据队友语音“听声辩位”,带来沉浸式语音体验。方案还与Wwise音频引擎深度融合,独创性地解决了语音开麦时游戏背景音效丢失的问题,并可结合游戏音效实现更丰富玩法。同时,GME AI实时对话解决方案还支持音色克隆功能,提供复刻音色,支持自定义音量、语速等参数,为游戏角色赋予个性化的语音。

多端兼容,低成本接入

一次接入满足多样化语音需求

GME AI实时对话解决方案整合并优化了AI对话全链路所需的各项能力,一站式解决方案帮助开发者快速将AI对话功能无缝集成到各类游戏应用中,无需深入处理复杂的技术细节,显著缩短产品开发周期

GME AI实时对话解决方案适配主流主机平台;深度适配 UE、Unity、Cocos 等主流游戏引擎,支持包括iOS、Android、Windows、macOS、Web、Flutter在内的多个平台,兼容超过20000种设备模型。方案高度开放,支持企业自定义大模型(LLM)和语音合成(TTS),配置LLM和TTS服务的账户凭证即可将第三方LLM和TTS无缝集成到服务后台。

您可通过我们提供的无代码快速跑通AI实时对话功能(https://console.cloud.tencent.com/trtc/conversational-ai),全程零门槛无代码,快速配置、便捷测试AI实时对话能力。

相关文章:

  • ssh 测试 是否可以连通docker 容器
  • 【Sqoop基础】Sqoop生态集成:与HDFS、Hive、HBase等组件的协同关系深度解析
  • 新电脑配置五 jdk8,maven,idea,vscode
  • IT 运维老手和新手的区别:从手动运维到一体化 IT 运维系统的跨越
  • 第二十二章:数据治理之数据价值:数据价值知多少
  • 代码风格指南
  • 【DSP笔记】掌握数字世界的律动:时域离散信号与系统基础
  • 解决开机必须联网的问题并关闭windows搜索页面的推荐
  • Java中的日期类详解
  • 打破云平台壁垒支持多层级JSON生成的MQTT网关技术解析
  • 如何保护网络免受零日漏洞攻击?
  • 【HarmonyOS Next之旅】DevEco Studio使用指南(二十七) -> 开发云函数
  • 关于git的使用
  • 汽车副水箱液位传感器介绍
  • 时序数据库IoTDB安装学习经验分享
  • https下git拉取gitlab仓库源码
  • 《P1763 埃及分数》
  • Python爬虫进阶:Scrapy框架与异步编程深度实践
  • 解决el-input输入框输入数组传参报错
  • chrome打不开axure设计的软件产品原型问题解决办法
  • 51比购网官方网站/做一个简单的网站需要多少钱
  • 建设电商网站/北京网站优化站优化
  • 网页设计师的能力/长沙seo优化推荐
  • 邯郸网站开发/宁波网站推广优化公司电话
  • 泾川网站建设/营销方案怎么写模板
  • 网站建设 石景山/百度的合作网站有哪些