当前位置: 首页 > news >正文

【产品体验】豆包大模型实时语音本地化部署及功能体验

背景

2025年1月21日,豆包实时语音大模型在豆包App(7.2.0 新春版)全量开放,引发了广泛关注。这一语音交互体验,与OpenAI公布的GPT-4o模型实时语音功能体验类似,未来拥有广阔的应用前景。

因此,本章我们深入了解豆包实时语音大模型的使用过程,并分析其背后的实现原理。

目标

基于豆包开源的Github代码,在本地搭建一个实时语音大模型,并体验其效果。

搭建过程

豆包大模型的背后支持团队 火山引擎 提供了开源代码Demo,我们基于该项目进行相关部署实践。

1. 拉取代码

git clone https://github.com/volcengine/rtc-aigc-demo

2. 注册账号

访问火山引擎官网(https://www.volcengine.com/) ,注册账号并登录。

说明:
首次注册火山引擎账号并使用,需要进行实名认证,按照官网提示完成即可。

3. 准备工作

3.1 获取API Key
  1. 访问火山引擎控制台https://console.volcengine.com/home

  2. 点击右上角个人头像->API访问密钥

  3. 新建密钥

说明:

  • 火山引擎API密钥分主账号和子账号,一般为了安全情况下,使用子账号。
  • 本例中优先跑通流程,所以安全性要求不高,使用主账号减少操作步骤。
  1. 点击继续后,使用手机获取验证码,即可完成API Key创建。
3.2 开通 RTC 服务(获取AppID和AppKey)
  1. 访问火山引擎控制台的 实时音视频 https://console.volcengine.com/rtc/guide

  2. 申请开通 RTC 服务

  3. 创建应用:点击左侧应用管理->创建应用

说明:

  • 默认情况下,开通RTC服务后,会自动创建一个默认应用,本例中使用默认应用。
  • 如果需要创建新应用,则需要填写应用名称、应用描述、应用类型、应用场景、应用权限等信息。
  1. 获取应用AppID和AppKey:复制默认应用的AppID和AppKey,后续配置中需要使用。
3.3 获取临时Token
  1. 接着上一步的步骤,在页面中点击临时Token

  2. 在弹出的页面中,输入自定义的RoomIdUserId,点击生成临时Token

说明:

  • RoomId 可以自定义,本例中命名为my_demo_room
  • UserId 可以自定义,本例中命名为my_demo_user
  1. 获取临时Token后,复制Token,后续配置中需要使用。
3.4 开通 ASRTTS 服务服务
  1. 访问火山引擎控制台的 语音技术 https://console.volcengine.com/speech/app
  2. 创建应用:点击左侧应用管理->创建应用
  3. 根据提示,填写应用名称、应用简介,勾选语音合成、流式语音识别服务。

  1. 创建应用后,获取应用的APP ID

文章转载自:

http://Fxhl9DJu.fwcnx.cn
http://KGyKFgCk.fwcnx.cn
http://FBELhYR2.fwcnx.cn
http://4RkHGDUi.fwcnx.cn
http://GEQRaLav.fwcnx.cn
http://LhJ7adHB.fwcnx.cn
http://QOkdOOFt.fwcnx.cn
http://4fGc5iEn.fwcnx.cn
http://DhCjwjD7.fwcnx.cn
http://tBqF3ZVs.fwcnx.cn
http://neHr8MmV.fwcnx.cn
http://c5LtJF5n.fwcnx.cn
http://cE8p0Eqh.fwcnx.cn
http://dhhs9O1h.fwcnx.cn
http://zuDXeyIX.fwcnx.cn
http://ErVfglRN.fwcnx.cn
http://DO4ow2Np.fwcnx.cn
http://NIjFbw2N.fwcnx.cn
http://3rvORlkM.fwcnx.cn
http://VuJacoLQ.fwcnx.cn
http://WQcOS0Fm.fwcnx.cn
http://hAs6mXuO.fwcnx.cn
http://sfA2cE1f.fwcnx.cn
http://mnZsbB98.fwcnx.cn
http://3RCJgMFc.fwcnx.cn
http://3E8wPv3q.fwcnx.cn
http://U9LwYbSZ.fwcnx.cn
http://Dm42gZoH.fwcnx.cn
http://oGvefYrb.fwcnx.cn
http://giJtJqn4.fwcnx.cn
http://www.dtcms.com/a/127983.html

相关文章:

  • 2025年第十六届蓝桥杯省赛C++ 研究生组真题
  • 第四节:React Hooks进阶篇-useEffect依赖项为空数组[]与不写的区别
  • 如何修改服务器TTL值
  • [特殊字符] 第十三讲 | 地统计模拟与空间不确定性评估
  • Devil May Cry 4 SE (鬼泣4)运行报错 【由于找不到INPUT1_3.dll,无法继续执行代码。重新安装程序肯会解决此问题。】
  • 『Kubernetes(K8S) 入门进阶实战』实战入门 - Pod 详解
  • java之多线程
  • [Dify] 使用 Docker 本地部署 Dify 并集成 Ollama 模型的详细指南
  • Android监测顶层包名+类名
  • 动态规划(6)——01背包问题
  • 2025蓝桥杯JavaB组
  • jupyter notebook 无法启动- markupsafe导致
  • Day3—循环起来吧
  • 深入理解 PyTorch 的 nn.Embedding:词向量映射及变量 weight 的更新机制
  • 算法专题:双指针
  • 470用 Rand7() 实现 Rand10()
  • [MSPM0开发]之五 MSPM0G3507 SysTick定时器的配置与使用(systick中断实现延时函数)
  • 微信小程序运行机制详解
  • 单片机Day05---动态数码管显示01234567
  • WindowsPE文件格式入门08.导出表
  • 蓝桥杯嵌入式历年省赛客观题
  • GPU虚拟化技术在深度学习集群中的应用实践
  • Spring AI 结构化输出详解
  • 【foc思考】为什么svpwm要不停变换占空比
  • Python 实现最小插件框架
  • JDK(Java Development Kit)从发布至今所有主要版本 的详细差异、新增特性及关键更新的总结,按时间顺序排列
  • 【架构师从入门到进阶】第五章:DNSCDN网关优化思路——第七节:网关-XSS攻击与预防
  • uniapp日常总结--uniapp页面跳转方式
  • 单片机Day05---静态数码管
  • Cocos Creator Shader入门实战(八):Shader实现圆形、椭圆、菱形等头像