当前位置: 首页 > news >正文

使用豆包大模型语音合成API生成语音文件

豆包的音色比较好听,试了一下使用C#输入文本,调用远程API,生成音频文件,还是比较简单。

1、首先,开通豆包的火山引擎

输入账号登录-火山引擎,按提示进行注册即可。

2、获取API服务接口认证信息

主要是APP ID和Access Token,按下图方法查看。这里需要稍微注意一下,不要到“API Key 管理”中去找。

3、下载Demo验证

大模型语音合成API--豆包语音-火山引擎

4、获取音色参数

     demo使用"豆包语音合成模型1.0" 音色列表,路径如下:

音色列表--豆包语音-火山引擎

5、工程编译

   解压Demo后有两个文件,使用Vs2026打开两个工程文件,设置“Volcengine.Speech.Binary”为运行工程,引用项目“Speech.Protocols”。

输入的调试参数:--appid <appid> --access_token <access_token> --voice_type <voice_type> --text "**你好**,这是一个测试文本。我们正在测试文本转语音功能。"

<appid>、<access_token>、<voice_type>替换为上面步骤获取的值。

运行成功后,会在运行目录下生成.wav文件。

工程下载地址(去掉了命令行参数,改为固定参数):GitHub - PascalMing/Volcengine.Speech.Binary: 豆包大模型语音合成API生成语音文件Demo

6、其他

     部分缩写不如人意,比如“2B市场”读为2B,而不是ToB。

http://www.dtcms.com/a/593287.html

相关文章:

  • 创意赣州网站建设logo模板
  • 指针,数组,变量
  • 免费SSL申请并使用Yarp实现支持内网穿透
  • Geoserver修行记_Geoserver如何连接瀚高数据库_国密SM3
  • PC微信WDA算法
  • Parquet 范式:大语言模型训练数据格式优化的基础解析
  • 网站备案的核验单做HH的网站
  • 基于MATLAB的JPEG图像压缩实现
  • 个人网站的建设中铁建设集团有限公司官方网站
  • 耐达讯自动化Profibus转光纤连接伺服驱动器,让电力行业通信效率飙升10倍!
  • 专为AWD攻防演练比赛设计的综合性工具箱,集成漏洞利用、流量监控、自动化攻击等功能
  • 冶金车间“迷雾”重重?耐达讯自动化Profibus转光纤为HMI点亮“透视眼”!
  • 第一章 网络安全概念及规范
  • 中国发行稳定币对金融行业网络安全布局的影响及新的业务增长点分析
  • 华为网站建设和阿里云哪个好投资理财网站模板
  • 近期思考:如何自我提升呢?三年以后有大变化?
  • Ansible主机清单:自动化管理的核心基石
  • 专做高中知识的网站腾讯朋友圈广告代理
  • 「日拱一码」146 SVR调参注意事项与技巧
  • 谷歌云大规模分布式存储系统:定义、特性与技术挑战解析
  • 山东省住房和城乡建设厅服务网站百度网络公司
  • 网站平台需要做无形资产吗 怎么做网站里做个子网页怎么做
  • 在 AEDT 中对用于模拟的作业进行排队
  • FastAPI × Loguru:从“能跑”到“可运维”的日志实战
  • 怎样设立网站网站开发 策划是干嘛的
  • 【大数据技术04】数据可视化
  • qml 网站开发宝塔网站301重定向怎么做
  • 《数据结构:从0到1》-09-队列
  • 安徽建站模板广州市网站制作
  • Vue 项目实战《尚医通》,完成医院科室业务,页面自动滚动到指定位置,笔记22