当前位置: 首页 > news >正文

CosyVoice2整合包 特殊声音标记,声音克隆更逼真,新增批量生成

新增批量生成,可用于制作直播话术音频

特殊声音标记


        符号示例
1_语气加强<strong> </strong>每天都<strong>付出</strong>和<strong>精进</strong>,才能达到巅峰。
2_呼吸声[breath][breath] 吸气,[breath] 呼气! [breath] 吸,[breath] 呼!
3_噪音[noise]你听[noise][noise][noise][noise][noise][noise][noise]有噪声
4_笑声[laughter]哈哈哈[laughter],笑死我了!
5_咳嗽声[cough]我喉咙有点[cough]不舒服
6_咯咯声[clucking][clucking]哈哈,我真是个天才!
7_口音[accent]我看着[accent]网吧这个商机了!
8_快速呼吸声[quick_breath][quick_breath]我走不动了,累死我了!
9_笑声标记(HTML 风格)<laughter> </laughter><laughter>唉呀妈呀,笑死我了!</laughter>
10_嘶嘶声[hissing][hissing]嘶,疼死我了!
11_叹息声[sigh][sigh]哼 啥时候才能挣到钱啊!
12_咂嘴声[lipsmack][lipsmack]哎呦 我去, 你这个家伙!
13_嗯 哎 额[mn][mn] 嗯 应该是吧

长句拆分逻辑

每个句子的最大长度80,

每个句子的最小长度60

如果最后一个句子的长度小于20,会将其合并到前一个句子中

按标点符号拆分句子

中文:直接计算字符数。

非中文:通过 tokenize 函数计算分词后的 token 数量

新增批量生成,可用于制作直播话术音频

整合包下载

https://pan.quark.cn/s/4cbb11de0a43

相关文章:

  • ARMv8架构缓存一致性协议同步速度评估
  • 【MySQL】表空间丢失处理(Tablespace is missing for table 错误处理)
  • Git与GitHub实战指南:从入门到高效协作
  • GitCode 助力 python-office:开启 Python 自动化办公新生态
  • 为AI聊天工具添加一个知识系统 之127 详细设计之68 编程 核心技术:Cognitive Protocol Language 之2
  • 【零基础C语言】第三节 控制结构
  • 012 rocketmq事务消息
  • 安当全栈式PostgreSQL数据库安全解决方案:透明加密、动态凭据与勒索防护一体化实践
  • 梯度下降法(Gradient Descent) -- 现代机器学习的血液
  • MySQL零基础教程12—聚合查询(聚合函数)
  • Go 语言环境安装
  • [预订酒店]
  • AI编程界的集大成者——通义灵码AI程序员
  • Linux与UDP应用2:简易聊天室
  • 利用出书策略结合定制开发开源AI智能名片S2B2C商城小程序获取私域流量的探索
  • 基于redis的位图实现签到功能
  • 委托者模式(掌握设计模式的核心之一)
  • 《操作系统 - 清华大学》 9 -1:进程调度:背景
  • 高频面试题(含笔试高频算法整理)基本总结回顾3
  • 零知识证明与 ZK Rollups 详解
  • 建设制作外贸网站的公司/石景山区百科seo
  • 校园网站设计/那个推广平台好用
  • 长沙网络营销首选智投未来/河北seo网络优化师
  • 烟台汽车租赁网站建设/网络推广员岗位职责
  • 网站规划与建设类毕业论文怎么写/搜索引擎营销成功案例
  • 猫代理/seo专员是做什么的