当前位置: 首页 > news >正文

OpenAI 新语音模型:精细控制AI发声|GPT-4o-transcribe:支持多语言转录,准确率超越Whisper

目录

  • 🎙️ 前言
    • 🚀 三大核心模型
      • 语音转文本
      • 文本转语音
      • 开发套件
    • 💡 开发方案对比
      • 方案一:实时直连
      • 方案二:链式调用
    • 🔧 技术突破
    • 💰 价格体系
      • 📝 语音转文本:
      • 🔊 文本转语音:

🎙️ 前言

刚刚OpenAI推出了三种新的语音模型,可以精细控制AI语调、情感,更富有人性,还建立了新的网站 OpenAI.fm,让大家尝试和体验,你们说AI以后是不是更像人了。

在这里插入图片描述

🚀 三大核心模型

语音转文本

  • GPT-4o-transcribe:支持多语言转录,准确率超越Whisper
  • GPT-4o-mini-transcribe:轻量版模型,性价比提升50%

文本转语音

http://OpenAI.fm
  • GPT-4o-mini-tts:让开发者可以精细控制 AI 的发声方式,包括语调、情感等,打造更富有人性的声音体验。OpenAI 为该模型建立了新的网站 http://OpenAI.fm,供开发人员尝试和体验。(老余抖音号:58931742753)
小小鱼儿小小林
.博客原文:https://yujianlin.blog.csdn.net/article/details/146418341

开发套件

  • 全新Agent SDK:深度整合了 OpenAI 最新的「语音转文本」和「文本转语音」模型,支持双向流式传输,优化了语音交互的流畅性,并提供了丰富的示例代码和详尽的文档。

在这里插入图片描述

💡 开发方案对比

方案一:实时直连

  • 语音→语音端到端处理,让 AI 直接理解音频并输出语音
  • 延迟低至200ms,适合实时场景

方案二:链式调用

  • 语音→文本→AI处理→语音合成返回
  • 该方案具有模块化设计|可靠性提升30%|开发难度降低

//.小小鱼儿小小林
//.博客原文:https://yujianlin.blog.csdn.net/article/details/146418341

🔧 技术突破

  • 新音频模型基于 GPT-4oGPT-4o-mini 架构,在专门的以音频为中心的数据集上进行了广泛的预训练,以优化模型性能
  • 增强蒸馏技术,使知识从最大的音频模型转移到更小、更高效的模型,有助于小型模型提供出色的对话质量和响应能力
  • 对于语音转文本模型,集成了强化学习(RL-heavy)重度范式,优化转录准确度
  • 幻觉问题减少60%,FLEURS基准提升42%。(老余抖音号:58931742753)

💰 价格体系

📝 语音转文本:

  • GPT-4o-transcribe0.6¢/分钟
  • GPT-4o-mini-transcribe0.3¢/分钟

🔊 文本转语音:

  • GPT-4o-mini-tts1¢/分钟

相关文章:

  • Python第六章07:元组的定义和操作
  • 深入理解 Collections.emptyList():优雅处理空列表的利器!!!
  • 蓝桥与力扣刷题(蓝桥 生日蜡烛)
  • 使用 JDBC 插入数据并获取自动生成的主键(如 MySQL 的 AUTO_INCREMENT 或 Oracle 的序列) 的完整示例代码,包含详细注释
  • angular中的路由传参
  • pbootcms版AI自动发文插件,自动发布自动配图,支持多任务
  • 数字化转型 2.0:AI、低代码与智能分析如何重塑企业竞争力?
  • 调试 ResNet18 cpp实现中的段错误(SIGSEGV)问题
  • Junit在测试过程中的使用方式,具体使用在项目测试中的重点说明
  • xLua_001 Lua 文件加载
  • R语言基于ggscitable包复现一篇3.5分的文章的连续变量交互效应(交互作用)的可视化图
  • 记一次线上SQL死锁事故
  • 【一】Vue组件开发教程
  • Halcon算子 二维码识别、案例
  • AI 时代的通信新范式:MCP(模块化通信协议)的优势与应用
  • openvela新时代的国产开源RTOS系统
  • [网络安全] 滥用Azure内置Contributor角色横向移动至Azure VM
  • QA:备份产品的存储架构采用集中式和分布式的优劣?
  • 如何配置本地git
  • QT软件匠心开发,塑造卓越设计服务
  • 刘强东坐镇京东一线:管理层培训1800人次,最注重用户体验
  • 今年有望投产里程已近3000公里,高铁冲刺谁在“狂飙”?
  • “80后”德州市接待事务中心副主任刘巍“拟进一步使用”
  • 中华人民共和国和巴西联邦共和国关于强化携手构建更公正世界和更可持续星球的中巴命运共同体,共同维护多边主义的联合声明
  • 孙简任吉林省副省长
  • 牛市早报|中美日内瓦经贸会谈联合声明公布