当前位置: 首页 > news >正文

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

回到目录

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

0. dify本地化部署

可以参考《2.2. win10的wsl环境下调试dify的api后端服务(20250511发布)》

1. 配置tencent cloud

1.1. 腾讯云官网申请免费api key

腾讯云官网可以申请到免费的体验key
在这里插入图片描述

[图1]

1.2. dify配置Model Provider

dify管理页面的配置项目,可以设置tencent的语音转文字服务,其中 api key包括APPID、SecretID、SecretKey三部分
在这里插入图片描述

[图2]

2. 创建工作流workflow

2.1. 创建工作流

在工作室 创建一个工作流,名称 testAudio
在这里插入图片描述
[图3]

2.2. 配置组件

添加一个SPEECH TO TEXT组件,MODEL选择 tencent(tencent)
在这里插入图片描述
[图4]

2.3. 配置文件参数

开始图标,可以配置输入的mp3文件参数
在这里插入图片描述
[图5]

3. 运行流程

3.1. 右上角run图标

运行workflow流程,首先插入一个mp3文件,点击”start Run"按钮
在这里插入图片描述

[图6]

3.2. 查看结果

在TRACING页面的output可以查看到文本信息
在这里插入图片描述
[图7]

4. 测试情况

中文普通话的歌曲准确率高,外语基本无法识别,粤语和闽南语待找到MP3素材再作测试。

回到目录

相关文章:

  • 局部放电在线监测系统的数据传输协议选择研究:Modbus TCP 与 MQTT
  • libmemcached库api接口讲解五
  • 学习黑客NFC技术详解
  • day25 python异常处理
  • Leetcode209做题笔记
  • 常用的Java工具库
  • 【大模型面试每日一题】Day 18:大模型中KV Cache的作用是什么?如何通过Window Attention优化其内存占用?
  • AIX环境ORACLE RAC节点无法加入集群问题分析
  • Windows更新暂停七天关键注册表
  • centos中postfix的作用
  • 基于多目标进化算法的神经网络架构搜索及其高级可视化技术
  • Spring的Validation,这是一套基于注解的权限校验框架
  • 视网膜屏幕:重新定义数字显示的革命性技术
  • Windows系统Anaconda/Miniconda的安装、配置、基础使用、清理缓存空间和Pycharm/VSCode配置指南
  • 打破边界,智评未来:AI如何重塑学科交叉融合的评价体系?
  • QT-1.信号与槽
  • 入门OpenTelemetry——可观测性与链路追踪介绍
  • 【周输入】510周阅读推荐-2
  • [python] Python单例模式:__new__与线程安全解析
  • 通过迁移学习改进深度学习模型
  • A股午后拉升,沪指收复3400点:大金融发力,两市成交超1.3万亿元
  • 极限拉扯上任巴西,安切洛蒂开启夏窗主帅大挪移?
  • 人民日报钟声:通过平等对话协商解决分歧的重要一步
  • 欧阳娜娜携家人回江西探亲,受聘为江西吉安文化旅游大使
  • 深一度|在亚马尔的天才面前,姆巴佩戴上“帽子”又如何
  • 中拉论坛第四届部长级会议将举行,外交部介绍情况