【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务
回到目录
【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务
0. dify本地化部署
可以参考《2.2. win10的wsl环境下调试dify的api后端服务(20250511发布)》
1. 配置tencent cloud
1.1. 腾讯云官网申请免费api key
腾讯云官网可以申请到免费的体验key
[图1]
1.2. dify配置Model Provider
dify管理页面的配置项目,可以设置tencent的语音转文字服务,其中 api key包括APPID、SecretID、SecretKey三部分
[图2]
2. 创建工作流workflow
2.1. 创建工作流
在工作室 创建一个工作流,名称 testAudio
[图3]
2.2. 配置组件
添加一个SPEECH TO TEXT组件,MODEL选择 tencent(tencent)
[图4]
2.3. 配置文件参数
开始图标,可以配置输入的mp3文件参数
[图5]
3. 运行流程
3.1. 右上角run图标
运行workflow流程,首先插入一个mp3文件,点击”start Run"按钮
[图6]
3.2. 查看结果
在TRACING页面的output可以查看到文本信息
[图7]
4. 测试情况
中文普通话的歌曲准确率高,外语基本无法识别,粤语和闽南语待找到MP3素材再作测试。
回到目录