当前位置：首页 > news >正文

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

news 2025/10/28 1:43:11

回到目录

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

0. dify本地化部署

可以参考《2.2. win10的wsl环境下调试dify的api后端服务(20250511发布)》

1. 配置tencent cloud

1.1. 腾讯云官网申请免费api key

腾讯云官网可以申请到免费的体验key
在这里插入图片描述

[图1]

1.2. dify配置Model Provider

dify管理页面的配置项目，可以设置tencent的语音转文字服务，其中 api key包括APPID、SecretID、SecretKey三部分
在这里插入图片描述

[图2]

2. 创建工作流workflow

2.1. 创建工作流

在工作室创建一个工作流，名称 testAudio
在这里插入图片描述
[图3]

2.2. 配置组件

添加一个SPEECH TO TEXT组件，MODEL选择 tencent(tencent)
在这里插入图片描述
[图4]

2.3. 配置文件参数

开始图标，可以配置输入的mp3文件参数
在这里插入图片描述
[图5]

3. 运行流程

3.1. 右上角run图标

运行workflow流程，首先插入一个mp3文件，点击”start Run"按钮
在这里插入图片描述

[图6]

3.2. 查看结果

在TRACING页面的output可以查看到文本信息
在这里插入图片描述
[图7]

4. 测试情况

中文普通话的歌曲准确率高，外语基本无法识别，粤语和闽南语待找到MP3素材再作测试。

回到目录

查看全文

http://www.dtcms.com/a/191212.html

局部放电在线监测系统的数据传输协议选择研究：Modbus TCP 与 MQTT

libmemcached库api接口讲解五

学习黑客NFC技术详解

day25 python异常处理

Leetcode209做题笔记

常用的Java工具库

【大模型面试每日一题】Day 18：大模型中KV Cache的作用是什么？如何通过Window Attention优化其内存占用？

AIX环境ORACLE RAC节点无法加入集群问题分析

Windows更新暂停七天关键注册表

centos中postfix的作用

基于多目标进化算法的神经网络架构搜索及其高级可视化技术

Spring的Validation，这是一套基于注解的权限校验框架

视网膜屏幕：重新定义数字显示的革命性技术

Windows系统Anaconda/Miniconda的安装、配置、基础使用、清理缓存空间和Pycharm/VSCode配置指南

打破边界，智评未来：AI如何重塑学科交叉融合的评价体系？

QT-1.信号与槽

入门OpenTelemetry——可观测性与链路追踪介绍

【周输入】510周阅读推荐-2

[python] Python单例模式：__new__与线程安全解析

通过迁移学习改进深度学习模型

动态规划问题 -- 多状态模型（粉刷房子）

Milvus 全面解析

python 练习五

深入理解Java HotSpot中的即时编译

PADS入门笔记【一】

【Python】对象生命周期全解析

Vue 3 打开 el-dialog 时使 el-input 获取焦点

使用大语言模型从零构建知识图谱（上）

Linux 内核 IPv4 协议栈中的协议注册机制解析

QT---信号与槽

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

0. dify本地化部署

1. 配置tencent cloud

1.1. 腾讯云官网申请免费api key

1.2. dify配置Model Provider

2. 创建工作流workflow

2.1. 创建工作流

2.2. 配置组件

2.3. 配置文件参数

3. 运行流程

3.1. 右上角run图标

3.2. 查看结果

4. 测试情况

相关文章：