当前位置: 首页 > news >正文

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

回到目录

【评测】免费体验dify工作流模式下腾讯语音转文字speech2text服务

0. dify本地化部署

可以参考《2.2. win10的wsl环境下调试dify的api后端服务(20250511发布)》

1. 配置tencent cloud

1.1. 腾讯云官网申请免费api key

腾讯云官网可以申请到免费的体验key
在这里插入图片描述

[图1]

1.2. dify配置Model Provider

dify管理页面的配置项目,可以设置tencent的语音转文字服务,其中 api key包括APPID、SecretID、SecretKey三部分
在这里插入图片描述

[图2]

2. 创建工作流workflow

2.1. 创建工作流

在工作室 创建一个工作流,名称 testAudio
在这里插入图片描述
[图3]

2.2. 配置组件

添加一个SPEECH TO TEXT组件,MODEL选择 tencent(tencent)
在这里插入图片描述
[图4]

2.3. 配置文件参数

开始图标,可以配置输入的mp3文件参数
在这里插入图片描述
[图5]

3. 运行流程

3.1. 右上角run图标

运行workflow流程,首先插入一个mp3文件,点击”start Run"按钮
在这里插入图片描述

[图6]

3.2. 查看结果

在TRACING页面的output可以查看到文本信息
在这里插入图片描述
[图7]

4. 测试情况

中文普通话的歌曲准确率高,外语基本无法识别,粤语和闽南语待找到MP3素材再作测试。

回到目录

http://www.dtcms.com/a/191212.html

相关文章:

  • 局部放电在线监测系统的数据传输协议选择研究:Modbus TCP 与 MQTT
  • libmemcached库api接口讲解五
  • 学习黑客NFC技术详解
  • day25 python异常处理
  • Leetcode209做题笔记
  • 常用的Java工具库
  • 【大模型面试每日一题】Day 18:大模型中KV Cache的作用是什么?如何通过Window Attention优化其内存占用?
  • AIX环境ORACLE RAC节点无法加入集群问题分析
  • Windows更新暂停七天关键注册表
  • centos中postfix的作用
  • 基于多目标进化算法的神经网络架构搜索及其高级可视化技术
  • Spring的Validation,这是一套基于注解的权限校验框架
  • 视网膜屏幕:重新定义数字显示的革命性技术
  • Windows系统Anaconda/Miniconda的安装、配置、基础使用、清理缓存空间和Pycharm/VSCode配置指南
  • 打破边界,智评未来:AI如何重塑学科交叉融合的评价体系?
  • QT-1.信号与槽
  • 入门OpenTelemetry——可观测性与链路追踪介绍
  • 【周输入】510周阅读推荐-2
  • [python] Python单例模式:__new__与线程安全解析
  • 通过迁移学习改进深度学习模型
  • 动态规划问题 -- 多状态模型(粉刷房子)
  • Milvus 全面解析
  • python 练习 五
  • 深入理解Java HotSpot中的即时编译
  • PADS入门笔记【一】
  • 【Python】对象生命周期全解析
  • Vue 3 打开 el-dialog 时使 el-input 获取焦点
  • 使用大语言模型从零构建知识图谱(上)
  • Linux 内核 IPv4 协议栈中的协议注册机制解析
  • QT---信号与槽