当前位置: 首页 > news >正文

网站开发用什么书什么网站可以做行测

网站开发用什么书,什么网站可以做行测,企业建站服务退役军人,线上编程课哪家好我基于FunASR制作的实时语音识别转文字软件当前更新到V5版本。软件可以实时识别麦克风声音和电脑内播放声音转为文字。 FunASR软件介绍 FunASR 是一款基础语音识别工具包和开源 SOTA 预训练模型,支持语音识别、语音活动检测、文本后处理等。 我使用FunASR制作了一…

我基于FunASR制作的实时语音识别转文字软件当前更新到V5版本。软件可以实时识别麦克风声音和电脑内播放声音转为文字。

FunASR软件介绍

FunASR 是一款基础语音识别工具包和开源 SOTA 预训练模型,支持语音识别、语音活动检测、文本后处理等。

我使用FunASR制作了一款实时语音识别转文字软件,当前版本为V4版本,由于前几天分享过另一个音视频识别转文字软件faster-whisper《音频视频转文字软件faster-whisper 1.1.1整合包下载,精准快速语音转录工具》,那个软件已经很好用了,所以当前软件版本我删除了文件识别功能,只保留了实时语音识别功能。

FunASR在2月5日刚更新过,我基于最新版制作了当前版本实时语音识别软件整合包

如果需要同时有识别文件和实时识别功能的话,请用V3版本,链接《实时语音识别转文字软件V3版,批量音频视频录音转文字提取工具》

FunASR实时语音识别整合包V5软件使用说明

软件下载解压后直接双击【启动软件.exe】即可启动。软件操作界面比较简单

首先选择识别内容保存位置,识别结果输出文件格式为txt

块长度和上下文长度决定了最终的识别效果,块长度值越大,相同语速下每段识别出的内容的字数越多,上下文长度值建议是块长度值的1/2,这两个值越大,识别出的文字内容越准确,但是延迟也越高,这个可以自行测试效果,选择合适的值

音量阈值就是用于屏蔽低音噪音的,如果说话人环境比较嘈杂,可以设置该值,屏蔽掉低音噪音部分,值越大,屏蔽的声音分贝越高,也就是屏蔽的声音越多

翻译工具国内用户用百度,国外用户用谷歌,免费申请百度翻译API可以查看下面教程《最新百度翻译api免费申请AppId和AppSecret流程,每月免费100万字符》

如果你想翻译成的目标语言在列表里没有,可自行设置语言代码,百度翻译和Google翻译语言代码参考下面文章《百度翻译谷歌翻译API语言代码名称对照表》,将所需要的语言代码填入目标语言输入框里即可

由于软件是收集一定长度的识别文本之后再将文本提交到翻译工具进行翻译,然后收到返回翻译结果再进行显示,所以翻译文本和识别的文本有时间差,不会同步显示

待翻译文本长度的意思就是一次性提交给翻译工具的文本长度,软件并不是每次识别出内容之后都提交给翻译工具的,而是收集到一定长度的文本内容之后再发送给翻译工具进行翻译。发送给翻译工具的文本越短,翻译结果越不准确,发送的文本越长,翻译工具越能综合上下文意思翻译的更准确,但是收集的文本越长等待时间也就越长,可自行取舍。一个英文字母算一个字符,一个汉字也算一个字符,如果是类似英语语言这个值建议大一点

软件支持识别电脑内播放的声音或是麦克风等外部输入的声音。如果需要识别电脑内播放的声音,需要先进行电脑设置,鼠标右键点击电脑屏幕右下角音量喇叭图标,选择 【声音】,点击录制选项卡,鼠标右键点击【立体声混音】,选择【设置为默认设备】,如果立体声混音没启动的话,需要先启用,然后运行软件开始处理,就可以实时识别电脑播放声音了。

如果想同时接收麦克风声音和电脑内播放声音,可在软件音频源中选择电脑播放声音,电脑声音设置里-录制-麦克风,点击鼠标右键,选择麦克风属性,勾选【侦听此设备】

字幕文本显示长度就是前端实时显示语音识别出的文本的字幕字符长度

如果无法使用的话,可以勾选显示调试窗口查看报错信息

软件使用视频教程:电脑实时语音识别转文本工具FunASR整合包视频使用教程-诺瓦小站

注意事项

本软件只支持识别中英文,不支持识别其它语言

软件运行路径中不要出现中文及空格,否则会报错

软件只支持win10或win11,不支持其他版本Windows系统,也不支持手机和MAC

有部分Win11用户发现软件无法检测到音频,也就是电脑立体声混音没有音频输入,可以安装voicemeeter虚拟声卡解决。在【1 HARDWARE INPUT】设置硬件声音输入设备,在【VIRTUAL INPUT】选中【B】,在【HARDWARE OUT】选择声音输出设备,然后打开电脑系统-声音-录制,将默认设备选择为VoiceMeeter VAIO3 Output,VoiceMeeter点击下载>>

电脑实时语音识别转文字软件V5版本下载链接

麦克风电脑内播放声音实时识别转文字软件FunASR整合包V5下载-诺瓦小站

http://www.dtcms.com/a/512277.html

相关文章:

  • 柳州做网站公司网站建设实施方案
  • excel拆分和合并代码的思路整合和工具打包
  • 信刻——安全生产音视频录音录像自动刻录备份归档管理系统
  • 外贸购物网站开发厦门seo推广外包
  • 公司企业网站设计尺寸discuz 同步wordpress
  • 人工智能(AIT)工具资源的全面概要列表
  • 字符串相乘:从暴力算法到规律优化
  • 突破性技术:DeepSeek-OCR通过光学压缩解决大语言模型长上下文挑战
  • wap的网站模板百度运营优化师
  • 网站项目框架1688货源网一件代销
  • 小白python入门 - 4. Python 中的变量:从基础概念到编程思维的构建
  • 日语学习-日语知识点小记-构建基础-JLPT-N3阶段-二阶段(5):文法運用
  • 表格识别技术:将纸质信息转化为可分析的结构化数据,推动智能办公革命
  • 读懂 YOLOv4:兼顾速度与精度的目标检测王者
  • 磁悬浮轴承控制方法全景解析:从经典策略到智能前沿
  • 响应式网站无法做百度联盟wordpress无中断音乐插件
  • AURIX-TC3xx-GTM详解三-CMU(Clock Management Unit)
  • 文件速览软件对比丨Quicklook与PowerToys速览功能对比
  • 网络编程-通信协议
  • 湖州做网站公司哪家好网络规划设计师下午考点汇总
  • pip install gptqmodel报错:error: subprocess-exited-with-error
  • 消息中间件4.VPC
  • Linux时间轮定时器
  • 怎样做ppt建网站网站开辟两学一做专栏
  • 昆凌做的广告买化妆品网站微信应用小程序
  • ps免费模板网站360建筑网官网怎么登录
  • 高速摄像机在精密制造领域的应用
  • Docker入门:快速部署你的第一个Web应用
  • 《从 0 到 1 毫秒:用 Rust + Axum 0.8 打造支持 HTTP/3 的零拷贝文件服务器》
  • 【linux】多线程(六)生产者消费者模型,queue模拟阻塞队列的生产消费模型