音视频:语音转换文字功能实现
前言:
整理一部分有用资料。
软件:免费,用剪映这些需要掏钱,这里是说:SmartSub
安装包下载:
1、github上的,源,有加速工具的可以用哦
https://github.com/buxuku/SmartSub/releases/latesthttps://github.com/buxuku/SmartSub/releases/latest2、gitee上的,平时可以用
https://gitee.com/abdusa1am/SmartSubhttps://gitee.com/abdusa1am/SmartSub
安装步骤
Windows
- 下载
.exe
安装文件 - 双击安装文件启动安装程序
- 按照安装向导的提示完成安装
- 安装完成后,从开始菜单或桌面快捷方式启动应用
macOS
- 下载
.dmg
安装文件 - 双击打开 DMG 文件
- 将 Smart Sub 应用拖动到 Applications 文件夹
- 从启动台或 Applications 文件夹启动应用
Linux
- 下载 AppImage 文件
- 添加执行权限:
chmod +x SmartSub-*.AppImage
- 直接运行 AppImage 文件:
./SmartSub-*.AppImage
初次启动
安装完成后,首次启动妙幕软件时,您需要:
- 下载语音识别模型(详见模型配置章节)
- 配置翻译服务(如需使用翻译功能,详见翻译服务配置章节)
完成这些基本设置后,您就可以开始使用妙幕的强大功能了。
下一步
成功安装妙幕后,您可以继续阅读快速入门指南,了解如何使用基本功能生成和翻译字幕。
具体使用:(以下使用:极客密码)
如何使用模型:
作者的夸克网盘链接:
关于模型的选择和注意事项上文已经提到过,更详细的请查看官方 Github 仓库说明文档
如果遇到下载比较慢的情况,建议切换至国内模型镜像站点
模型下载完之后,上传你的视频或者音频,在左侧菜单栏选择模型,开始任务
我用的 large-v3-turbo-q8_0
模型,亲测效果巨好,5 分多钟音频 22 秒
就识别完成了,真是又快又准
识别完成之后可以点击校对按钮,弹出校对模块
这里会在播放的时候,实时定位到哪一行字幕。
太细节了吧!!!
校对无误后点击保存
字幕文件默认跟你导入的音视频文件在一个根目录下
接下来打开剪映,选择文本 - 导入本地字幕
选择校对完成后.srt格式的字幕文件