当前位置：首页 > news >正文

音视频：语音转换文字功能实现

news 2025/7/15 8:15:43

前言：

整理一部分有用资料。

软件：免费，用剪映这些需要掏钱，这里是说：SmartSub

安装包下载：

1、github上的，源，有加速工具的可以用哦

https://github.com/buxuku/SmartSub/releases/latesthttps://github.com/buxuku/SmartSub/releases/latest2、gitee上的，平时可以用

https://gitee.com/abdusa1am/SmartSubhttps://gitee.com/abdusa1am/SmartSub

安装步骤

Windows

下载 .exe 安装文件
双击安装文件启动安装程序
按照安装向导的提示完成安装
安装完成后，从开始菜单或桌面快捷方式启动应用

macOS

下载 .dmg 安装文件
双击打开 DMG 文件
将 Smart Sub 应用拖动到 Applications 文件夹
从启动台或 Applications 文件夹启动应用

Linux

下载 AppImage 文件
添加执行权限：

chmod +x SmartSub-*.AppImage

直接运行 AppImage 文件：

./SmartSub-*.AppImage

初次启动

安装完成后，首次启动妙幕软件时，您需要：

下载语音识别模型（详见模型配置章节）
配置翻译服务（如需使用翻译功能，详见翻译服务配置章节）

完成这些基本设置后，您就可以开始使用妙幕的强大功能了。

下一步

成功安装妙幕后，您可以继续阅读快速入门指南，了解如何使用基本功能生成和翻译字幕。

具体使用：（以下使用：极客密码）

如何使用模型：

作者的夸克网盘链接：

关于模型的选择和注意事项上文已经提到过，更详细的请查看官方 Github 仓库说明文档

如果遇到下载比较慢的情况，建议切换至国内模型镜像站点

模型下载完之后，上传你的视频或者音频，在左侧菜单栏选择模型，开始任务

我用的 large-v3-turbo-q8_0 模型，亲测效果巨好，5 分多钟音频 22 秒 就识别完成了，真是又快又准

识别完成之后可以点击校对按钮，弹出校对模块

这里会在播放的时候，实时定位到哪一行字幕。

太细节了吧！！！

校对无误后点击保存

字幕文件默认跟你导入的音视频文件在一个根目录下

接下来打开剪映，选择文本 - 导入本地字幕

选择校对完成后.srt格式的字幕文件

查看全文

http://www.dtcms.com/a/279145.html

阿尔卡特ACT 250 ATP 150 AND ATP 400 分子泵控制器TURBOMOLECULAR PUMP CONTROLLER ALCATEL

微型导轨在3D打印设备中如何稳定运行？

Java：继承和多态（必会知识点整理）

常用的RAG类型介绍

# MySQL索引失效场景和解决方案详解

如何解决pip安装报错ModuleNotFoundError: No module named ‘sqlite3’问题

SpringBoot微服组件

毫米波雷达在转弯时将静止目标识别为运动目标的原因

JavaSE-8-多态

python 双下划线开头函数

ATE - Force模式和Meas模式

AI Agent vs SaaS：企业服务产品正迈向“智能中枢”阶段

Linux中使用云仓库上传镜像和私库制作Registry

算法-练习题

【牛客刷题】小红的数字删除

可达性统计（拓扑排序模板，bitset）

【算法】贪心算法：最大数C++

Linux 音频的基石： ALSA

【云服务器安全相关】如何使用 `ping` 命令排查云服务器网络连接问题

javascript自执行函数

Retinex视网膜算法（SSR、MSR、MSRCR）

DNS重绑定

纯净系统清理工具，告别卡顿烦恼

iOS高级开发工程师面试——RunTime

构建完整工具链：GCC/G++ + Makefile + Git 自动化开发流程

数字影像产业新机遇入驻国际数字影像产业园享151项服务

【人工智能】通过 Dify 构建智能助手

Day34 Java方法05 可变参数

JavaScript中Object.defineProperty的作用和用法以及和proxy的区别