当前位置：首页 > news >正文

我用Cursor写了一个视频转文字工具，已开源，欢迎体验

news 2025/8/24 4:05:57

一个基于 Whisper 的视频音频转文字工具，支持GPU加速，界面简洁，使用方便。

💻软件截图

软件截图

转文字效果

✨ 特性

🎥 支持多种视频格式（mp4, avi, mov, wmv, flv, mkv等）
🔊 支持多种音频格式（mp3, wav, m4a等）
🚀 支持GPU加速，大幅提升转换速度
💡 智能选择最适合的模型
📂 支持批量处理
🔍 支持文件夹递归扫描
🛠 自动检查和安装依赖
🎯 自动下载所需组件
📝 输出带有时间戳的文本文件
🌏 优化支持中文识别

🖥 系统要求

Windows 10 或更高版本
如果要使用GPU加速：
- NVIDIA显卡
- 最新版显卡驱动
- 建议显存≥4GB

📦 下载和安装

从 Releases 下载最新版本
解压到任意文件夹
双击运行 视频转文字工具.exe
首次运行时会自动安装必要的依赖

🚀 使用方法

启动程序
选择要转换的视频文件或文件夹
选择输出文件夹
选择合适的模型：
- ≥10GB 显存：large（最佳质量）
- ≥8GB 显存：medium（平衡速度和质量）
- ≥5GB 显存：small（平衡内存和质量）
- <5GB 显存：base（基本使用）
- CPU模式：base（适合CPU模式）
点击"开始转换"

🔧 技术细节

语音识别：OpenAI Whisper
GUI框架：PyQt5
视频处理：FFmpeg
GPU加速：PyTorch + CUDA
自动化部署：PyInstaller

📋 功能特点

智能模型选择

自动检测系统配置
推荐最适合的模型
防止显存溢出

批量处理

支持多文件选择
支持文件夹导入
显示处理进度和预计时间

GPU加速

自动检测GPU
支持CUDA加速
支持CPU回退模式

依赖管理

首次运行自动检查依赖
自动下载安装必要组件
显示详细的安装进度

🔍 常见问题

Q: 程序无法启动？ A: 确保已安装最新的Visual C++运行库

Q: 转换速度很慢？ A: 检查是否正确启用了GPU加速，可以点击"GPU诊断"按钮查看详情

Q: 显存不足？ A: 尝试使用更小的模型，或切换到CPU模式

Q: 如何选择合适的模型？ A: 程序会根据您的硬件配置自动推荐最适合的模型

🛠 开发相关

环境准备

 pip install pyinstaller pillow openai-whisper torch torchvision torchaudio PyQt5

打包方法

 # 生成图标python create_icon.py# 打包程序pyinstaller --clean --onefile --noconsole --icon=app.ico --name="视频转文字工具" videoToText.py

开源地址

Gitee：

https://gitee.com/lzy2018cn/video-totext

GitHub：

https://github.com/IAMLZY2018/VideoToText

成果物文件超过2G（实际2.4G左右）平台不允许上传，我放网盘了，欢迎体验：
点击跳转

查看全文

http://www.dtcms.com/a/238324.html

深入理解 React Hooks

基于SpringBoot利用死信队列解决RabbitMQ业务队列故障重试无效场景问题

bugku 网络安全事件应急响应

Git配置代理

SCFSlRAE1通过调节SlWRKY1的稳定性来调控番茄对灰霉菌的抗性。

自然语言处理——语言模型

jieba实现和用RNN实现中文分词的区别

拼多多官方内部版 7.58.0 | 极限精简，只有2.5M

ASM，LVM，扫描并扩容步骤-linux

JAVA反序列化应用： URLDNS案例

基于 React Native for HarmonyOS5 的跨平台组件库开发指南，以及组件示例

【Go语言基础【20】】Go的包与工程

【Go语言基础【19】】接口：灵活实现多态的核心机制

《Go小技巧易错点100例》第三十五篇

【笔记】Poetry虚拟环境创建示例

STL详解——list的模拟实现

Linux 上的 Tomcat 端口占用排查

Puppeteer测试框架 - Node.js

前端八股笔记

十一(2) 类的实例化

村田开发的超低功耗的Type 2GQ GNSS模块

交流电机深度解析：从基础到实战的全面指南

香橙派3B学习笔记7：snap安装管理软件包_打包程序与依赖

曼昆《经济学原理》第九版第七章消费者、生产者与市场效率

LLMs 系列科普文（7）

css | class中 ‘.‘ 和 ‘:‘ 的使用 | 如，何时用 .is-selected{ ... } 何时用 :hover{...}？

【Java实战】反射操作百倍性能优化

wsl开启即闪退

空间转录组数据下游分析(二)

Prompt Enginering（提示工程）先进技术