当前位置: 首页 > news >正文

推荐几个免费提取音视频文案的工具(SRT格式、通义千问、飞书妙记、VideoCaptioner、AsrTools)

文章目录

  • 1. 前言
  • 2. SRT格式
    • 2.1 SRT 格式的特点
    • 2.2 SRT 文件的组成
    • 2.3 SRT 文件示例
  • 3. 通义千问
    • 3.1 官网
    • 3.2 上传音视频文件
    • 3.3 导出文案
  • 4. 飞书妙记
    • 4.1 官网
    • 4.2 上传音视频文件
    • 4.3 导出文案
    • 4.4 缺点
  • 5. VideoCaptioner
    • 5.1 GitHub地址
    • 5.2 下载
      • 5.2.1 通过GitHub下载
      • 5.2.2 通过作者提供的地址下载
    • 5.3 安装
    • 5.4 上传音视频文件
    • 5.5 导出文案
    • 5.6 可能遇到的问题
      • 5.6.1 问题呈现
      • 5.6.2 问题产生的原因
      • 5.6.3 解决方法
    • 5.7 进阶使用教程
  • 6. AsrTools
    • 6.1 GitHub地址
    • 6.2 下载
    • 6.3 安装
    • 6.4 上传音视频文件
    • 6.5 导出文案

1. 前言

网上有一些大聪明提供了奇奇怪怪的提取音视频文案的方法,例如打开输入法的语音输入后,播放音视频,就可以自动将音视频转换成文字了,乍一看方法没什么问题,但如果音视频的非常长,使用这种方法分分钟崩溃

其实很多剪辑软件都有自动生成字幕的功能,例如剪映就有这个功能,生成字幕后还可以将字幕导出为SRT格式的文件。当然,这么好用的功能大概率都是需要付费的︿( ̄︶ ̄)︿

下面为大家介绍几个免费提取音视频文案的工具,这些工具大部分都是需要上传视频文件的,如果平台没有开放视频的下载权限,可以参考我的另一篇博文:推荐几个可以免费下载视频的软件(Neat Download Manager、蜗牛下载助手、bilidown)

2. SRT格式

SRT:SubRip Text,字幕文件

SRT 格式是一种简单的字幕文件格式,用于存储视频的字幕信息

2.1 SRT 格式的特点

  • 简单易懂: SRT 文件是纯文本文件,结构清晰,易于阅读和编辑
  • 广泛支持: 大多数视频播放器和字幕编辑软件都支持 SRT 格式
  • 跨平台: SRT 文件可以在不同的操作系统和设备上使用

2.2 SRT 文件的组成

SRT 文件由多个字幕块组成,每个字幕块包含以下信息:

  1. 序号: 字幕块的序号,从 1 开始递增
  2. 时间码: 字幕的出现和消失时间,格式为 小时:分钟:秒,毫秒 --> 小时:分钟:秒,毫秒
  3. 字幕文本: 字幕的文本内容,可以包含多行
  4. 空行: 用于分隔不同的字幕块

2.3 SRT 文件示例

通俗地说,SRT文件的作用就是告诉视频剪辑软件哪句字幕该在哪个时间段出现在视频上

1
00:00:20,000 --> 00:00:24,400
Hello, welcome to this video.2
00:00:25,000 --> 00:00:28,000
This is an example of SRT subtitles.3
00:00:29,000 --> 00:00:32,000
They are widely used and supported.

将SRT文件导入剪映等剪辑软件中,为视频添加字幕的工作可以在几秒内完成

3. 通义千问

3.1 官网

官网地址:https://www.tongyi.com/discover

https://www.tongyi.com/discover

点击发现

在这里插入图片描述

接着点击音视频速读

在这里插入图片描述

3.2 上传音视频文件

根据需求选择音视频语言、是否翻译、是否区分发言人等选项

在这里插入图片描述

上传完音视频文件之后点击确认

在这里插入图片描述

点击右上角的任务列表图标或下方的查看全部可以查看处理进度

在这里插入图片描述

3.3 导出文案

任务完成之后,点击右上角的导出按钮,可以选择导出的文档格式,也可以选择是否包含发言人和时间戳信息

最后点击导出按钮,就可以得到完整的文案了

在这里插入图片描述

通义千问还提供了脑图功能和笔记功能,感兴趣的同学可以摸索一下

4. 飞书妙记

4.1 官网

官网地址:https://www.feishu.cn/product/minutes

https://www.feishu.cn/product/minutes

进入到飞书妙记的官网后,点击登录按钮

在这里插入图片描述

登录成功后点击开启妙记按钮

在这里插入图片描述

4.2 上传音视频文件

在这里插入图片描述

选择语言后点击提交按钮

在这里插入图片描述

在这里插入图片描述

4.3 导出文案

处理完成后点击任务,在新的标签页打开

在这里插入图片描述

点击文字记录,接着点击右上角的三个点,最后导出文字记录

在这里插入图片描述

有三个可选项:

  • 导出的文件格式(有飞书文档、TXT、SRT三种格式)
  • 是否包含说话人
  • 是否包含时间戳

选择完成后点击导出按钮,就可以得到包含文案的文件了

在这里插入图片描述

4.4 缺点

每个月只有300分钟的免费时长

在这里插入图片描述

5. VideoCaptioner

5.1 GitHub地址

GitHub地址:https://github.com/WEIFENG2333/VideoCaptioner

https://github.com/WEIFENG2333/VideoCaptioner

在这里插入图片描述

项目是用Python编写的,感兴趣的同学可以把源码下载到本地,在自己的机器上跑一下


值得一提的是,项目的开发者是一个大学生

在这里插入图片描述

5.2 下载

作者贴心地为Windows用户准备了安装包

5.2.1 通过GitHub下载

下载地址:https://github.com/WEIFENG2333/VideoCaptioner/releases/tag/v1.3.3

https://github.com/WEIFENG2333/VideoCaptioner/releases/tag/v1.3.3

在这里插入图片描述

5.2.2 通过作者提供的地址下载

下载地址:https://wwwm.lanzoue.com/ii14G2pdsbej

在这里插入图片描述

5.3 安装

双击VideoCaptioner-Setup-win64-v1.3.3.exe安装包,一路点击下一步就可以了(记得更改软件的安装目录)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

5.4 上传音视频文件

可以点击选择文件按钮上传,也可以直接拖动文件到窗口

在这里插入图片描述

5.5 导出文案

上传音视频文件后点击开始处理按钮

在这里插入图片描述

转录后的字幕文件默认存放在工作目录下,点击打开文件夹可以定位到字幕文件的所在位置。如果不想要SRT文件,只想要纯文字,可以使用本文介绍的AsrTools工具

在这里插入图片描述

语音转录后默认会合成视频与字幕,如果不需要该功能,可以在设置中关闭

合成后的视频默认存放在原视频所在的目录下

在这里插入图片描述

在这里插入图片描述

5.6 可能遇到的问题

5.6.1 问题呈现

在使用VideoCaptioner提取音视频的文案时,可能会遇到以下错误


转录失败 [WinError 3] 系统找不到指定的路径。:'F:VideoCaptionerlVideoCaptioner\lwork-di\檀东东_【进阶教
程】一套连招,彻底释放A!的写作能力 #AI助手 #豆包,AI #豆包电脑版 #AI文本创作\subtitle

在这里插入图片描述

5.6.2 问题产生的原因

一般产生这个问题是因为视频文件的命名中含有某些特殊字符,导致软件在创建目录时遇到了问题

5.6.3 解决方法

有两个解决方法:

  • 第一个方法是重命名视频文件,确保视频文件的命名没有特殊字母
  • 第二个方法时点击转录失败按钮,软件会重新转录一次。点击转录失败按钮重新转录,导出的文案默认存放在视频文件所在的目录下

在这里插入图片描述

点击打开文件夹也能查看字幕文件的所在位置

在这里插入图片描述

5.7 进阶使用教程

本文只演示了VideoCaptioner的基础用法,除了提取音视频的文案之外,VideoCaptioner还可以直接给视频添加字幕,无需借助剪辑软件


VideoCaptioner的更多进阶用法可以观看以下视频:

  • 第52集 | 免费无广!VideoCaptioner,一键视频字幕翻译 #ai #人工智能 #AI工具 #AI在抖音 #字幕
  • 第159集 | 基于LLM的智能字幕助手,完全免费,开盖即用! 最近在github上非常非常火爆的项目——卡卡字幕助手 | VideoCaptioner
  • 开源免费!一键生成字幕并翻译,中日英多语言支持!- 字幕生成、断句、优化、翻译全流程处理#ai #字幕 #软件#教程

6. AsrTools

AsrTools和VideoCaptioner由同一个作者开发,AsrTools可以看做是VideoCaptioner的前身

6.1 GitHub地址

GitHub地址:https://github.com/WEIFENG2333/AsrTools

在这里插入图片描述

项目是用Python编写的,感兴趣的同学可以把源码下载到本地,在自己的机器上跑一下

6.2 下载

下载地址:https://github.com/WEIFENG2333/AsrTools/releases/tag/v1.1.0

https://github.com/WEIFENG2333/AsrTools/releases/tag/v1.1.0

在这里插入图片描述

6.3 安装

无需安装,双击AsrTools.exe文件就可以直接运行软件了

在这里插入图片描述

6.4 上传音视频文件

可以点击选择文件按钮上传,也可以直接拖动文件到窗口

在这里插入图片描述

6.5 导出文案

上传音视频文件后点击开始处理,有SRT、TXT、ASS三种导出格式

在这里插入图片描述

运行过程中会出现一个黑窗,不要手动关闭黑窗,处理结束后会黑窗会自动关闭

在这里插入图片描述

导出的文案默认存放在视频文件所在的目录下,而且目录中会出现一个与视频文件同名的MP3文件,因为提取文案只需要音频,软件对视频的音频做了分离

相关文章:

  • 线性代数(一些别的应该关注的点)
  • GoFly快速开发框架新增UI素材库-帮助开发者快速开发管理后台UI基于ArcoDesign框架开发
  • 深入理解网络安全中的加密技术
  • 月之暗面开源 Kimi-Audio-7B-Instruct,同时支持语音识别和语音生成
  • 中国大陆DNS服务选择指南:阿里云VS AWS,合规性与最佳实践
  • Maven 依赖冲突调解与版本控制
  • 【MCP Node.js SDK 全栈进阶指南】中级篇(5):MCP客户端高级开发
  • 常用财务分析指标列表
  • 30天通过软考高项-第四天
  • Java爬虫入门:从网页抓取到数据提取(正则表达式篇)
  • Weaviate使用入门:从零搭建向量数据库的完整指南
  • 云原生--核心组件-容器篇-2-认识下Docker(三大核心之镜像,容器,仓库)
  • 【Pandas】pandas DataFrame rdiv
  • 神经网络与计算机视觉
  • 计算机视觉中的二值马尔科夫随机场
  • Spring Boot 升级指南(2.x → 3.x)
  • 北斗导航 | 基于Transformer+LSTM+激光雷达的接收机自主完好性监测算法研究
  • Adriuno:编程语言基础
  • 【Java】IntelliJ IDEA 社区版安装
  • 关于GoWeb(1)
  • 吴志朴当选福建德化县人民政府县长
  • 俄伏尔加格勒机场正式更名为斯大林格勒机场
  • 胸外科专家查出肺多发结节,说了一个可怕的事实……
  • 广东省副省长刘红兵任湖南省委常委、宣传部部长
  • 李铁案二审今日宣判
  • 何立峰出席驻沪中央金融机构支持上海建设国际金融中心座谈会并讲话