当前位置: 首页 > news >正文

ASR+LLM:B站学习视屏下载并生成学习笔记

文章目录

  • 一、背景
  • 二、bilibili下载姬
  • 三、ffmpeg提取音频
  • 四、在线音频提取文字ASR
  • 五、使用LLM 进行整理笔记
  • 六、参考链接

一、背景

bilibili当前有越来越多高质量的教学视频,但是B站上没有直接下载视频的按钮,以及视频资料不利于复现回归,所以最好整理成笔记方便后续回顾。本文介绍一种B站视频下载、音频提取、使用ASR将音频转成文字,并且利用LLM大语言模型将文本生成学习笔记。

二、bilibili下载姬

B站视频下载,这里推荐开源工具bilibili下载姬,源码链接如下:

https://github.com/leiurayer/downkyi

下载v1.6版本的可执行文件,downkyi是基于aria工具实现。

在这里插入图片描述
在这里插入图片描述

三、ffmpeg提取音频

mp4文件可能比较大,我们仅仅需要提取音频即可,使用ffmpeg工具提取音频mp3文件。

# 使用原始码率
ffmpeg -i input.mp4 -codec:a libmp3lame output.mp3

可以指定码率,一般不需要

ffmpeg -i input.mp4 -vn -acodec libmp3lame -ar 44100 -ac 2 -ab 192k output.mp3

对于语音识别ASR模型,可能音频文件太大,需要截取音频长度,使用如下命令:

ffmpeg -i input.mp3 -ss 00:00:10 -t 00:00:20 output.mp3
  • -ss 00:00:10:设置开始时间为 10 秒。
  • -t 00:00:20:设置持续时间为 20 秒。

四、在线音频提取文字ASR

ASR模型是用于语音识别的,这里推荐一款在线ASR工具进行语音转文字网站,注意该网站生成的文本是没有标点符号的。

https://tools.orionstar.qa/audio/

在这里插入图片描述

五、使用LLM 进行整理笔记

最后一步使用LLM对上述生成的文本进行整合,并形成正式文档,补充标点符号,注意不要改变原文意思。这里prompt如下,使用任意LLM大语言模型即可。

我这里有一份没有标点符号的学习草稿文件,请在不改变原文意思的情况下帮忙整理成一份条例清晰的正式文档,以markdown形式输出,不要进行内容延展,仅进行格式整合。

六、参考链接

https://zhuanlan.zhihu.com/p/124293184

http://www.dtcms.com/a/494344.html

相关文章:

  • C++中的引用
  • Linux 系统下 ZONE 区域的划分
  • 网站内部链接优化方法cpanel伪静态wordpress
  • LangChain 表达式语言核心组合:Prompt + LLM + OutputParser
  • 【管理多版本Python环境】Anaconda安装及使用
  • AI修图革命:IOPaint+cpolar让废片拯救触手可及
  • 读书笔记整理--网络学习与概念整合
  • 老铁推荐个2021网站好吗wordpress 入口文件
  • 前端自动化部署全流程(Jenkins + Nginx)
  • 音视频处理(一):什么决定了你的音色?声音的三要素
  • python+uniapp基于微信小程序的助眠小程序
  • ELK运维之路(Filebeat第二章-7.17.24)
  • (未成功)Chrome调试避免跳入第三方源码(设置Blackbox Scripts、将目录添加到忽略列表、向忽略列表添加脚本)
  • 网站建设毕业答辩问题学建设网站首页
  • 大模型在企业云计算领域的核心应用能力要求
  • CloudDM:一站式数据库开发管理工具
  • 适合用struts2做的网站批量发布网站
  • Azure OpenAI 错误码处理完整指南
  • NuxtJS从0到1开发SSR项目-添加Nuxt UI
  • 如何检查本地是否存在 Docker 镜像 ?
  • 查询工程建设项目的网站泉州网站制作平台
  • 单序列和双序列问题——动态规划
  • 【建模与仿真】基于TPE-SVM的乳腺癌诊断可解释人工智能方法
  • 2.5、物联网设备的“免疫系统”:深入解析安全启动与可信执行环境
  • 【小白笔记】理解 PyTorch 和 NumPy 中的张量(Tensor)形状变化unsqueeze(0)
  • 消息中间件选型的艺术:如何在RocketMQ、Kafka、RabbitMQ中做出正确决策
  • Java 反射机制核心类详解:Class、Constructor、Method、Field
  • 如何建立一个网站查询数据韶关市住房和城乡建设管理局网站
  • 【CSS 技巧】实现半透明边框的正确方式 —— 使用 background-clip: padding-box
  • CSS学习笔记(一):Flex布局全攻略