当前位置: 首页 > news >正文

使用 AI 如何高效解析视频内容?生成思维导图或分时段概括总结

一、前言

AI 发展的如此迅速,有人想通过 AI 提效对视频的解析,怎么做呢?

豆包里面有 AI 视频总结的功能,可以解析bilibili网站上部分视频,如下图所示:
在这里插入图片描述
但有的视频解析时提示:
在这里插入图片描述
所以呢,使用豆包 AI 去解析视频,目前来看局限性是比较大的,不好用的。

我们来想一下,AI 解析视频的内部逻辑,肯定是解析语音,然后生成文字,最后 AI 拿到视频中的所有文字,进行一个详细的视频总结,这其实就是我们想要的效果,那么有没有好用的工具呢?答案是有,继续往下看。

二、通义听悟 + DeepSeek

通义听悟地址:https://tingwu.aliyun.com/。普通用户首次注册登录得10小时转写时长以及20G的存储空间,每天签到就会赠送10个小时的转写时长。
在这里插入图片描述

1、视频下载

我们可以将视频下载到本地,然后上传到「通义听悟」,导入方式支持以下 4 种:
在这里插入图片描述可以上传本地视频或阿里云盘。

2、视频解析

我同样选择了bilibili上的视频,地址:https://tingwu.aliyun.com/doc/transcripts/4l6xqapz7x3pqm2y。这个视频挺好的,建议大家都读一下,肯定有收获。

给大家分享一个下载视频的好工具:https://mbd.pub/o/bread/mbd-ZJ6Ulpdp,按需收藏。

视频上传后,「通义听悟」会自动将视频进行解析,需要一段时间。解析后效果特别全面,如下图所示:
在这里插入图片描述
在这里插入图片描述

  • 首先是视频本身,
  • 然后是智能速览:
    • 关键词
    • 全文概要
    • 章节速览
    • 发言总结
    • 要点回顾
  • 原文
    • 视频文字稿,可以区分发言人。
    • 视频文字稿可以标记:重点、问题、待办
  • 上方工具栏
    • 搜索:根据关键词跳转到视频某处
    • 批量摘取,可一键摘取视频全部原文
    • 筛选:只看标记内容;或只看某发言人
    • 翻译:可一键将内容翻译为源语言、英语、日语
    • AI 改写
  • 右侧文本框:可以记录自己的灵感和思考。一键摘取视频原文,也是将原文内容显示在右侧文本框。
3、前往 DeepSeek

这里我用的是腾讯元宝中的 DeepSeek 模型,地址:https://yuanbao.tencent.com/。
在这里插入图片描述
取消“联网搜索”的原因是,这样 DeepSeek 只会基于你给的内容来深度思考,不会出现 AI 幻觉或无中生有的问题。

上图,我是将视频全部原文发给他,然后给了提示语:“帮我将以下内容整理成markdown格式的层次式思维导图”,让他给我生成思维导图。

按照我的要求,他以 markdown 格式输出了思维导图内容,现在我们继续用工具将思维导图画出来。使用的工具是:https://www.min2k.com/tools/markmap/。

将 DeepSeek 给的回答粘在左侧,右侧就输出了思维导图,如下图所示:
在这里插入图片描述
这视频我看完了,总结的思维导图很详细,很正确。

我们不光可以基于视频原文内容,生成思维导图,还可以随便问。比如:“两位状元的访谈,能为我们带来什么人生道理和启示”等,都可以,看你自身需要。

三、总结

好了,本文到这里基本上就结束了,本文主要讲解了如何使用 AI 快速总结视频内容。利用了「通义听悟」将视频原文内容解析出来,解析出来的效果就很棒。同时获取了视频文字后,我们可以利用 DeepSeek 大模型(别的模型也可以)基于视频文字来进行问答,比如绘制思维导图,比如继续挖掘文字价值等。

请问,你学会了吗?可以拿个自己感兴趣的视频练练手。如果你有想法或更好的方案,欢迎与我沟通,我们下期再见。

相关文章:

  • 基于 ISO 22301 与国产化实践的 BCM 系统菜单设计指南
  • 【疑难杂症2025-003】Java-mvn项目在gitlab-ci构建镜像时遇到的问题和解决方案
  • ✍️【TS类型体操进阶】挑战类型极限,成为类型魔法师![特殊字符]♂️✨
  • EDU/EDU.CN教育邮箱的申请(申请成功可以免费使用一年CursorPro)
  • 【漫话机器学习系列】245.权重衰减(Weight Decay)
  • CentOS 系统升级失败的原因与排查
  • 理解网站导航文件:robots.txt、sitemap.xml与LLMs.txt的全面解析
  • 大数据、物联网(IoT)、平台架构与设计重构大模型应用
  • 【Spring】Spring MVC笔记
  • 深入解析Http11AprProtocol:Tomcat高性能通信的底层原理
  • 快速上手 Docker:从入门到安装的简易指南(Mac、Windows、Ubuntu)
  • 【java】使用iText实现pdf文件增加水印功能
  • Postman最佳平替, API测试工具Bruno实用教程(一):基础篇
  • 广告屏蔽插件的内部细节EasyList 规则详解:为什么广告屏蔽不直接用 CSS/JS?​(彩蛋)
  • Flink + Kafka 数据血缘追踪与审计机制实战
  • 开发搭载阿里云平台的物联网APP(支持数据接收与发送)
  • 日常开发中,iOS 性能调优我们怎么做?
  • SQL Server To Paimon Demo by Flink standalone cluster mode
  • 多线服务器具有什么优势
  • 【Science Advances】普林斯顿大学利用非相干光打造可重构纳米光子神经网络
  • 贵州省总工会党组成员、副主席梁伟接受审查调查
  • 乘客被地铁厕所门砸伤,南京地铁:突然坏的,已和乘客沟通处理
  • 人民时评:透过上海车展读懂三组密码
  • 第1现场 | 50多年来首次!印度举行大规模民防演习
  • 深入贯彻中央八项规定精神学习教育中央第七指导组指导督导中国船舶集团见面会召开
  • 体坛联播|双杀阿森纳,巴黎晋级欧冠决赛对阵国际米兰