当前位置：首页 > news >正文

使用 whisper，音频分割，整理需求 2

news 2025/8/2 5:16:44

此时我想写个app类似这个界面。  即 cap cut. 此时截图，分为2行，上面一行有3列，下面一行，即时间轴。但是我想要更简洁。 我想要的界面是 2 行 ，第一行是 视频。 第二行是时间轴。而且时间轴上，有显示  whisper 给出的分割点。 即 用户更容易点中那些分割点（或是只能点中那些点，即最近的点， 也行）。我忘记说了。此app 最根本的目的是：
即，起源是：有一首歌，叫做 not like us 非常火， 我很喜欢。但是毕竟是说唱，我学了很久，也只是学会了前面4--5句，即，学习难度很大。而我本身是搞编程的，所以我想，能否写个app, 或是使用编程的手段来帮助自己学会这首歌？请不要写代码。而是把我的要求，总结一下，写个需求文档，要求详细具体。 我打算使用 flask 来写。

请添加图片描述

请添加图片描述

好的，完全理解。你的目标非常明确和精彩：从一个个人学习痛点（学唱快歌）出发，利用自己的编程技能，打造一个专注、简洁、高效的辅助学习工具。

这不仅仅是一个“音频分割”工具，而是一个 “歌曲分句练习App”。将这个核心目的想清楚，对设计非常有帮助。

下面，我将你的想法和需求，整理成一份详细、具体的需求文档。这份文档可以作为你使用 Flask 开发此项目的

http://www.dtcms.com/a/309186.html

相关文章：

高防服务器租用：保障数据安全

【智能Agent场景实战指南 Day 29】Agent市场趋势与前沿技术

法国彩虹重磅发布EmVue：解锁能源监控新方式

TGD第十篇：当神经网络遇到TGD特征

相亲小程序个人资料管理系统模块搭建

数据结构（10）栈和队列算法题

25电赛e题杂乱环境稳定识别矩形框（附源码）

浏览器环境segmentit实现中文分词

精通分类：解析Scikit-learn中的KNN、朴素贝叶斯与决策树（含随机森林）

LLM Prompt与开源模型资源(2)提示工程关键技术

工程化(二)：为什么你的下一个项目应该使用Monorepo？（pnpm / Lerna实战）

位运算-面试题01.01.判定字符是否唯一-力扣(LeetCode)

【unity小技巧】封装unity适合2D3D进行鼠标射线检测，获取鼠标位置信息检测工具类

8.1每日一题

（线段树）SP2916 GSS5 / nfls #2899 查询最大子段和题解

STL进阶典题整理 2025.7.30-2025.8.1

关于继承的一些知识（C++）

react-native在mac的m2芯片下,pod install安装glog的时候报错

bmcweb工作流程

【科研绘图系列】R语言绘制环状分组显著性柱状堆积图

Spring AI 系列之三十 - Spring AI Alibaba-其它模型

CSS font-weight:500不生效

Git 命令使用指南：从入门到进阶

动态规划（数位统计dp 状态压缩dp 树形dp 记忆化搜索） from y总

【C语言】字符函数与字符串函数详解

http请求访问响应慢问题解决的基本思路

基于python大数据的招聘数据可视化及推荐系统

natapp的报错Tunnel StatusReconnecting...

STM32芯片简述

使用GPU和NPU视频生成的优劣对比