使用 whisper, 音频分割, 整理需求 2
此时我想写个app类似这个界面。 即 cap cut. 此时截图,分为2行,上面一行有3列,下面一行,即时间轴。但是我想要更简洁。 我想要的界面是 2 行 ,第一行是 视频。 第二行是时间轴。而且时间轴上,有显示 whisper 给出的分割点。 即 用户更容易点中那些分割点(或是只能点中那些点,即最近的点, 也行)。我忘记说了。此app 最根本的目的是:
即,起源是:有一首歌,叫做 not like us 非常火, 我很喜欢。但是毕竟是说唱,我学了很久,也只是学会了前面4--5句,即,学习难度很大。而我本身是搞编程的,所以我想,能否写个app, 或是使用编程的手段来帮助自己学会这首歌?请不要写代码。而是把我的要求,总结一下,写个需求文档,要求详细具体。 我打算使用 flask 来写。
好的,完全理解。你的目标非常明确和精彩:从一个个人学习痛点(学唱快歌)出发,利用自己的编程技能,打造一个专注、简洁、高效的辅助学习工具。
这不仅仅是一个“音频分割”工具,而是一个 “歌曲分句练习App”。将这个核心目的想清楚,对设计非常有帮助。
下面,我将你的想法和需求,整理成一份详细、具体的需求文档。这份文档可以作为你使用 Flask 开发此项目的