当前位置: 首页 > news >正文

使用 whisper, 音频分割, 整理需求 2

此时我想写个app类似这个界面。  即 cap cut. 此时截图,分为2行,上面一行有3列,下面一行,即时间轴。但是我想要更简洁。 我想要的界面是 2 行 ,第一行是 视频。 第二行是时间轴。而且时间轴上,有显示  whisper 给出的分割点。 即 用户更容易点中那些分割点(或是只能点中那些点,即最近的点, 也行)。我忘记说了。此app 最根本的目的是:
即,起源是:有一首歌,叫做 not like us 非常火, 我很喜欢。但是毕竟是说唱,我学了很久,也只是学会了前面4--5句,即,学习难度很大。而我本身是搞编程的,所以我想,能否写个app, 或是使用编程的手段来帮助自己学会这首歌?请不要写代码。而是把我的要求,总结一下,写个需求文档,要求详细具体。 我打算使用 flask 来写。

请添加图片描述

请添加图片描述
请添加图片描述

好的,完全理解。你的目标非常明确和精彩:从一个个人学习痛点(学唱快歌)出发,利用自己的编程技能,打造一个专注、简洁、高效的辅助学习工具。

这不仅仅是一个“音频分割”工具,而是一个 “歌曲分句练习App”。将这个核心目的想清楚,对设计非常有帮助。

下面,我将你的想法和需求,整理成一份详细、具体的需求文档。这份文档可以作为你使用 Flask 开发此项目的

http://www.dtcms.com/a/309186.html

相关文章:

  • 高防服务器租用:保障数据安全
  • 【智能Agent场景实战指南 Day 29】Agent市场趋势与前沿技术
  • 法国彩虹重磅发布EmVue:解锁能源监控新方式
  • TGD第十篇:当神经网络遇到TGD特征
  • 相亲小程序个人资料管理系统模块搭建
  • 数据结构(10)栈和队列算法题
  • 25电赛e题杂乱环境稳定识别矩形框(附源码)
  • 浏览器环境segmentit实现中文分词
  • 精通分类:解析Scikit-learn中的KNN、朴素贝叶斯与决策树(含随机森林)
  • LLM Prompt与开源模型资源(2)提示工程关键技术
  • 工程化(二):为什么你的下一个项目应该使用Monorepo?(pnpm / Lerna实战)
  • 位运算-面试题01.01.判定字符是否唯一-力扣(LeetCode)
  • 【unity小技巧】封装unity适合2D3D进行鼠标射线检测,获取鼠标位置信息检测工具类
  • 8.1每日一题
  • (线段树)SP2916 GSS5 / nfls #2899 查询最大子段和 题解
  • STL进阶典题整理 2025.7.30-2025.8.1
  • 关于继承的一些知识(C++)
  • react-native在mac的m2芯片下,pod install安装glog的时候报错
  • bmcweb工作流程
  • 【科研绘图系列】R语言绘制环状分组显著性柱状堆积图
  • Spring AI 系列之三十 - Spring AI Alibaba-其它模型
  • CSS font-weight:500不生效
  • Git 命令使用指南:从入门到进阶
  • 动态规划(数位统计dp 状态压缩dp 树形dp 记忆化搜索) from y总
  • 【C语言】字符函数与字符串函数详解
  • http请求访问响应慢问题解决的基本思路
  • 基于python大数据的招聘数据可视化及推荐系统
  • natapp的报错Tunnel StatusReconnecting...
  • STM32芯片简述
  • 使用GPU和NPU视频生成的优劣对比