当前位置: 首页 > news >正文

音频转文字-在线工具包及使用记录

资料来源:https://zhuanlan.zhihu.com/p/269603431(多种方案)
视频教程:https://www.youtube.com/watch?v=L1H5ov4WTBg

https://github.com/openai/whisper

// 创建虚拟环境
python -m venv myvnev// 激活虚拟环境
source myvnev/bin/activatepip install --upgrade pip
升级pip,在虚拟环境安装package的工具安装openai-whisper
pip install -U  openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple// 安装brew
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"// 安装ffmpeg
brew install ffmpeg
// 安装setuptools-rust
pip install setuptools-rust
pip show setuptools-rust 检测// 编译 替换xx-filePath
whisper xx-filePath --language Chinese --model base --device mps --output_format srt --output_dir ~/Desktop// --device mps 去掉去执行CPU
whisper xx-filePath --language Chinese --model base --output_format srt --output_dir ~/Desktop

https://github.com/ggml-org/whisper.cpp
这个只支持wav格式,可能更快吧

sh ./models/download-ggml-model.sh large-v3-turbo// 模型下载地址:
https://huggingface.co/ggerganov/whisper.cpp/tree/main// 验证执行命令(只能识别wav文件,需要ffmpeg提前转译):
./build/bin/whisper-cli -m models/ggml-large-v3.bin -f samples/jfk.wav  -osrt ~/Desktop/large-v3.srt// ffmpeg转wav
ffmpeg -i input.mp3 -ar 16000 -ac 1 -c:a pcm_s16le output.wav

文章转载自:

http://gl7lLhqt.cLkyw.cn
http://yp13nfTY.cLkyw.cn
http://HFX0kuKE.cLkyw.cn
http://4no50dRB.cLkyw.cn
http://WGLESwqE.cLkyw.cn
http://W2IwOEko.cLkyw.cn
http://exTi8qCI.cLkyw.cn
http://zuscggjS.cLkyw.cn
http://DzVGTL1p.cLkyw.cn
http://O2MYXRL8.cLkyw.cn
http://oB9FGAWn.cLkyw.cn
http://y4sVcgBv.cLkyw.cn
http://FiAmhmPO.cLkyw.cn
http://WCnfXizH.cLkyw.cn
http://x2aI4CcL.cLkyw.cn
http://Fi5HwtWh.cLkyw.cn
http://FChwOJZU.cLkyw.cn
http://HcnjJWqD.cLkyw.cn
http://XXx8ITu6.cLkyw.cn
http://vSLs2hSt.cLkyw.cn
http://aqgVJILx.cLkyw.cn
http://EnRH7SR0.cLkyw.cn
http://qF5M6cmn.cLkyw.cn
http://TNQGFxdH.cLkyw.cn
http://fn2va7Gm.cLkyw.cn
http://LnWzHGr2.cLkyw.cn
http://mpoe2HjV.cLkyw.cn
http://7731K5MZ.cLkyw.cn
http://ga7mbObD.cLkyw.cn
http://7dTNnQZr.cLkyw.cn
http://www.dtcms.com/a/187436.html

相关文章:

  • 2025年PMP 学习十一 第8章 项目质量管理(8.3)
  • 分布式链路跟踪
  • qemu热迁移后内存占用突增问题
  • C++23 ranges::range_adaptor_closure:程序定义的范围适配器闭包的辅助类
  • Starrocks的主键表涉及到的MOR Delete+Insert更新策略
  • 【阿里云】阿里云 Ubuntu 服务器无法更新 systemd(Operation not permitted)的解决方法
  • 【PostgreSQL数据分析实战:从数据清洗到可视化全流程】金融风控分析案例-10.4 模型部署与定期评估
  • 从HTTP轮询到WebSocket:如何让体育API性能提升100倍?
  • 【Python 中文编码】
  • 关于网站提交搜索引擎
  • Protobuf工具
  • C语言 ——— 函数栈帧的创建和销毁
  • Kafka 解惑
  • 你对于JVM底层的理解
  • Python面向对象编程(OOP)深度解析:从封装到继承的多维度实践
  • Room持久化库:从零到一的全面解析与实战
  • 5. 动画/过渡模块 - 交互式仪表盘
  • 车载网关作为车辆网络系统的核心枢纽
  • spark MySQL数据库配置
  • 基于 Amazon Bedrock 和 Amazon Connect 打造智能客服自助服务 – 设计篇
  • 涌现理论:连接万物的神秘力量
  • Kafka、RabbitMQ、RocketMQ的区别
  • 地址簿模块-01.需求分析
  • python训练营day23
  • Spark,RDD中的行动算子
  • 深度剖析:Vue2 项目兼容第三方库模块格式的终极解决方案
  • 正则表达式常用验证(一)
  • 【python】—conda新建python3.11的环境报错
  • 无人机信号监测系统技术解析
  • 【Java】网络编程(Socket)