当前位置: 首页 > news >正文

音频转文字-在线工具包及使用记录

资料来源:https://zhuanlan.zhihu.com/p/269603431(多种方案)
视频教程:https://www.youtube.com/watch?v=L1H5ov4WTBg

https://github.com/openai/whisper

// 创建虚拟环境
python -m venv myvnev// 激活虚拟环境
source myvnev/bin/activatepip install --upgrade pip
升级pip,在虚拟环境安装package的工具安装openai-whisper
pip install -U  openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple// 安装brew
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"// 安装ffmpeg
brew install ffmpeg
// 安装setuptools-rust
pip install setuptools-rust
pip show setuptools-rust 检测// 编译 替换xx-filePath
whisper xx-filePath --language Chinese --model base --device mps --output_format srt --output_dir ~/Desktop// --device mps 去掉去执行CPU
whisper xx-filePath --language Chinese --model base --output_format srt --output_dir ~/Desktop

https://github.com/ggml-org/whisper.cpp
这个只支持wav格式,可能更快吧

sh ./models/download-ggml-model.sh large-v3-turbo// 模型下载地址:
https://huggingface.co/ggerganov/whisper.cpp/tree/main// 验证执行命令(只能识别wav文件,需要ffmpeg提前转译):
./build/bin/whisper-cli -m models/ggml-large-v3.bin -f samples/jfk.wav  -osrt ~/Desktop/large-v3.srt// ffmpeg转wav
ffmpeg -i input.mp3 -ar 16000 -ac 1 -c:a pcm_s16le output.wav

文章转载自:

http://Zvo83s6b.fstdf.cn
http://iTsZ7nFf.fstdf.cn
http://oj72lLPb.fstdf.cn
http://RNoA4e6v.fstdf.cn
http://SxsWL2wW.fstdf.cn
http://SNDfSmBJ.fstdf.cn
http://IQh3rZ9Z.fstdf.cn
http://WBfGgN9q.fstdf.cn
http://J58zs4j3.fstdf.cn
http://fvF14A44.fstdf.cn
http://yReM1zsb.fstdf.cn
http://h6d4QltI.fstdf.cn
http://4ALY4y5q.fstdf.cn
http://0uksfyyN.fstdf.cn
http://Xo7Hxldt.fstdf.cn
http://RSAB1fsG.fstdf.cn
http://7Z5dDodP.fstdf.cn
http://VOh80oI1.fstdf.cn
http://Ypovgh4m.fstdf.cn
http://6uNXkbVT.fstdf.cn
http://sxUQhQky.fstdf.cn
http://r71AruT6.fstdf.cn
http://PWSAq2bq.fstdf.cn
http://9nevxeq8.fstdf.cn
http://AAzhzDOy.fstdf.cn
http://6UeWNJVv.fstdf.cn
http://kboQZ1U5.fstdf.cn
http://r1QcncY1.fstdf.cn
http://RxrP9ZpE.fstdf.cn
http://CrlE8bZH.fstdf.cn
http://www.dtcms.com/a/187436.html

相关文章:

  • 2025年PMP 学习十一 第8章 项目质量管理(8.3)
  • 分布式链路跟踪
  • qemu热迁移后内存占用突增问题
  • C++23 ranges::range_adaptor_closure:程序定义的范围适配器闭包的辅助类
  • Starrocks的主键表涉及到的MOR Delete+Insert更新策略
  • 【阿里云】阿里云 Ubuntu 服务器无法更新 systemd(Operation not permitted)的解决方法
  • 【PostgreSQL数据分析实战:从数据清洗到可视化全流程】金融风控分析案例-10.4 模型部署与定期评估
  • 从HTTP轮询到WebSocket:如何让体育API性能提升100倍?
  • 【Python 中文编码】
  • 关于网站提交搜索引擎
  • Protobuf工具
  • C语言 ——— 函数栈帧的创建和销毁
  • Kafka 解惑
  • 你对于JVM底层的理解
  • Python面向对象编程(OOP)深度解析:从封装到继承的多维度实践
  • Room持久化库:从零到一的全面解析与实战
  • 5. 动画/过渡模块 - 交互式仪表盘
  • 车载网关作为车辆网络系统的核心枢纽
  • spark MySQL数据库配置
  • 基于 Amazon Bedrock 和 Amazon Connect 打造智能客服自助服务 – 设计篇
  • 涌现理论:连接万物的神秘力量
  • Kafka、RabbitMQ、RocketMQ的区别
  • 地址簿模块-01.需求分析
  • python训练营day23
  • Spark,RDD中的行动算子
  • 深度剖析:Vue2 项目兼容第三方库模块格式的终极解决方案
  • 正则表达式常用验证(一)
  • 【python】—conda新建python3.11的环境报错
  • 无人机信号监测系统技术解析
  • 【Java】网络编程(Socket)