当前位置: 首页 > news >正文

【尝试】基于Whisper进行语音转文字识别

1、系统参数

Mac mini,Apple M4 Pro,Sequoia 15.5

2、安装相关配置

配置1,安装ffmpeg

在安装ffmpeg之前,先在系统内安装Homebrew,不然会提示:

zsh:command not found brew

安装Homebrew,操作如下
运行官方脚本,在终端中粘贴并回车运行

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

安装完成后,需要确保环境变量设置正确

echo 'eval "$(/opt/homebrew/bin/brew shellenv)"' >> ~/.zprofile
eval "$(/opt/homebrew/bin/brew shellenv)"

验证,Homebrew是否安装成功

在macOS上利用homebrew安装ffmpeg还是有问题,提示

Error: No such file or directory @ rb_sysopen - |Users/linql/Library/Caches/Homebrew/downloads/d6791c82944fcf9ad 1bcecb968742b1c2970f0daf319ecc9c4233e24ef90f5f0--rav1e-0.8.1.arm64_sequoia.bottle.tar.gz

换手动安装

(1)在ffmpeg官网上下载

https://ffmpeg.org/download.html#build-mac

https://evermeet.cx/ffmpeg/

下载完成后,解压。

unzip ffmpeg-7.1.1.zip
sudo mv ffmpeg /usr/local/bin/
sudo chmod +x /usr/local/bin/ffmpeg
ffmpeg -version

 

配置2,安装rust

在终端输入并回车

curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh

这会启动一个安装向导,按提示选择:

  • 输入 1(默认)表示安装 stable(稳定)版本

  • 自动配置环境变量(一般无需手动修改)

安装完成后,重启终端或运行以下命令使 Rust 生效:

source $HOME/.cargo/env

验证是否安装成功

rustc --version
cargo --version

配置3,安装Whisper

(1)创建虚拟环境,基于Conda

conda create -n whisper python=3.10 -y

(2)激活虚拟环境

conda activate whisper

(3)安装whisper

pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装依赖,因Whisper 依赖 PyTorch

pip install torch torchvision torchaudio -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

验证whisper是否安装成功

whisper --help

测试whisper

whisper your-audio-file.mp3 --model base --language Chinese

http://www.dtcms.com/a/279497.html

相关文章:

  • libimagequant windows 编译
  • 开放网络的容器化未来:SONiC在AI智算与园区的落地实践
  • LVS集群技术
  • 网络--OSPF实验
  • TCP半关闭
  • 简单易用的资产跟踪器DumbAssets
  • ICMP隧道工具完全指南:原理、实战与防御策略
  • 多模态融合优化:突破图神经网络与CNN特征对齐瓶颈,赋能细胞多模态联合建模
  • 内网环境自签名超长期HTTPS证书,并在Chrome中显示为安全证书
  • [spring6: Resource ResourceLoader ResourceEditor]-加载资源
  • RocketMQ消息模型
  • 选择一个系统作为主数据源的优势与考量
  • Java-ThreadLocal
  • 微信131~140
  • Linux连接跟踪Conntrack:原理、应用与内核实现
  • OSPF高级特性之GR
  • echarts应用到swiper 轮播图中,每次鼠标一点击图表所在slide,图表就会消失
  • LSV负载均衡
  • PostgreSQL ExecInitIndexScan 函数解析
  • k8s-高级调度(二)
  • 如何使用Cisco DevNet提供的免费ACI学习实验室(Learning Labs)?(Grok3 回答)
  • PostgreSQL 16 Administration Cookbook 读书笔记:第6章 Security
  • DLL 文件 OSError: [WinError 1401] 应用程序无法启动问题解决
  • 七、深度学习——RNN
  • HTTPS 协议原理
  • ZYNQ双核通信终极指南:FreeRTOS移植+OpenAMP双核通信+固化实战
  • 一文明白AI、AIGC、LLM、GPT、Agent、workFlow、MCP、RAG概念与关系
  • 浏览器防录屏是怎样提高视频安全性?
  • 现有医疗AI记忆、规划与工具使用的创新路径分析
  • 【Linux网络】多路转接poll、epoll