当前位置: 首页 > news >正文

【尝试】基于openai-whisper进行语音转文字windows版本

1、下载ffmpeg

https://ffmpeg.org/download.html#build-windows

解压缩,并放置到指定位置

在环境变量中进行配置

运行试看是否成功

 

2、确认电脑CUDA版本

下载Nvidia app

https://www.nvidia.cn/software/nvidia-app/

安装完成后,在终端输入:

nvidia-smi

3、创建虚拟环境

(1)创建whisper虚拟环境

conda create -n whisper python=3.10 -y

 

 (2)激活whisper环境

(3)安装pytorch等依赖

上pytorch官网:https://pytorch.org/get-started/locally/

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

 (4)安装whisper

pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装完成后,创建一个whisper.py文件

import whisper
model = whisper.load_model("base").to("cuda")  # 明确用 GPU
result = model.transcribe("your-audio-file.mp3")
print(result["text"])

运行,whisper.py文件

通过管理器,看GPU的运行情况

 

http://www.dtcms.com/a/282678.html

相关文章:

  • 【项目实践】SMBMS(Javaweb版)汇总版
  • flink sql如何对hive string类型的时间戳进行排序
  • python应用day11--requests爬虫详解
  • Dify工作流节点-Agent
  • 前端上传 pdf 文件 ,前端自己解析出来 生成界面 然后支持编辑
  • 数据降维方法:PCA
  • Vue2.x封装预览PDF组件
  • 利用pdfjs实现的pdf预览简单demo(包含翻页功能)
  • 从0开始学习R语言--Day48--Calibration Curves 评估模型
  • ByteToMessageDecoder详解
  • 众趣分享 | 浅谈三维重建(空间计算)技术原理
  • STM32外设介绍5(DMA<直接存储器访问>)
  • 开源模型应用落地-qwen模型小试-Qwen3-Embedding 模型集成 vLLM 实战解析(二)
  • Python第三次作业
  • 【Node 日常使用 】
  • GitHub 趋势日报 (2025年07月15日)
  • 中望3D 2026亮点速递(1)-全新槽功能螺纹功能,减少繁琐操作
  • Oracle,PostgreSQL查看字段码值方式
  • 国内外服务器的不同之处
  • 【Qt】麒麟系统安装套件
  • 机器学习:AI 自主学习能力的来源
  • Rocky9安装Ansible
  • 网络安全(初级)(XSS-labs 1-8)
  • 【React Native】模态页Modal
  • 论文导读--PQ3D:通过分段级分组实现多模态特征融合和 MTU3D:在线查询表示学习与动态空间记忆
  • 【MAC技巧】Bash/Zsh切换失败的故障排除
  • aspect-ratio: 1 / 1样式在部分手机浏览器中失效的问题怎么解决?
  • 《R for Data Science (2e)》免费中文翻译 (第0章) --- Introduction
  • CURRENT_TIMESTAMP和NOW函数使用
  • Spring Boot 集成 Redis 并调用 Lua 脚本详解