当前位置：首页 > news >正文

【尝试】基于openai-whisper进行语音转文字windows版本

news 2025/7/17 7:50:03

1、下载ffmpeg

https://ffmpeg.org/download.html#build-windows

解压缩，并放置到指定位置

在环境变量中进行配置

运行试看是否成功

2、确认电脑CUDA版本

下载Nvidia app

https://www.nvidia.cn/software/nvidia-app/

安装完成后，在终端输入：

nvidia-smi

3、创建虚拟环境

（1）创建whisper虚拟环境

conda create -n whisper python=3.10 -y

（2）激活whisper环境

（3）安装pytorch等依赖

上pytorch官网：https://pytorch.org/get-started/locally/

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126

（4）安装whisper

pip install -U openai-whisper -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

安装完成后，创建一个whisper.py文件

import whisper
model = whisper.load_model("base").to("cuda")  # 明确用 GPU
result = model.transcribe("your-audio-file.mp3")
print(result["text"])

运行，whisper.py文件

通过管理器，看GPU的运行情况

查看全文

http://www.dtcms.com/a/282678.html

【项目实践】SMBMS（Javaweb版）汇总版

flink sql如何对hive string类型的时间戳进行排序

python应用day11--requests爬虫详解

Dify工作流节点-Agent

前端上传 pdf 文件 ,前端自己解析出来生成界面然后支持编辑

数据降维方法：PCA

Vue2.x封装预览PDF组件

利用pdfjs实现的pdf预览简单demo（包含翻页功能）

从0开始学习R语言--Day48--Calibration Curves 评估模型

ByteToMessageDecoder详解

众趣分享 | 浅谈三维重建（空间计算）技术原理

STM32外设介绍5（DMA＜直接存储器访问＞）

开源模型应用落地-qwen模型小试-Qwen3-Embedding 模型集成 vLLM 实战解析（二）

Python第三次作业

【Node 日常使用】

GitHub 趋势日报 (2025年07月15日)

中望3D 2026亮点速递（1）-全新槽功能螺纹功能，减少繁琐操作

Oracle,PostgreSQL查看字段码值方式

国内外服务器的不同之处

【Qt】麒麟系统安装套件

机器学习：AI 自主学习能力的来源

Rocky9安装Ansible

网络安全（初级）（XSS-labs 1-8）

【React Native】模态页Modal

论文导读--PQ3D：通过分段级分组实现多模态特征融合和 MTU3D：在线查询表示学习与动态空间记忆

【MAC技巧】Bash/Zsh切换失败的故障排除

aspect-ratio: 1 / 1样式在部分手机浏览器中失效的问题怎么解决？

《R for Data Science (2e)》免费中文翻译 (第0章) --- Introduction

CURRENT_TIMESTAMP和NOW函数使用

Spring Boot 集成 Redis 并调用 Lua 脚本详解

相关文章：