当前位置：首页 > news >正文

简单通过SenseVoice给自己配置一个语音转文字服务

news 2025/10/8 15:55:47

首先把代码下载下来
git@github.com:FunAudioLLM/SenseVoice.git

然后写一个docker文件

FROM ubuntu:latestRUN apt-get update -y
RUN apt-get install -y python3-full python3-pip 
RUN mkdir -p /SenseVoice
WORKDIR /SenseVoice
RUN python3 -m venv .
ENV USE_CUDA=0
EXPOSE 7860
ENV GRADIO_SERVER_NAME="0.0.0.0"
RUN ./bin/pip install torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cpu
COPY . .
RUN ./bin/pip install -r requirements.txt

由于这里我是Mac电脑不带GPU，所以就用了pytorch的不带GPU的安装模式，如果需要对应GPU的安装方式，可以去pytorch官网看。

第三部，启动容器，把7860端口映射。启动，就可以在http://localhost:7860/?上看到服务了。
在这里插入图片描述
然后就可以录音，通过录音进行转换了。考虑我是苹果全家桶，苹果语音转文字的情况使用。

 ./ffmpeg -i test.m4a output.wav

http://www.dtcms.com/a/256135.html

相关文章：

Django中为api自定义一些装饰器：如参数校验等

GeoJSON 数据简介

Android 终端模拟器 termux app

深入Java面试：从Spring Boot到微服务

【C++语法】类和对象（4）——日期类和const成员函数

linux安装minio并使用

使用CommonAPI开发Some/IP的流程

Spring-MyBatis基本操作

rent8_wechat-最常用出租屋管理系统-微信小程序

华为云Flexus+DeepSeek征文 | 基于Flexus X实例的金融AI Agent开发：智能风控与交易决策系统

C++题解：【入门】快乐的马里奥（BFS）

从代码学习深度学习 - 预训练BERT PyTorch版

【LeetCode 热题 100】15. 三数之和——排序 + 双指针解法

FastAPI框架的10个重要知识点总结

Chromium 136 编译指南 macOS篇：编译流程（五）

Linux进程间通信——信号

kibana和elasticsearch安装

（详细介绍）线性代数中的零空间（Null Space）

Git 使用手册：从入门到精通

MCPServer编程与CLINE配置调用MCP

ubuntu20.04速腾聚创airy驱动调试

Redis哨兵模式的学习(三)

百度萝卜快跑携4颗禾赛激光雷达进军迪拜，千辆L4无人车开启全球化战略

Tensor的常用计算方法（torch示例说明）

RPC - 客户端注册和发现模块

Unity Addressable使用之AddressableAssetSettings

Java UDP Socket 实时在线刷卡扫码POS消费机服务端示例源码

【全开源】填表问卷统计预约打卡表单系统+uniapp前端

亚马逊认证考试系列 - 第一部份：基础服务 - AWS SAA C03

GPT-1 与 BERT 架构