当前位置: 首页 > news >正文

jdk21使用Vosk实现语音文字转换,免费的语音识别

1.下载vosk的model

vosk官网:https://alphacephei.com/vosk/models
我这里使用较小的vosk-model-small-cn-0.22

2.添加相关pom文件

 <!-- 获取音频信息 -->
        <dependency>
            <groupId>org</groupId>
            <artifactId>jaudiotagger</artifactId>
            <version>2.0.3</version>
        </dependency>

        <!-- 语音识别 -->
        <dependency>
            <groupId>net.java.dev.jna</groupId>
            <artifactId>jna</artifactId>
            <version>5.16.0</version>
        </dependency>
        <dependency>
            <groupId>com.alphacephei</groupId>
            <artifactId>vosk</artifactId>
            <version>0.3.45</version>
        </dependency>

3.代码

添加model和使用的音频,我这里用的wav格式的,不同格式的参数会不一样


import org.vosk.LibVosk;
import org.vosk.LogLevel;
import org.vosk.Model;
import org.vosk.Recognizer;

import javax.sound.sampled.AudioSystem;
import javax.sound.sampled.UnsupportedAudioFileException;
import java.io.*; 

public class testVosk {
    public static void main(String[] argv) throws IOException, UnsupportedAudioFileException {
        LibVosk.setLogLevel(LogLevel.DEBUG);

        try (Model model = new Model("E:\\srk\\bigData\\vosk-model-small-cn-0.22");
             InputStream fis = AudioSystem.getAudioInputStream(new BufferedInputStream(new FileInputStream("C:\\Users\\Administrator\\Downloads\\mdhs1-5ob2k.wav")));
             Recognizer recognizer = new Recognizer(model, 16000)) {
            int bytes;
            byte[] b = new byte[4096];
            while ((bytes = fis.read(b)) >= 0) {
                if (recognizer.acceptWaveForm(b, bytes)) {
                    System.out.println(recognizer.getResult());
                } else {
                    System.out.println(recognizer.getPartialResult());
                }
            }
            String result = recognizer.getFinalResult();
            System.out.println(result);
        }

    }
}

4.可能遇到的问题

1.乱码,我搞了半天(捂脸)
因为jdk17以后编号的模式改了,所以在网上找了各种设置编码的格式都没有生效。
比如jvm设置 -Dfile.encoding=UTF-8都没生效。

-Dfile.encoding=UTF-8

jdk17以前的还是正常的。
解决方法:

  1. win系统控制面板找到“区域与语言设置”

  2. 在弹出框中选择更改系统区域设置
    在这里插入图片描述

  3. 勾选beta使用utf-8
    在这里插入图片描述

5.相关资料

  1. gitcode相关api

相关文章:

  • RL基础以及AlphaGo、AlphaGo Zero原理
  • 英伟达GPU SKU设计核心策略
  • 【log4j】配置Slf4j
  • 机器学习——GBDT、GBRT
  • Vue下 Sortable 实现 table 列表字段可拖拽排序,显示隐藏组件开发
  • 食品计算—Nutrition5k: Towards Automatic Nutritional Understanding of Generic Food
  • 5、类的6个默认成员函数和特性--类的新功能
  • 高级java每日一道面试题-2025年3月14日-微服务篇[Eureka篇]-Eureka如何保证高可用性?
  • freecad手动装插件 add on
  • 最大数字(java)(DFS实现)
  • AMD机密计算虚拟机介绍
  • ubuntu系统安装docker
  • 天梯赛 L2-022 重排链表
  • 自顶向下学习K8S--部署Agones
  • Lua 数组
  • 平安证券 NoETL 指标平台实践:统一数据口径,驱动高效经营分析与智能决策
  • Ubuntu 使用终端手动连接无线网络(wlan0)完整流程 + 故障排查记录
  • Vue3.5 企业级管理系统实战(十一):全屏切换组件
  • 产生式系统的完整示例——医疗诊断系统(附python代码)
  • zookeeper部署教程
  • 梅花奖在上海|湘剧《夫人如见》竞梅,长沙文旅来沪推广
  • 受关税政策影响,沃尔玛将上调部分商品在美售价
  • 自然资源部:不动产登记累计化解遗留问题房屋2000多万套
  • 湖北宜化拟斥资超32亿加价回购“弃子”,布局上游煤炭业务
  • 马上评|中学生被操场地面烫伤,谁的“大课间”?
  • 4月企业新发放贷款利率处于历史低位