当前位置: 首页 > news >正文

中国建设监理协会网站个人会员系统哪个网站做视频有钱挣

中国建设监理协会网站个人会员系统,哪个网站做视频有钱挣,桂林网站建,aspcms免费旅游网站模板继续上文,硬件软件准备齐全,介绍一下主要用到的库 sherpa-onnx 开源的,语音转文本、文本转语音、说话人分类和 VAD,关键是支持C#开发 OllamaSharp 用于连接ollama,如其名C#开发 虽然离可玩还有一段距离&#xff0…

继续上文,硬件软件准备齐全,介绍一下主要用到的库

sherpa-onnx

开源的,语音转文本、文本转语音、说话人分类和 VAD,关键是支持C#开发

OllamaSharp

用于连接ollama,如其名C#开发

虽然离可玩还有一段距离,但是还是要说一下目前遇到的一些问题

1、最初使用流式语音识别,但录音流发送到server之后,完全识别不到文字,保存为pcm播放发现完全是噪音,最后转换放大了音频可以正确识别到说话内容了
static float gain = 5.0f;
short[] int16Array;
float[] floatArray;
public void Recognize(byte[] bytes)
{//Console.WriteLine("收到音频长度:"+ bytes.Length);int16Array = new short[bytes.Length / 2];Buffer.BlockCopy(bytes, 0, int16Array, 0, bytes.Length);floatArray = new float[int16Array.Length];for (int i = 0; i < int16Array.Length; i++){floatArray[i] = int16Array[i] / 32768.0f * gain;}onlineStream.AcceptWaveform(sampleRate, floatArray);
}
2、流式识别有个问题,我说下一句话的时候才会确定上一句结束,虽然有三个参数可调,但我多次测试,没调好,只好改用离线识别,给esp32s3添加个按键,按下开始发送录音数据,松开停止发送并告知录音结束,server端再开始识别
            //默认值config.Rule1MinTrailingSilence = 2.4f;config.Rule2MinTrailingSilence = 0.5f;//限制最长说话10秒config.Rule3MinUtteranceLength = 10f;
void loop() {webSocket.loop(); // 必须调用以处理WebSocket事件 if(digitalRead(PIN_BUTTON) == LOW){pressed = true;uint8_t buffer[BUFFER_SIZE];size_t bytesRead;// 从I2S读取音频数据i2s_read(I2S_NUM_0, buffer, BUFFER_SIZE, &bytesRead, portMAX_DELAY);// 通过WebSocket发送音频数据if (webSocket.sendBIN(buffer, bytesRead)) {//Serial.printf("Sent %d bytes of audio data\n", bytesRead); } else {//Serial.println("Failed to send audio data");}}else{if(pressed){ pressed = false;if (webSocket.sendTXT("{\"code\":1,\"message\":\"结束语音\"}")) {} else {}}}
}
        private static void OnMessage(IWebSocketConnection connection, string msg){BaseMsg baseMsg = null;try{baseMsg = JsonConvert.DeserializeObject<BaseMsg>(msg);}catch (Exception e){Console.WriteLine(e);}if (baseMsg != null){// 收到code 1时,结束录音开始识别if (baseMsg.code == 1){Asr asr = null;asrs.TryGetValue(connection.GetHashCode(), out asr);if (asr != null){asr.EndReceive();}}}}
3、周围人多声音嘈杂的时候,语音识别开始放飞自我,七八米开外的人声它都收进来…… 用RNNoise.Net处理了一下,也不知道对不对,感觉有点效果……

https://github.com/Yellow-Dog-Man/RNNoise.Net

        /// <summary>/// 识别语音数据/// </summary>short[] int16Array;float[] floatArray;private void Recognize(byte[] bytes){int16Array = new short[bytes.Length / 2];Buffer.BlockCopy(bytes, 0, int16Array, 0, bytes.Length);floatArray = new float[int16Array.Length];for (int i = 0; i < int16Array.Length; i++){floatArray[i] = int16Array[i] / 32768.0f;}// 降噪using (var denoiser = new Denoiser()){int count = denoiser.Denoise(floatArray.AsSpan());Console.WriteLine("denoised count:" + count);}offlineStream = recognizer.CreateStream();offlineStream.AcceptWaveform(sampleRate, floatArray);recognizer.Decode(offlineStream);string result = offlineStream.Result.Text;offlineStream.Dispose();Console.WriteLine("result:" + result);if (!string.IsNullOrWhiteSpace(result)){result = offlinePunctuation.AddPunct(result.ToLower());BaseMsg textMsg = new BaseMsg(1, result);client.Send(JsonConvert.SerializeObject(textMsg));if (llm != null){llm.RequestAsync(result);}}}
4、其他问题,声音卡顿,爆音,音频长了后半段直接爆炸刺啦……

放上最新截图
在这里插入图片描述
按键 G47接GND,按钮还没到货……
在这里插入图片描述
工程地址,持续修改中
https://github.com/xue-fei/homeai

http://www.dtcms.com/a/476573.html

相关文章:

  • 网站建设类广东省网站建设网站
  • 站长工具seo综合查询推广广告制作公司开票范围
  • 自己怎么做网站购买空间大连建站费用
  • 福州网站建设嘉艺seo专业学校
  • 晋州外贸网站建设衡阳seo排名
  • 自己开通一个网站需要多少钱自己做软件需要学什么
  • 家乡网站策划书建设背景免费下载app
  • 做介绍英文网站百度广告投放收费标准
  • 长安网站建设推广公司音乐网站制作课程报告
  • 商城网站开发 价格在广州开发一个营销网站多少钱
  • 如何360收录网站网站设计框架
  • 网站建设 公司 常见问题wordpress怎么搬站
  • 企业网站及信息化建设设计开发评审报告
  • 在哪个网站可以做二建的题卖酒的网站做线下怎么做
  • 找公司做网站先付全款吗微信小商店怎么开通
  • 甘肃建设厅职称查询官方网站今天时政新闻热点是什么
  • 市场营销推广活动方案整站seo优化哪家好
  • seo网站改版广告设计与制作培训学校
  • 网站数据不变重新安装wordpresswordpress怎么播放视频教程
  • 徐州做网站的哪个好php下载站源码
  • led行业网站源码wordpress缩略图延时加载
  • 做网站 需要什么商标东莞人才服务中心官网
  • 建什么类型网站好开发者助手app
  • 做兼职的设计网站有哪些工作南京做微网站
  • 网站开发drupal成都哪家公司做网站
  • 企业标准版网站建设网络营销的特点有哪些
  • 网站开发需要用例图吗跨境电子商务网站建设
  • 免费云建站苏州企业建站系统模板
  • 企业网站建设程序注册商贸公司需要什么条件
  • 晋中城市建设招标网站电话营销网站建设