当前位置: 首页 > wzjs >正文

风中有朵雨做的云电影网站适合学生做网页练习的网站

风中有朵雨做的云电影网站,适合学生做网页练习的网站,微信公众号粉丝下单,广东建设厅的网站查询LLaMA-Omni 2 是基于 Qwen2.5-0.5B/1.5B/3B/7B/14B/32B-Instruct 模型的一系列语音语言模型。与 LLaMA-Omni 类似,它可以同时生成文本和语音应答,从而实现高质量、低延迟的语音交互。通过新引入的流式自回归语音解码器,LLaMA-Omni 2 与 LLaMA…

LLaMA-Omni 2 是基于 Qwen2.5-0.5B/1.5B/3B/7B/14B/32B-Instruct 模型的一系列语音语言模型。与 LLaMA-Omni 类似,它可以同时生成文本和语音应答,从而实现高质量、低延迟的语音交互。通过新引入的流式自回归语音解码器,LLaMA-Omni 2 与 LLaMA-Omni 相比实现了更高的语音质量。

在这里插入图片描述

安装

git clone https://github.com/ictnlp/LLaMA-Omni2
cd LLaMA-Omni2conda create -n llama-omni2 python=3.10
conda activate llama-omni2
pip install -e .

快手上手

下载Whisper large v3

import whisper
model = whisper.load_model("large-v3", download_root="models/speech_encoder/")

下载 CosyVoice 2

huggingface-cli download --resume-download ICTNLP/cosy2_decoder --local-dir models/cosy2_decoder

从 Hugging Face 下载 LLaMA-Omni2 系列型号。LLaMA-Omni2-0.5B/1.5B/3B/7B/14B 仅支持英文,而 LLaMA-Omni2-0.5B/1.5B/3B/7B/14B/32B-Bilingual 支持中英文

LLaMA-Omni2LLaMA-Omni2-Bilingual
🤗 LLaMA-Omni2-0.5B🤗 LLaMA-Omni2-0.5B-Bilingual
🤗 LLaMA-Omni2-1.5B🤗 LLaMA-Omni2-1.5B-Bilingual
🤗 LLaMA-Omni2-3B🤗 LLaMA-Omni2-3B-Bilingual
🤗 LLaMA-Omni2-7B🤗 LLaMA-Omni2-7B-Bilingual
🤗 LLaMA-Omni2-14B🤗 LLaMA-Omni2-14B-Bilingual
-🤗 LLaMA-Omni2-32B-Bilingual

Gradio

controller

python -m llama_omni2.serve.controller --host 0.0.0.0 --port 10000

server

python -m llama_omni2.serve.gradio_web_server --controller http://localhost:10000 --port 8000 --vocoder-dir models/cosy2_decoder

worker

python -m llama_omni2.serve.model_worker --host 0.0.0.0 --controller http://localhost:10000 --port 40000 --worker http://localhost:40000 --model-path models/$model_name --model-name $model_name

访问 http://localhost:8000/ 并与 LLaMA-Omni2 互动!

本地推理

output_dir=examples/$model_name
mkdir -p $output_dirpython llama_omni2/inference/run_llama_omni2.py \--model_path models/$model_name \--question_file examples/questions.json \--answer_file $output_dir/answers.jsonl \--temperature 0 \--s2spython llama_omni2/inference/run_cosy2_decoder.py \--input-path $output_dir/answers.jsonl \--output-dir $output_dir/wav \--lang en

鸣谢

  • CosyVoice 2:我们使用 CosyVoice 2 的预训练语音标记器、语流匹配模型和声码器。
  • SLAM-LLM:我们借用了语音编码器和语音适配器的一些代码。
http://www.dtcms.com/wzjs/570104.html

相关文章:

  • 注释网站开发wordpress分享按钮
  • 国内创意网站界面设计做网站js是什么
  • 烟台优化网站公司哪家好做网站那个公司好
  • 个人网站制作步骤口碑做团购网站
  • 厦门网站建设外包公司信息平台怎么赚钱
  • WordPress 云锁seo线上培训多少钱
  • 如何写网站建设报告泰安百度公司代理商
  • 优质专业建设申报网站语种网站建设
  • 东营住房和城乡建设部网站品牌建设再发力
  • 网页和网站的区别和联系重庆梁平网站建设哪家便宜
  • 福州网站怎么做的做自媒体必备的8个网站
  • 手机网站制作良心服务淘宝网怎样做网站
  • 福州网站快速排名提升wordpress制作表单
  • 望京网站建设做旅游网站怎样
  • 劳务合同免费模板下载沙井网站优化
  • 泉州网站页面设计公司青岛网站推广怎么做好
  • 新乡网站建设策划华为通用软件开发工程师待遇
  • 建设银行社保网站外贸 wordpress
  • 做图片推广的网站网站优化计划
  • 南京市建设工程网站青岛网站制作百家号
  • 手机端网站模板三星网上商城官网
  • 咸阳网站开发公司地址如何建设运输网站
  • 网站网页设计怎么收费如何做多语言网站
  • 镇江网站建设设计jsp旅游网站开发关键技术
  • 企业网站建设开发注意事项网站大小多少合适
  • 网站中怎么做下载链接网站建设项目报告书
  • 广西响应式网站哪家好中山移动网站建设怎么做
  • 哪些网站的网站怎么做的手机网站设计只选亿企邦
  • 重庆做营销网站建设网站浏览器兼容性通用
  • 站长平台seo图片常采用gif或jpeg格式