当前位置: 首页 > wzjs >正文

成都建网站公司电话改 wordpress 主题 颜色

成都建网站公司电话,改 wordpress 主题 颜色,做二手车有哪些网站有哪些,软文范文200字一、简介 Qwen3-Embedding与Qwen3-Reranker是阿里巴巴通义实验室于今年6月开源的双模型系列,专为文本表征、检索与排序任务设计。基于Qwen3基础模型构建,二者通过协同工作显著提升语义理解与信息检索效率,在多语言场景和工业部署中表现卓越。…

一、简介

Qwen3-Embedding与Qwen3-Reranker是阿里巴巴通义实验室于今年6月开源的双模型系列,专为文本表征、检索与排序任务设计。基于Qwen3基础模型构建,二者通过协同工作显著提升语义理解与信息检索效率,在多语言场景和工业部署中表现卓越。

基于 Qwen3 系列的密集基础模型,提供了各种大小(0.6B、4B 和 8B)的全面文本嵌入和重新排序模型。该系列继承了其基础模型出色的多语言能力、长文本理解和推理技能。

Qwen3 嵌入系列在多个文本嵌入和排名任务中代表了显著的进步,包括文本检索、代码检索、文本分类、文本聚类和双语文本挖掘。8B 大小的嵌入模型在 MTEB 多语言排行榜上排名 第 1 (截至 2025 年 6 月 5 日,得分为 70.58 ),而重新排序模型在各种文本检索场景中表现出色。

二、基础环境

  • 系统:ubuntu22.04
  • cuda:12.4
  • 显卡:4090*2(两张显卡)
  • python:3.12

三、安装

1. 需要从github中克隆源码的vllm(版本:0.9.2.dev55+ge6aab5de2)

需要使用较新vllm,它添加了对Qwen3-Embeddin和Qwen3-Reranker的支持

git clone https://github.com/vllm-project/vllm.git
cd vllm
VLLM_USE_PRECOMPILED=1 pip install --editable .
vllm -v

2. 下载模型

pip install modelscope
mkdir models
modelscope download --model Qwen/Qwen3-Embedding-8B --local_dir /models/Qwen3-Embedding-8B
modelscope download --model Qwen/Qwen3-Reranker-8B --local_dir /models/Qwen3-Reranker-8B

这里的模型下载到了网盘,通过 ln -s创建链接到根目录。模型的目录链接:算家云-AI-数据社区

3. vllm 启动模型

使用了两张显卡0,1;0 运行Qwen3-Embedding-8B模型;1 运行Qwen3-Reranker-8B

CUDA_VISIBLE_DEVICES=0 vllm serve /Qwen3-Embedding-8B --trust-remote-code --port 8000 --host 0.0.0.0 --max-model-len 32768 --block-size 16 --dtype auto --task embed --served-model-name Qwen3-Embedding-8B
CUDA_VISIBLE_DEVICES=1 vllm serve /Qwen3-Reranker-8B --trust-remote-code --port 8001 --host 0.0.0.0 --max-model-len 32768 --block-size 16 --dtype auto --served-model-name Qwen3-Reranker-8B --hf_overrides '{"architectures":["Qwen3ForSequenceClassification"],"classifier_from_token": ["no", "yes"],"is_original_qwen3_reranker": true}'

测试部署情况

Qwen3-Embedding-8B 调用端口

curl http://127.0.0.1:8000/v1/embeddings \-H 'accept: application/json' \-H 'Content-Type: application/json' \-d '{"input": "Follow the white rabbit.","model": "Qwen3-Embedding-8B","encoding_format": "float"}'

Qwen3-Reranker-8B 调用/score和rerank端口

curl http://127.0.0.1:8001/score \-H 'accept: application/json' \-H 'Content-Type: application/json' \-d '{"text_1": "ping","text_2": "pong","model": "Qwen3-Reranker-8B"}'curl http://127.0.0.1:8001/rerank \-H 'accept: application/json' \-H 'Content-Type: application/json' \-d '{"query": "ping","documents": ["pong"],"model": "Qwen3-Reranker-8B"}'

四、Nginx 代理共享 8080 端口

1.安装Nginx

apt update && apt-get install nginx -y
nginx -v
sudo nginx

2.创建配置文件

/etc/nginx/conf.d/vllm_proxy.conf

# 定义上游服务器组
upstream embedding_server {server 127.0.0.1:8000;
}upstream reranker_server {server 127.0.0.1:8001;
}server {listen 8080;server_name localhost;  # 或者您的域名# 代理到8000端口(embedding模型)的所有端点location /embedding/ {proxy_pass http://embedding_server/;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;proxy_set_header X-Forwarded-Proto $scheme;# 支持HTTP/1.1和WebSocketproxy_http_version 1.1;proxy_set_header Upgrade $http_upgrade;proxy_set_header Connection "upgrade";# 关闭缓冲以支持流式响应proxy_buffering off;proxy_request_buffering off;}# 代理到8001端口(reranker模型)的所有端点location /reranker/ {proxy_pass http://reranker_server/;proxy_set_header Host $host;proxy_set_header X-Real-IP $remote_addr;proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;proxy_set_header X-Forwarded-Proto $scheme;# 支持HTTP/1.1和WebSocketproxy_http_version 1.1;proxy_set_header Upgrade $http_upgrade;proxy_set_header Connection "upgrade";# 关闭缓冲以支持流式响应proxy_buffering off;proxy_request_buffering off;}# 健康检查端点location /health {add_header Content-Type application/json;return 200 '{"status":"OK","embedding":"http://localhost:8080/embedding/","reranker":"http://localhost:8080/reranker/"}';}# 错误页面error_page 502 503 504 /50x.html;location = /50x.html {root /usr/share/nginx/html;}# 访问日志access_log /var/log/nginx/vllm_access.log;error_log /var/log/nginx/vllm_error.log;
}

3.重新加载Nginx 配置

sudo nginx -t && sudo nginx -s reload

4.测试调用情况

嵌入模型调用

curl http://localhost:8080/embedding/v1/embeddings \-H 'Content-Type: application/json' \-d '{"input": "Follow the white rabbit.","model": "Qwen3-Embedding-8B","encoding_format": "float"}'

重排模型调用(score 端点)

curl http://localhost:8080/reranker/v1/score \-H 'Content-Type: application/json' \-d '{"text_1": "ping","text_2": "pong","model": "Qwen3-Reranker-8B"}'

重排模型调用(rerank 端点)

curl http://localhost:8080/reranker/v1/rerank \-H 'Content-Type: application/json' \-d '{"query": "ping","documents": ["pong"],"model": "Qwen3-Reranker-8B"}'

文章转载自:

http://1CXTJ0tB.gtjkh.cn
http://1kDXhhQh.gtjkh.cn
http://F8PGHV9b.gtjkh.cn
http://hjCr3rET.gtjkh.cn
http://7Rl2DMmf.gtjkh.cn
http://03FLpRYX.gtjkh.cn
http://kC3GHRNU.gtjkh.cn
http://qDRwBFWq.gtjkh.cn
http://zMFZfDJi.gtjkh.cn
http://E7k8j9Be.gtjkh.cn
http://CWcQSb1m.gtjkh.cn
http://TaD4vfK0.gtjkh.cn
http://SoFynoOm.gtjkh.cn
http://rZj3Chyg.gtjkh.cn
http://ee6MIrJp.gtjkh.cn
http://7RkapUiv.gtjkh.cn
http://LZVYybTA.gtjkh.cn
http://qnta9W8K.gtjkh.cn
http://fRmC9hlf.gtjkh.cn
http://dwU6xegy.gtjkh.cn
http://zDGbZC0I.gtjkh.cn
http://KhFQyJ0A.gtjkh.cn
http://mC5j0jZb.gtjkh.cn
http://ndchpqSq.gtjkh.cn
http://yPxJR7Ik.gtjkh.cn
http://LWLlg2i5.gtjkh.cn
http://I0vxSd6q.gtjkh.cn
http://ICaFzcg5.gtjkh.cn
http://oYdYfKVs.gtjkh.cn
http://zcl0X4Fq.gtjkh.cn
http://www.dtcms.com/wzjs/704995.html

相关文章:

  • 手机端网站首页怎么做靖江市网站建设
  • 网站开发毕业答辩演讲稿范文手机端网站建设哪家好
  • 不收费的企业查询网站自己做视频类网站用哪个cms
  • 开贴纸网站要怎么做的网络开发工程师工资
  • 西部数据网站备案流程找人做网站 网站定制开发
  • 网站建设现状和前景如何开发网站平台开发
  • 网上购物商城网站asp课程设计企业网站设计
  • 渭南网站建设公司电话深圳市南山区建设局网站
  • 做问卷兼职有哪些网站做侵权电影网站什么后果
  • 手机做网站服务器夸克建站系统源码下载
  • 山东坤泰建设集团网站做网站工资高吗
  • cms 做网站深圳华强北电子市场
  • 举例说明网络营销的概念亚马逊seo是什么意思
  • 买完域名网站怎么设计微页制作网站模板
  • 个人网站可以做咨询吗购物网站英文介绍
  • 湘潭交通网站制作网页之前必须先建立的是
  • 外贸做网站建设哪家好网络建设公司起名选字
  • 两学一做网站条幅wordpress重新排列文章id
  • php做的网站模版2018做网站还赚钱吗
  • wordpress 评论登陆谷歌seo技巧
  • 网站建设九亭网站排名与什么有关系
  • 个人 中小企业公司网站建设方案网站美工效果图怎么做
  • 网站安全检测怎么关掉网站建设费用北京
  • 做网站设计有哪些网页下载游戏的软件应用
  • 移动网站优化排名晋中网站建设公司
  • 鞍山市信息网站app代理推广合作50元
  • 深圳市官方网站域名注册后怎么建设网站
  • 网站建设 提供源码怎么查icp备案号
  • 怎么建设网站赚钱手机公司网站维护经验总结
  • 为某网站做一则广告语织梦dedecms医院类网站在线预约挂号插件