当前位置: 首页 > wzjs >正文

优秀旅游网站设计鹤壁北京网站建设

优秀旅游网站设计,鹤壁北京网站建设,东莞微信网站建设推荐,国家高新技术企业名录沉湎过往,恐惧将来,都不如珍惜眼前。 往昔是烟,明日是雾,当下才是实实在在的生活。 一、BGE-M3 模型 BGE-M3(BAAI General Embedding-M3)是北京智源人工智能研究院(BAAI)推出的多语…

沉湎过往,恐惧将来,都不如珍惜眼前。 往昔是烟,明日是雾,当下才是实实在在的生活。

一、BGE-M3 模型

BGE-M3(BAAI General Embedding-M3)是北京智源人工智能研究院(BAAI)推出的多语言、多功能文本嵌入模型,支持稠密检索、稀疏检索和多向量检索三种模式。该模型基于大规模预训练,适用于跨语言语义匹配、信息检索等任务,在 MTEB 等基准测试中表现优异。

二、Docker 与 vLLM 的作用

Docker 提供容器化环境,解决依赖冲突和部署一致性问题,适合快速部署复杂模型。
vLLM 是高效推理框架,针对大语言模型优化,支持高吞吐量推理和显存管理,能加速 BGE-M3 这类大规模模型的本地运行。

三、本地运行的核心优势

  1. 隐私保护:数据无需上传云端,适合敏感场景。
  2. 定制化:可调整模型参数或微调以适应特定任务。
  3. 成本可控:长期使用比云服务成本更低。

此方案适合开发者、研究人员快速验证 BGE-M3 能力,或集成到本地 NLP pipeline 中。

四、Docker 安装与配置

下载并执行 Docker 官方安装脚本:

curl -fsSL https://get.docker.com -o get-docker.sh
sudo sh get-docker.sh# 启动Docker服务
sudo systemctl start docker
sudo systemctl enable docker

配置国内 Docker 镜像源与 GPU:

vim /etc/docker/daemon.json
{"dns": ["8.8.8.8","8.8.4.4"],"registry-mirrors": ["https://docker.m.daocloud.io/","https://huecker.io/","https://dockerhub.timeweb.cloud","https://noohub.ru/","https://dockerproxy.com","https://docker.mirrors.ustc.edu.cn","https://docker.nju.edu.cn","https://registry.docker-cn.com","http://hub-mirror.c.163.com"],"runtimes": {"nvidia": {"args": [],"path": "nvidia-container-runtime"}}
}

五、使用 vLLM 官方 Docker 镜像

vLLM 提供了用于部署的官方 Docker 镜像,该镜像可用于运行与 OpenAI 兼容的服务器,官方示例脚本如下:

docker run --runtime nvidia --gpus all \-v ~/.cache/huggingface:/root/.cache/huggingface \--env "HUGGING_FACE_HUB_TOKEN=<secret>" \-p 8000:8000 \--ipc=host \vllm/vllm-openai:latest \--model mistralai/Mistral-7B-v0.1

官方脚本从 huggingface 下载模型,可能会遇到网络问题,因此我们从 modelscope 下载 bge-m3,对脚本修改一点点细节:

docker run --name bge-m3 -d --runtime nvidia --gpus all \-v ~/.cache/modelscope:/root/.cache/modelscope \--env "VLLM_USE_MODELSCOPE=True" \-p 8000:8000 \--ipc=host \vllm/vllm-openai:latest \--model BAAI/bge-m3  \--gpu_memory_utilization 0.9

这里我们可以使用 ipc=host 标志或 --shm-size 标志来允许容器访问主机的共享内存。vLLM 使用 PyTorch,它在底层使用共享内存来在进程之间共享数据,特别是对于张量并行推理。镜像标签 (vllm/vllm-openai:latest) 之后添加引擎参数 (engine-args)。

在这里插入图片描述

六、文本嵌入测试

from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings
from langchain_core.vectorstores import InMemoryVectorStore
import os# 设置环境变量
os.environ["OPENAI_BASE_URL"] = "http://localhost:8000/v1"
os.environ["OPENAI_API_KEY"] = "EMPTY"# 加载文档
file_path = "../langchain/data/0001.pdf"
loader = PyPDFLoader(file_path)
docs = loader.load()
print(f"文档页数:{len(docs)} 页")# 切割文档
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=100, add_start_index=True
)
all_splits = text_splitter.split_documents(docs)len(all_splits)# 嵌入模型
embeddings = OpenAIEmbeddings(model="BAAI/bge-m3")# 向量存储
vector_store = InMemoryVectorStore(embeddings)
ids = vector_store.add_documents(documents=all_splits)#向量查询
results = vector_store.similarity_search("混凝土"
)print(results[0])

运行效果:

在这里插入图片描述

七、GPU 使用情况

nvidia-smi

在这里插入图片描述

参考文档

  • https://docs.vllm.com.cn/en/latest/deployment/docker.html
  • https://modelscope.cn/models/BAAI/bge-m3/summary
  • https://www.runoob.com/docker/ubuntu-docker-install.html

文章转载自:

http://yvvE6qJn.frsxt.cn
http://4MzX1Few.frsxt.cn
http://56lIHvL9.frsxt.cn
http://mPzhZoKJ.frsxt.cn
http://38deN8AU.frsxt.cn
http://HBREuEJo.frsxt.cn
http://4fk2LN8k.frsxt.cn
http://bHBTs0kw.frsxt.cn
http://r3HPFji3.frsxt.cn
http://pp8K0TE2.frsxt.cn
http://GG9CmUZM.frsxt.cn
http://qSYUdZbm.frsxt.cn
http://DRVNGcUq.frsxt.cn
http://f4RLoW4t.frsxt.cn
http://Tky75USi.frsxt.cn
http://s1Fos9YK.frsxt.cn
http://8U1iWjMk.frsxt.cn
http://0B8g6bA0.frsxt.cn
http://i4FSNx5g.frsxt.cn
http://xYBgMGBg.frsxt.cn
http://5JwBEnJc.frsxt.cn
http://k3TCNe6u.frsxt.cn
http://znfVnZsS.frsxt.cn
http://p6iS8pPK.frsxt.cn
http://94JgEJ41.frsxt.cn
http://pjkLCOF0.frsxt.cn
http://XpyrEbxv.frsxt.cn
http://4jLBo2GG.frsxt.cn
http://nhpKtcd7.frsxt.cn
http://pk97cVVf.frsxt.cn
http://www.dtcms.com/wzjs/609480.html

相关文章:

  • 婚纱网站开发站酷网官网
  • 网站后台如何上传图片阿里关键词排名查询
  • 平面设计模板素材网站百度上怎么发布信息啊
  • 电脑上不了建设厅网站做网站为什么要做备案接入
  • 有没有教做蛋糕的网站腾讯网
  • 安徽苏亚建设安装有限公司网站网站建设公司位置
  • 做网站怎么兼职金桥网站建设
  • 建设网站的重要意义硬件开发设计公司
  • 网站开发需求说明书电商网站开发平台哪家好
  • 网站建设需要些什么设备爱心代码编程python
  • 做服务器的网站的模板企业网站建设费用属于什么科目
  • 网站建设案例方案网站联盟接口怎么做
  • phpnow搭建本地网站wordpress作者权限
  • 网站防止被采集网站搭建中单页面
  • 常见的网站建设技术苏州商城网站建设电话
  • WordPress搭建交互式网站导航网站怎么做seo
  • 做推广的网站需要注意什么北京知名vi设计公司
  • 网站后期维护需要注意什么禁用软件app大全
  • 彩神app官方网站开发网站建设都有哪些书
  • 网站开发如何报价大型网页设计服务公司
  • 郑州手机网站制作公司安徽服饰网站建设
  • 新增备案网站要关闭吗通江移动网站建设
  • 嵌入式软硬件开发广州seo优化
  • 深圳网络广告推广公司seo网站建设教程
  • 珠海电子商务网站建设中国电力建设公司排名
  • 有几家做网站的公司网站建设上线
  • 宝安国内知名网站建设比较好的ftp查看网站后台密码
  • 菏泽住房和城乡建设部网站外贸网站建设公司服务
  • 建立问答类的网站上海平台网站建设平台
  • 网站做百度收录的意义网站建设 域名 空间