当前位置: 首页 > news >正文

Docker安装嵌入框架Text Embeddings Inference (TEI)

Docker安装Text Embeddings Inference (TEI)

1 简单介绍

文本嵌入推理(TEI,Text Embeddings Inference )是HuggingFace研发的一个用于部署和服务开源文本嵌入和序列分类模型的工具包。TEI兼容OpenAI的嵌入模型的规范。

# 官网地址
https://hf-mirror.com/docs/text-embeddings-inference/index

# Github地址
https://github.com/huggingface/text-embeddings-inference

2 Docker安装

在线安装

⚠️ 容器会联网自动从Hugging Face把BAAI/bge-reranker-large模型下载到/data的目录下,国内无法直接下载。

docker run -itd \
--name text-embeddings-inference \
--gpus all \
-p 8080:80 \
-v /home/data:/data \
ghcr.io/huggingface/text-embeddings-inference:1.6 \
--model-id BAAI/bge-reranker-large

离线安装

⚠️ 安装方法的思路。

(1)在国内的ModelScope上下载BAAI/bge-reranker-large模型;

(2)将BAAI/bge-reranker-large模型放在宿主机的/home/data目录下(注意不要模型前面的BAAI);

(3)宿主机模型目录:📁/home/data/bge-reranker-large。

# -v:宿主机共享目录, 宿主机目录:"/home/data",容器中的目录"/data"存在模型的目录;
# --model-id:指定模型的路径或者模型编号,对应容器中的"/data"目录
#            其中容器的"/data/bge-reranker-large"对应宿主机"/home/data/bge-reranker-large"

docker run -itd \
--name text-embeddings-inference \
--gpus all \
-p 8080:80 \
-v /home/data:/data \
ghcr.io/huggingface/text-embeddings-inference:1.6 \
--model-id /data/bge-reranker-large

访问rerank接口

curl http://127.0.0.1:8080/rerank \
-X POST \
-H "Content-Type: application/json" \
-d '{
    "query":"What is Deep Learning?", 
    "texts": ["Deep Learning is not...", "Deep learning is..."], 
    "raw_scores": false
}'

在这里插入图片描述

接口文档

# Text Embedding Webserver的Swagger接口
http://192.168.137.64:8080/docs/

在这里插入图片描述

相关文章:

  • 雷池WAF的为什么选择基于Docker
  • Vue | Vue2.x和Vue3.x的双向绑定原理详解
  • web高可用集群项目(数据库主从同步、文件共享存储、nginx动静分离+负载均衡+高可用)
  • 使用 Docker 和 Nginx 高效部署 Web 服务(适用于慈云数据云服务器)
  • Java多线程与高并发专题——ConcurrentHashMap 在 Java7 和 8 有何不同?
  • Linux下学【MySQL】中如何实现:多表查询(配sql+实操图+案例巩固 通俗易懂版~)
  • 仿mudou库one thread oneloop式并发服务器
  • 基于OpenCV的Java人脸识别系统设计与实现
  • 学习笔记:IC存储总结(ROM,RAM, EEPROM, Flash, SRAM, DRAM, DDL)
  • JAVA 学习路线 学习大纲(java 进阶路线)
  • 地下井室可燃气体监测装置:守护地下安全,防患于未“燃”!
  • alloc、malloc 与 allocator:内存管理三剑客
  • 直接法估计相机位姿
  • 【数据结构】什么是栈||栈的经典应用||分治递归||斐波那契问题和归并算法||递归实现||顺序栈和链栈的区分
  • 分布式系统的核心挑战与解决方案
  • Redis 常见数据类型
  • 如何让非 root 用户构建 Docker 镜像
  • .CSV file input into contact of outlook with gibberish. .csv文件导入outlook, 出现乱码
  • 用户权限管控:三种免密切换方案对比
  • [mybatis]resultMap详解
  • 商务部再回应中美经贸高层会谈
  • “80后”海南琼海市长傅晟,去向公布
  • 上海飞银川客机触地复飞后备降西安,亲历者:不少乘客都吐了
  • 上千游客深夜滞留张家界大喊退票?当地通报情况并致歉
  • 五问舆论漩涡中的“协和‘4+4’模式”:是否公平,如何合格?
  • 原油价格战一触即发?沙特不想再忍,领衔多个产油国加速增产