当前位置: 首页 > news >正文

【xinference 词嵌入】embbeding 使用教程

1、使用openai 方式调用embbeding 模型

import openai
# 创建客户端
client = openai.Client(api_key="not empty", base_url="http://192.168.8.9:9997/v1")
response = client.embeddings.create(
    # 必须与Xinference启动的Model UID完全一致
    model="bge-m3_local",
    input=texts
)

# 获取向量结果
doc_embeddings = [data.embedding for data in response.data]
embedding_dim=len(doc_embeddings[0])
print(f"向量维度:{embedding_dim}")  # 输出如1024

2、使用xinference

# 创建客户端(xinference)
client = Client("http://192.168.8.9:9997")
model  = client.get_model("bge-m3_local")
response = model.create_embedding(texts)
time3=time.time()
print("创建客户端耗时:%s" %(time3-time2))

doc_embeddings=[data['embedding'] for data in response['data']]
embedding_dim=len(doc_embeddings[0])
print(f"向量维度:{embedding_dim}")  # 输出如1024

相关文章:

  • 大白话Vue 双向数据绑定的实现原理与数据劫持技术
  • 【10】RUST的迭代器与闭包
  • Proof Beyond Boundaries: Hong Kong zkNight 活动精彩回顾
  • 零样本学习 zero-shot
  • LeetCodehot 力扣热题100 全排列
  • 《Keras 3 使用 PointNet 进行点云分类》:此文为AI自动翻译
  • Ubuntu指令(一)
  • SVT-AV1接入ffmpeg说明
  • SSM和SpringBoot有什么区别?
  • Spring 框架学习笔记:从零到精通的 21 个关键点
  • pyautogui库的screenshot()函数
  • python poetry添加某个git仓库的某个分支
  • 学习FreeRTOS推荐几篇质量高的文章
  • 6. grafana的graph简介
  • Android Realm数据库使用与集成指南
  • el-form中使用el-select,下拉框出现错位
  • 【Kimi】自动生成PPT-并支持下载和在线编辑--全部免费
  • 【我的 PWN 学习手札】IO_FILE 之 劫持vtable到_IO_str_jumps
  • LeetCode - 24 两两交换链表中的节点
  • PHP入门基础学习七(函数3)
  • 特朗普促卡塔尔说服伊朗放弃核计划,伊朗总统:你来吓唬我们?
  • 鸿海下调全年营收展望:AI服务器业务强劲,预计今年营收增超50%
  • 中美是否计划讨论美方以芬太尼为由对华征收的特别关税?外交部回应
  • 特朗普访中东绕行以色列,专家:凸显美以利益分歧扩大
  • 旭辉控股集团主席林中:债务重组是活下来的前提,自营开发业务收缩至少数核心城市
  • 消费维权周报|上周涉手机投诉较多,涉拍照模糊、屏幕漏液等