当前位置: 首页 > news >正文

【xinference 词嵌入】embbeding 使用教程

1、使用openai 方式调用embbeding 模型

import openai
# 创建客户端
client = openai.Client(api_key="not empty", base_url="http://192.168.8.9:9997/v1")
response = client.embeddings.create(
    # 必须与Xinference启动的Model UID完全一致
    model="bge-m3_local",
    input=texts
)

# 获取向量结果
doc_embeddings = [data.embedding for data in response.data]
embedding_dim=len(doc_embeddings[0])
print(f"向量维度:{embedding_dim}")  # 输出如1024

2、使用xinference

# 创建客户端(xinference)
client = Client("http://192.168.8.9:9997")
model  = client.get_model("bge-m3_local")
response = model.create_embedding(texts)
time3=time.time()
print("创建客户端耗时:%s" %(time3-time2))

doc_embeddings=[data['embedding'] for data in response['data']]
embedding_dim=len(doc_embeddings[0])
print(f"向量维度:{embedding_dim}")  # 输出如1024
http://www.dtcms.com/a/38513.html

相关文章:

  • 大白话Vue 双向数据绑定的实现原理与数据劫持技术
  • 【10】RUST的迭代器与闭包
  • Proof Beyond Boundaries: Hong Kong zkNight 活动精彩回顾
  • 零样本学习 zero-shot
  • LeetCodehot 力扣热题100 全排列
  • 《Keras 3 使用 PointNet 进行点云分类》:此文为AI自动翻译
  • Ubuntu指令(一)
  • SVT-AV1接入ffmpeg说明
  • SSM和SpringBoot有什么区别?
  • Spring 框架学习笔记:从零到精通的 21 个关键点
  • pyautogui库的screenshot()函数
  • python poetry添加某个git仓库的某个分支
  • 学习FreeRTOS推荐几篇质量高的文章
  • 6. grafana的graph简介
  • Android Realm数据库使用与集成指南
  • el-form中使用el-select,下拉框出现错位
  • 【Kimi】自动生成PPT-并支持下载和在线编辑--全部免费
  • 【我的 PWN 学习手札】IO_FILE 之 劫持vtable到_IO_str_jumps
  • LeetCode - 24 两两交换链表中的节点
  • PHP入门基础学习七(函数3)
  • WIn32 笔记:本专栏课件
  • Oracle管理员高级操作的详细步骤说明,涵盖性能优化、安全管理、高可用性配置等核心内容
  • Halcon 3D加快表面匹配速度
  • [深度学习]基于C++和onnxruntime部署yolov12的onnx模型
  • Git add --- error: Filename too long
  • 代码随想录DAY35|01背包问题、416. 分割等和子集
  • DeepSeek开源周Day1:重磅发布FlashMLA,重新定义AI推理效率天花板
  • AI顿悟之旅 - 1 - DeepSeek的训练方法为什么相比GPT-o1大幅度减少算力资源?
  • Windows与Ubuntu安装MySQL
  • Sqlserver安全篇之_隐藏实例功能和禁用SQL Server Browser服务