当前位置: 首页 > wzjs >正文

企业网站建设分为那几个阶段网站建设框架图

企业网站建设分为那几个阶段,网站建设框架图,做经营性的网站备案条件,cms大型门户网站回到目录 【部署】手搓一个dify可用的rerank模型接口服务 本地知识库有保密需要,不想上传互联网模型进行rerank处理。但是,vllm部署rerank模型硬件要求高,ollma不支持rerank模型,因此只能考虑按照openai的接口标准写一个rerank的…

回到目录

【部署】手搓一个dify可用的rerank模型接口服务

本地知识库有保密需要,不想上传互联网模型进行rerank处理。但是,vllm部署rerank模型硬件要求高,ollma不支持rerank模型,因此只能考虑按照openai的接口标准写一个rerank的接口程序

1. 安装必要的python基础环境

 $ pip install uv -i https://pypi.tuna.tsinghua.edu.cn/simple$ uv pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple下载量比较大,耗时有点长$ uv pip install modelscope -i https://pypi.tuna.tsinghua.edu.cn/simple$ uv pip install "modelscope[multi-modal]" -i https://pypi.tuna.tsinghua.edu.cn/simple$ uv pip install fastapi uvicorn  -i https://pypi.tuna.tsinghua.edu.cn/simple

2. 测试一下基础环境是否工作正常

$ uv run python -c “from modelscope.pipelines import pipeline;print(pipeline(‘word-segmentation’)(‘今天天气不错,适合 出去游玩’))”

3. 用模型介绍页的案例测试score打分效果

# test_modelscope.pyimport torch
from modelscope import AutoModelForSequenceClassification, AutoTokenizertokenizer = AutoTokenizer.from_pretrained('BAAI/bge-reranker-large')model = AutoModelForSequenceClassification.from_pretrained('BAAI/bge-reranker-large')
model.eval()pairs = [['what is panda?', 'hi'], ['what is panda?', 'The giant panda (Ailuropoda melanoleuca), sometimes called a panda bear or simply panda, is a bear species endemic to China.']]
with torch.no_grad():inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)scores = model(**inputs, return_dict=True).logits.view(-1, ).float()print(scores)
 $ uv run test_modelscope.py
tensor([-5.6085,  5.7623])

启动程序,第一个问题 低分表示问题和答案关联度不高; 第二个问题 高分表示关联度高

4. (本文重点)用fastapi封装一个openai接口标准的rerank模型

# app.pyfrom fastapi import FastAPI
from pydantic import BaseModel
from typing import List, Optional# 假设你已经定义了 RerankAPI 类
from rerank_module import RerankAPI  # 你可以根据实际情况调整 import 路径app = FastAPI()
reranker = RerankAPI()class RerankRequest(BaseModel):query: strdocuments: List[str]top_n: Optional[int] = Nonereturn_documents: bool = True@app.post("/rerank")
def api_rerank(request: RerankRequest):result = reranker.rerank(request.query,request.documents,request.top_n,request.return_documents)return resultif __name__ == "__main__":import uvicornuvicorn.run(app, host="0.0.0.0", port=8000)

上面代码开启8000端口,并调用 rerank_module.py的 rerank() 提供接口服务

# rerank_module.pyimport torch
from modelscope import AutoModelForSequenceClassification, AutoTokenizerclass RerankAPI:def __init__(self, model_name='BAAI/bge-reranker-large'):self.tokenizer = AutoTokenizer.from_pretrained(model_name)self.model = AutoModelForSequenceClassification.from_pretrained(model_name)self.model.eval()def rerank(self, query: str, documents: list, top_n: int = None, return_documents: bool = True):"""对 query 和 documents 进行 rerank,并返回排序后的结果。:param query: 用户查询语句:param documents: 文档列表(字符串数组):param top_n: 返回前 n 个最相关的结果(None 表示全部):param return_documents: 是否在返回中包含原始文档内容:return: 包含 rerank 结果的字典列表,包括 index、document(可选)、relevance_score"""pairs = [[query, doc] for doc in documents]with torch.no_grad():inputs = self.tokenizer(pairs,padding=True,truncation=True,max_length=512,return_tensors='pt')scores = self.model(**inputs).logits.view(-1).float().cpu().numpy()# 构造输出格式results = []for idx, (doc, score) in enumerate(zip(documents, scores)):result = {"index": idx,"relevance_score": float(score)}if return_documents:result["document"] = docresults.append(result)# 按照得分降序排序results.sort(key=lambda x: x["relevance_score"], reverse=True)# 截取 top_nif top_n is not None:results = results[:top_n]return {"results": results}

上面代码按照openai的接口标准,提供rerank排序结果

5. 启动

 $ uv run app.py
INFO:     Started server process [344887]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)

启动正常,8000端口提供服务
在这里插入图片描述
[图3]
fastapi的docs接口显示正常
在这里插入图片描述
[图4]
调用/rerank接口服务,返回正常

6. 在dify前台配置好rerank模型,后续就可以愉快地使用了

在这里插入图片描述
[图1] 增加 openai-api-compatible插件
在这里插入图片描述
[图2]配置rerank模型
在这里插入图片描述

[图5]配置到系统模型

本文完毕

回到目录


文章转载自:

http://Qzo4vwHp.wzdjL.cn
http://zdkFMXEo.wzdjL.cn
http://v7F2o2Oq.wzdjL.cn
http://ZKc7bm82.wzdjL.cn
http://Ghx9DNs6.wzdjL.cn
http://Fu0YzfbJ.wzdjL.cn
http://XAY377pL.wzdjL.cn
http://xLnjAssk.wzdjL.cn
http://hRUxLSCH.wzdjL.cn
http://I60g1xcp.wzdjL.cn
http://S7Ak6RAf.wzdjL.cn
http://WRsJOr3t.wzdjL.cn
http://iiBz2qv0.wzdjL.cn
http://9k7qG6Jk.wzdjL.cn
http://WNxNX8Up.wzdjL.cn
http://wmX4vdKm.wzdjL.cn
http://V79FTpeB.wzdjL.cn
http://1EfJPFo3.wzdjL.cn
http://x1hWiUXG.wzdjL.cn
http://KOtz85FP.wzdjL.cn
http://hJa2t37g.wzdjL.cn
http://Tpw894C2.wzdjL.cn
http://gG6If8ZQ.wzdjL.cn
http://f3zMv0hm.wzdjL.cn
http://JaXVPbmU.wzdjL.cn
http://f77ZZCyq.wzdjL.cn
http://Aqadyb1D.wzdjL.cn
http://je51hxCG.wzdjL.cn
http://E5vFCfxD.wzdjL.cn
http://cYXZCjOM.wzdjL.cn
http://www.dtcms.com/wzjs/776667.html

相关文章:

  • 制作自己的网页代码东莞seo优化平台
  • 网站建设网页模板温州网站建设
  • 温岭新站seowordpress 插件放在那
  • 本地网站建设多少钱信息大全wordpress登录工具
  • 做网站l价格残疾人无障碍网站建设
  • 商业网站导航怎么做湖北自适应网站建设报价
  • 网站建设管理工作计划深圳网站建设工作室
  • 建俄语网站wordpress运行速度
  • 城乡建设部网站自助商品房网上开店怎么注册
  • 安庆市网站建设制作2022年度最火关键词
  • 合肥如何做百度的网站wordpress展现备案号
  • 格尔木市建设局网站腾讯云部署wordpress
  • 襄阳网站建设公司哪家好如何做一个完整的网站
  • 织梦高端html5网站建设工作室网络公司网站模板折页在线设计平台
  • 网站建设立项报告制作网页心得体会
  • 永久免费自助建网站莱芜杂谈莱芜在线论坛
  • 不用下载的行情网站wordpress免费虚拟主机
  • 网站页面维护上海影视公司
  • 各大网站logo图标网站的v2信誉认证怎么做
  • 信息空间网站好优化外贸网站
  • 网站进入考核期要多久网站空间配置
  • 企业品牌推广网站安卓应用市场官方版下载
  • 宝安网站制作培训wordpress登陆接口
  • 手机如何翻到国外网站wordpress不买域名可以吗
  • 在门户网站做产品单页多少钱一天花都网站设计都
  • 网站设计的英文网站开发容易学吗
  • 怎么做 在线电影网站梧州住房和建设局网站
  • 珠海网站建设公做百度网站优化多少钱
  • 昌平建设网站怎么判断是不是外包公司
  • 宁夏公路建设局网站wordpress数据库命名