当前位置: 首页 > news >正文

【阿里云PAI平台】 如何在Dify调用阿里云模型在线服务 (EAS)

目录

    • 1. 总述
    • 2.前置环节
    • 3.创建模型在线服务(EAS)实例
    • 4.本地Dify接入模型在线服务 (EAS)

1. 总述

介绍如何部署阿里云PAI平台上的大模型,在本地服务器的dify如何直接调用部署在的阿里云上的大模型。

2.前置环节

  • 目前已经在阿里云PAI平台上申请了OSS空间或者NAS空间,并且在空间内已经存在大模型的权重文件(可以直接下载开源的大模型权重,或者在PAI平台上进行微调训练后保存的大模型权重)
    在这里插入图片描述

  • 已经配置好

3.创建模型在线服务(EAS)实例

在左侧菜单栏找到模型在线服务(EAS),然后在右侧点击部署服务按钮;
在这里插入图片描述

然后选择自定义部署:
在这里插入图片描述

然后选择镜像配置,推荐使用微调大模型时的镜像环节;
本人使用LLama-factory lora微调Qwen2.5-VL-7B的模型,镜像选择的是官方的vllm:0.9.1-xpu1.6.0
在这里插入图片描述
然后挂载OSS或者NAS空间
在这里插入图片描述

然后在运行指令输入运行大模型的指令:

VLLM_SKIP_SAMPLER_CPU_WARMUP=1 python -m vllm.entrypoints.openai.api_server --served-model-name [大模型应用名称] --model [大模型权重的文件目录] -tp 2 --gpu-memory-utilization=0.9 --max-model-len 32768

具体参数的含义可以查询官方文档
在这里插入图片描述
然后需要设置模型接入:
在这里插入图片描述
部署完成后就可以在公网访问,没有开通过服务的需要付费开通网络服务,根据提示来就可以;

然后点击部署按钮,等待几分钟,就可成功运行;
运行成功后,点击名称按钮:
在这里插入图片描述
然后点击概览页面的查看调用信息按钮:
在这里插入图片描述

然后复制公网调用地址信息,这就是大模型的API endpoint URL;
复制Token信息,这就是大模型的API Key;
在这里插入图片描述

4.本地Dify接入模型在线服务 (EAS)

登录到本地的Dify平台,点击右上角用户按钮,然后点击设置按钮:
在这里插入图片描述
然后点击模型供应商,然后再选择OpenAI-API-compatible,点击显示模型,如果没有可以添加该模型供应商;
在这里插入图片描述
然后点击添加模型按钮
在这里插入图片描述

选择LLM模型
模型名称填写EAS部署时,运行指令定义的大模型应用名称
VLLM_SKIP_SAMPLER_CPU_WARMUP=1 python -m vllm.entrypoints.openai.api_server --served-model-name [大模型应用名称] --model [大模型权重的文件目录] -tp 2 --gpu-memory-utilization=0.9 --max-model-len 32768
API Key填写EAS服务的概览页面----查看调用信息的Token信息;(第三章最后提到)

API endpoint URL填写EAS服务的概览页面----查看调用信息的公网调用地址信息;(第三章最后提到)
注意:直接复制公网调用地址,可能会报错失败,可以再网址最后加上/V1,再尝试,可以成功访问;
例如:http://xxxxxxxxxxx.yyyyyyyyy.cn-shanghai.pai-eas.aliyuncs.com/v1
在这里插入图片描述
然后Function calling、Stream function calling、Vision 支持按照实际需求来配置;

然后点击保存按钮之后,模型成功添加,之后能够顺利调用模型;(需要EAS服务处于运行状态)


文章转载自:

http://xwhw1Y4r.jfbbq.cn
http://WPTWxHL0.jfbbq.cn
http://xeYirvGu.jfbbq.cn
http://gmzYJqlq.jfbbq.cn
http://j6yGFd7l.jfbbq.cn
http://7UX24PzG.jfbbq.cn
http://ffpKCBOD.jfbbq.cn
http://86yZnU4T.jfbbq.cn
http://jijQQi65.jfbbq.cn
http://ySB2hlQL.jfbbq.cn
http://bdBq7mYa.jfbbq.cn
http://02iN53Q7.jfbbq.cn
http://wgOgOLYM.jfbbq.cn
http://BMe5STwi.jfbbq.cn
http://vFgi9yno.jfbbq.cn
http://SR2RHL6c.jfbbq.cn
http://pb2MahYN.jfbbq.cn
http://WEQploSk.jfbbq.cn
http://H3okue3v.jfbbq.cn
http://KsxrjjyA.jfbbq.cn
http://7zyGy502.jfbbq.cn
http://lgIwpKDh.jfbbq.cn
http://6oU3LVdO.jfbbq.cn
http://a4uM75aw.jfbbq.cn
http://c79Qp77P.jfbbq.cn
http://iQBhwz0B.jfbbq.cn
http://d3lz2yed.jfbbq.cn
http://gylOW41n.jfbbq.cn
http://JcQtX4Ut.jfbbq.cn
http://YVYfsfGi.jfbbq.cn
http://www.dtcms.com/a/386797.html

相关文章:

  • 省钱自学版一次过阿里云ACP!!!
  • 建立了 abc 联合索引,where a = ? and b = ? order by c 能命中索引吗?
  • 携程线下面试总结
  • 【数据工程】9. Web Scraping 与 Web API
  • Vue3 emit和provide
  • linux C 语言开发 (十二) 进程间通讯--消息队列
  • 报考湖北安全员A证需要哪些条件?
  • olap和oltp类业务
  • 14个免费的DEM数据源
  • 单时段机组组合优化的粒子群算法实现(MATLAB)
  • MATLAB实现语音去混响与去噪
  • 启发式搜索--模拟退火算法 matlab
  • 论文阅读:arixv 2025 One Token to Fool LLM-as-a-Judge
  • 【C++入门】C++基础
  • 10 正则表达式
  • 本地文件->RTSP->HLS->网页播放
  • 148.排序链表,23.合并K个升序链表
  • 思特威CMOS sensor rbrow寄存器设置需要注意的事项(二)
  • 物联网精准节能平台:工厂“数字大脑”如何让节能更智能?
  • Java进阶教程,全面剖析Java多线程编程,实现Callable接口实现多线程,笔记05
  • Windows Server Web 服务器安全防护(开放 HTTP端口,限制恶意 IP)
  • 深度学习:从预备知识到未来展望
  • 数据库(五)MySQL的数据备份
  • linux的tar命令详细使用
  • 德克西尔断链保护器:守护工业生产的“安全屏障”
  • 自动化脚本的核心引擎
  • 【LeetCode 每日一题】3025. 人员站位的方案数 I——(解法一)暴力枚举
  • α-β-γ 滤波器推导(例 1:均值滤波的递推形式)
  • el-upload上传文件自定义
  • 只有select权限,确实也可以for update锁表