当前位置: 首页 > news >正文

本地部署DeepSeek-R1(Dify压力测试和性能调优)

安装压测软件

为了有效测试,应在局域网设备测试,我这里用的服务器是局域网内的Ubuntu,下载的压测软件是WRK

apt install wrk

测试脚本

为了省事我直接在/root目录下新建lua脚本

vim test.lua

脚本内容如下,app-xxxx更换为你工作流的API密钥

wrk.method = "POST"
wrk.body = '{"inputs":{"query":"1"},"response_mode":"streaming","user":"dcf压测"}'
wrk.headers["Content-Type"] = "application/json"
wrk.headers["Authorization"] = "Bearer app-08mesPqsdYfybwN6iIjyVcji"

新建测试工作流

这里只新建了个空的工作流直接返回user_id,不加大模型,加上模型有其他延迟

API密钥在检测里面创建

在这里插入图片描述

开始压测

测试命令

wrk -t50 -c200 -d20s -s test.lua --timeout 10s --latency http://192.168.11.119/v1/workflows/run

【测试20线程,200个链接,持续20秒,持续请求工作流10秒】
平均延迟:251.70毫秒,最大延迟:1.79秒,QPS:每秒851次

在这里插入图片描述

性能调优

修改工作进程数量参数SERVER_WORKER_AMOUNT,默认为1,官方参考公式:cpu核数*2+1。

我这里是CPU64核,256G内存,试了一下调成129,Dify有点动不了,然后我改成了65(每次修改.env文件参数需重启Dify)

#将默认的1参数改大,参考cpu核数*2+1

SERVER_WORKER_AMOUNT=65

在这里插入图片描述

再压测一下,明显快了很多

在这里插入图片描述

性能上来了,但是返现Dify里面的所有应用会提示报错:Internal Server Error

在这里插入图片描述

同时返回了很多非2XX和3XX响应,还需要修改连接池数量参数,避免超过连接数

我这里将SQLALCHEMY_POOL_SIZE、POSTGRES_MAX_CONNECTIONS、SQLALCHEMY_MAX_OVERFLOW三个参数全部调到了3000,默认30、100能不超过吗。

SQLALCHEMY_POOL_SIZE=3000
POSTGRES_MAX_CONNECTIONS=3000
#注意默认.env配置文件里没有SQLALCHEMY_MAX_OVERFLOW这个参数,需手动添加
SQLALCHEMY_MAX_OVERFLOW=3000

重启Dify再测试,测一次1700+个对话

在这里插入图片描述

http://www.dtcms.com/a/106133.html

相关文章:

  • GOAT‘S AI早鸟报Part11
  • 在Thinkphp中使用JWT 包括JWT是什么,JWT的优势
  • Crypto加密货币生态构成及较有前景的几个crypto项目
  • uniapp -- 列表垂直方向拖拽drag组件
  • Python第七章05:文件操作综合练习题
  • 游戏引擎学习第198天
  • ②EtherCAT/Ethernet/IP/Profinet/ModbusTCP协议互转工业串口网关
  • JsonCpp 处理 JSON(现代 C++ 方案)(三)
  • WPF基础知识
  • 关于VUE中v-model响应式失效的问题
  • Spring相关面试题总结
  • docker打包使用有头模式playwright
  • 【开题报告+论文+源码】基于springboot加vue 前后端分离的校园新闻审核发布管理系统
  • 鸿蒙NEXT小游戏开发:记忆翻牌
  • 网络攻防快速入门笔记pwn | 02 栈溢出题型 | 2.3 ret2syscall
  • 【C++进阶四】vector模拟实现
  • 蓝桥杯省模拟赛 数位和
  • 使用LangChain Agents构建Gradio及Gradio Tools(3)——使用Langchain agents构建Gradio UI
  • AI-人工智能-多模态学习助力精准预测心脏毒性
  • 使用Hugging Face训练自定义重排模型(Reranker)完全指南
  • 2024年蓝桥杯Java B组省赛真题超详解析-分布式队列
  • Docker中安装MySQL--------【详细图解】
  • Vue2函数式组件实战:手写可调用的动态组件,适用于toast轻提示、tip提示、dialog弹窗等
  • 掌握AI营销:移动营销的新动力
  • c++:哈希表
  • GPT-4o推出的原生图像生成功能升级后有点东西!
  • 世界通信大会、嵌入式展及慕尼黑上海光博会亮点回顾
  • 手绘风格流程图工具:简单高效的在线流程图绘制工具
  • C语言复习笔记--指针(1)
  • echarts+HTML 绘制3d地图,加载散点+散点点击事件