当前位置: 首页 > news >正文

【vllm】Qwen2.5-VL-72B-AWQ 部署记录

版本:0.7.2
注意事项:

export LD_LIBRARY_PATH=/home/xxxxx/anaconda3/envs/xxxxx/lib/python3.10/site-packages/nvidia/nvjitlink/lib:$LD_LIBRARY_PATH # 如果报错可能需要

Also pip install --force-reinstall git+https://github.com/huggingface/transformers.git@9985d06add07a4cc691dc54a7e34f54205c04d40  # 需要安装特定版本的transformer

服务端

PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True python -m vllm.entrypoints.openai.api_server \
  --model hf_models/Qwen/Qwen2.5-VL-72B-Instruct-AWQ \
  --tensor-parallel-size 4 \
  --gpu-memory-utilization 0.8 \
  --max-model-len 8192 \
  --quantization awq \
  --dtype float16 \
  --enforce-eager \
  --trust-remote-code \
  --host 0.0.0.0 \
  --port 8678 \
--api-key olllllama

客户端


import base64
from openai import OpenAI

use_vision = True 

if use_vision:
    # 读取图片文件并转换为base64
    with open("./vision_test_50x50_enlarged.png", "rb") as image_file:
        base64_image = base64.b64encode(image_file.read()).decode('utf-8')
    
    messages = [
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "这图片里面有什么?"
                },
                {
                    "type": "image_url",
                    "image_url": {"url": f"data:image/png;base64,{base64_image}"}
                }
            ]
        }
    ]
else:
    messages = [
        {"role": "user", "content": "你是谁"}
    ]


client = OpenAI(
    base_url="http://localhost:8678/v1",
    api_key="olllllama",
)

completion = client.chat.completions.create(
  model="hf_models/Qwen/Qwen2.5-VL-72B-Instruct-AWQ",
  messages=messages
)

print('='*40)
print(completion.choices[0].message.content)
print('='*40)
print(completion.choices[0].message)
print('='*40)

输出

========================================
这张图片展示了一个简单的图形设计。图片的背景是白色的,中间有一条黑色的十字线,将图片分成四个相等的部分。在每个部分的中心位置,分别有一个不同颜色的小正方形:

- 左上角是一个红色的正方形。
- 右上角是一个绿色的正方形。
- 左下角是一个蓝色的正方形。
- 右下角是一个灰色的正方形。

这些正方形看起来是对称放置的,整个设计简洁明了。
========================================
ChatCompletionMessage(content='这张图片展示了一个简单的图形设计。图片的背景是白色的,中间有一条黑色的十字线,将图片分成四个相等的部分。在每个部分的中心位置,分别有一个不同颜色的小正方形:\n\n- 左上角是一个红色的正方形。\n- 右上角是一个绿色的正方形。\n- 左下角是一个蓝色的正方形。\n- 右下角是一个灰色的正方形。\n\n这些正方形看起来是对称放置的,整个设计简洁明了。', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=[], reasoning_content=None)
========================================

相关文章:

  • Webshell原理与利用
  • 天津大学:《深度解读DeepSeek:部署、使用、安全》
  • 仅仅使用pytorch来手撕transformer架构(2):多头注意力MultiHeadAttention类的实现和向前传播
  • 侯捷 C++ 课程学习笔记:C++内存管理机制
  • Qt 初识
  • Unity Android出包
  • Mysql高频面试题
  • Gemini 2.0 Flash
  • AQS及派生类
  • AI日报 - 2025年3月11日
  • Spring Cloud 负载均衡器架构选型
  • 什么是 MyBatis? 它的优点和缺点是什么?
  • [NewStarCTF 2023 公开赛道]ez_sql1 【sqlmap使用/大小写绕过】
  • 万字技术指南STM32F103C8T6 + ESP8266-01 连接 OneNet 平台 MQTT/HTTP
  • Hexo博客Icarus主题不蒜子 UV、PV 统计数据初始化配置
  • (done) MIT6.S081 Lec15 Crash recovery 学习笔记
  • tcp/ip协议配置参数有哪些?tcp/ip协议需要设置的参数有哪些
  • JAVA面试_进阶部分_深入理解socket网络异常
  • 每日一题----------String 和StringBuffer和StringBuiler重点
  • STM32步进电机驱动全解析(上) | 零基础入门STM32第五十七步
  • 见微知沪|高校当让优秀青年脱颖而出,让科研锚定国家需求
  • 破局之路,阳光保险何以向“新”而行
  • “世界茶树原产地”打通全产业链,茶文旅融合助力西双版纳高质量发展
  • 痴情与真爱
  • 媒体:多家国有大行存款利率即将迎来新一轮下调
  • 知名中医讲师邵学军逝世,终年51岁