当前位置：首页 > news >正文

珠海建设网站公司百度seo排名优化公司哪家好

news 2025/9/30 0:16:07

珠海建设网站公司,百度seo排名优化公司哪家好,昆明网络推广方式有哪些,外贸营销网站建设方案想在服务器上用vllm部署qwen2.5-vl, 然后使用gradio页面在本地调试，官方代码给了两条命令，列出的request body体结构， 不过要与gradio连用， 还需要重新组织代码。官方服务代码如下： vllm serve Qwen/Qwen2.5-VL-7B-I…

想在服务器上用vllm部署qwen2.5-vl, 然后使用gradio页面在本地调试，官方代码给了两条命令，列出的request body体结构，不过要与gradio连用，还需要重新组织代码。
官方服务代码如下：

vllm serve Qwen/Qwen2.5-VL-7B-Instruct --port 8000 --host 0.0.0.0 --dtype bfloat16 --limit-mm-per-prompt image=5,video=5

import base64
from openai import OpenAI
# Set OpenAI's API key and API base to use vLLM's API server.
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:8000/v1"
client = OpenAI(api_key=openai_api_key,base_url=openai_api_base,
)
image_path = "/path/to/local/image.png"
with open(image_path, "rb") as f:encoded_image = base64.b64encode(f.read())
encoded_image_text = encoded_image.decode("utf-8")
base64_qwen = f"data:image;base64,{encoded_image_text}"
chat_response = client.chat.completions.create(model="Qwen/Qwen2.5-VL-7B-Instruct",messages=[{"role": "system", "content": "You are a helpful assistant."},{"role": "user","content": [{"type": "image_url","image_url": {"url": base64_qwen},},{"type": "text", "text": "What is the text in the illustrate?"},],},],
)
print("Chat response:", chat_response)

vllm有两种命令行起服务的方式，vllm serve …和python -m vllm.entrypoints.api_server …, vllm serve是一种简单的方式，可以满足大多数场景，如果想要对参数有更精细调控，可以使用python -m vllm.entrypoints.api_server …。
vllm官方其实不推荐使用api_server作为正式的服务，在生产环境中更建议使用vllm.entrypoints.openai.api_server, 毕竟可以暴露api_key这样的鉴权机制，不过作为本地调试，vllm.entrypoints.api_server足够用了。

一 vllm serve调用

命令行起服务

    vllm serve /home/Qwen2.5-VL-3B-Instruct-AWQ \--port 22 --host 0.0.0.0 --dtype float16 --enforce-eage --max-model-len 4096 --limit-mm-per-prompt image=5,video=5

# -*- coding: utf-8 -*-
# @Time    : 2025/3/10 上午11:31
# @Author  : yblir
# @File    : gradio_demo.py
# explain  :
# =======================================================
import datetime
import os
import gradio as gr
import requests
import json
from transformers import AutoProcessor
from PIL import Image
import io
import base64# todo 手动修改
# processor = AutoProcessor.from_pretrained('/home/Qwen25-VL-3B-Instruct-AWQ')
processor = AutoProcessor.from_pretrained(r'E:\PyCharm\insteresting\Qwen2.5-VL-3B-Instruct-AWQ')
save_file_path = './gradio_output/output.txt'
post_url = "http://127.0.0.1:10091/v1/chat/completions"def save_file(text, output, file_path='output.txt'):folder_path = os.path.dirname(file_path)if not os.path.exists(folder_path):os.makedirs(folder_path, exist_ok=True)with open(file_path, 'a', encoding='utf-8') as f:timestamp = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')f.write(f"[{timestamp}] prompt: {text}, output: {output}\n")def _transform_messages(original_messages):transformed_messages = []for message in original_messages:new_content = []for item in message['content']:if 'image' in item:new_item = {'type': 'image', 'image': item['image']}elif 'text' in item:new_item = {'type': 'text', 'text': item['text']}elif 'video' in item:new_item = {'type': 'video', 'video': item['video']}else:continuenew_content.append(new_item)new_message = {'role': message['role'], 'content': new_content}transformed_messages.append(new_message)return transformed_messagesdef call_api(image_path, text):# messages = _transform_messages(messages)# text2 = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)# image_inputs, video_inputs, video_kwargs = process_vision_info(messages, return_video_kwargs=True)img = Image.open(image_path)img_bytes = io.BytesIO()img.save(img_bytes, format=img.format)img_bytes = img_bytes.getvalue()img_base64 = base64.b64encode(img_bytes).decode()base64_qwen = f"data:image;base64,{img_base64}"messages = [{"role": "system", "content": "You are a helpful assistant."},{"role"   : "user","content": [{"type"     : "image_url","image_url": {"url": base64_qwen},},{"type": "text", "text": text}]}]payload = {'model'             : '/home/Qwen2.5-VL-3B-Instruct-AWQ','messages'          : messages,# 'stream'            : True,# "temperature"       : 0.1,# "top_p"             : 0.001,# "repetition_penalty": 1.05,# "max_tokens"        : 512,# "stop_token_ids"    : []}# 发送请求到 APIresponse = requests.post(url=post_url,headers={"Content-Type": "application/json"},json=payload)result = response.json()print(result)content = result['choices'][0]['message']['content']save_file(text, content, save_file_path)return content, f'文件保存: {save_file_path}'# 创建 Gradio 界面
demo = gr.Interface(fn=call_api,inputs=[gr.Image(label="上传图片", type="filepath"),gr.Textbox(label="文本输入"),],# outputs=gr.JSON(label="API Response"),outputs=[gr.Textbox(label='文本生成'),gr.Markdown(show_label=False)],title="Chat with Qwen2.5-VL-Instruct",description="分别上传图片和文本"
)if __name__ == '__main__':"""vllm serve /home/Qwen2.5-VL-3B-Instruct-AWQ \--port 22 --host 0.0.0.0 --dtype float16 --enforce-eage --max-model-len 4096 --limit-mm-per-prompt image=5,video=5 CUDA_VISIBLE_DEVICES=6 python3 -m vllm.entrypoints.api_server --model /home/Qwen2.5-VL-3B-Instruct-AWQ \--port 22 --host 0.0.0.0 --dtype float16 --enforce-eage --max-model-len 20480 --limit-mm-per-prompt image=5,video=5"""# 启动 Gradio 应用# demo.launch(server_name='0.0.0.0', server_port=7865)demo.launch(server_name='127.0.0.1', server_port=7865)

关于页面的展示，这两种方式都一样,都在在下面合并介绍。

二 vllm.entrypoints.openai.api_server调用

这种调用方式要改动vllm部分源码:

/usr/local/lib/python3.10/dist-packages/vllm/multimodal/parse.py

    # 增加对图片数据的解包处理def parse_mm_data(self,mm_data: MultiModalDataDict) -> MultiModalDataItems:subparsers = self._get_subparsers()#print('===================================')#print("mm_data=",mm_data)if isinstance(mm_data['image'],str): #print("----------------------------------")img_base64=mm_data['image']img_bytes=base64.b64decode(img_base64)image=PIL.Image.open(io.BytesIO(img_bytes))mm_data['image']=image#print('=====',mm_data['image'])mm_items = MultiModalDataItems()for k, v in mm_data.items():if k not in subparsers:raise ValueError(f"Unsupported modality: {k}")mm_items[k] = subparsers[k](v)#print('mm_items=',mm_items)return mm_items

/usr/local/lib/python3.10/dist-packages/vllm/entrypoints/api_server.py
将多余的端口删掉, --port仅保留default选项

之后就可以使用命令行起服务, 这里容器使用桥接模式, 只映射出了22端口

python3 -m vllm.entrypoints.api_server --model /home/Qwen2.5-VL-3B-Instruct-AWQ \
--port 22 --host 0.0.0.0 --dtype float16 --enforce-eage --max-model-len 4096 --limit-mm-per-prompt image=5,video=5

当出现url时,就算服务起成功.
在这里插入图片描述

本地执行gradio页面代码

# -*- coding: utf-8 -*-
# @Time    : 2025/3/10 上午11:31
# @Author  : yblir
# @File    : gradio_demo.py
# explain  :
# =======================================================
import datetime
import os
import gradio as gr
import requests
import json
from transformers import AutoProcessor
from PIL import Image
import io
import base64# todo 手动修改
# processor = AutoProcessor.from_pretrained('/home/Qwen25-VL-3B-Instruct-AWQ')
processor = AutoProcessor.from_pretrained(r'E:\PyCharm\insteresting\Qwen2.5-VL-3B-Instruct-AWQ')
save_file_path = './gradio_output/output.txt'
post_url = "http://127.0.0.1:10091/generate"  # api_serve 需要使用这个def save_file(text, output, file_path='output.txt'):folder_path = os.path.dirname(file_path)if not os.path.exists(folder_path):os.makedirs(folder_path, exist_ok=True)with open(file_path, 'a', encoding='utf-8') as f:timestamp = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')f.write(f"[{timestamp}] prompt: {text}, output: {output}\n")def _transform_messages(original_messages):transformed_messages = []for message in original_messages:new_content = []for item in message['content']:if 'image' in item:new_item = {'type': 'image', 'image': item['image']}elif 'text' in item:new_item = {'type': 'text', 'text': item['text']}elif 'video' in item:new_item = {'type': 'video', 'video': item['video']}else:continuenew_content.append(new_item)new_message = {'role': message['role'], 'content': new_content}transformed_messages.append(new_message)return transformed_messagesdef call_api(image, text):messages = [{"role": "system", "content": "You are a helpful assistant."},{"role"   : "user","content": [{"type"      : "image","image"     : image,"min_pixels": 224 * 224,"max_pixels": 1280 * 28 * 28,},{"type": "text", "text": text},],},]messages = _transform_messages(messages)text2 = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)# image_inputs, video_inputs, video_kwargs = process_vision_info(messages, return_video_kwargs=True)mm_data = {}img = Image.open(image)img_bytes = io.BytesIO()img.save(img_bytes, format=img.format)img_bytes = img_bytes.getvalue()img_base64 = base64.b64encode(img_bytes).decode()mm_data['image'] = img_base64ll_inputs = {'prompt'          : text2,'multi_modal_data': mm_data,}body = {'prompt'            : ll_inputs,'stream'            : True,"temperature"       : 0.1,"top_p"             : 0.001,"repetition_penalty": 1.05,"max_tokens"        : 512,"stop_token_ids"    : []}# 发送请求到 APIresponse = requests.post(url=post_url,headers={"Content-Type": "application/json"},json=body)full_output = ''for i, chunk in enumerate(response.iter_lines()):if chunk.strip():data = json.loads(chunk)output = data['text'][0]if 'assistant' not in output:continue_, new_output = output.split('assistant')new_output = new_output.strip()full_output = new_outputyield new_output, f'文件保存: {save_file_path}'save_file(text, full_output, save_file_path)# 创建 Gradio 界面
demo = gr.Interface(fn=call_api,inputs=[gr.Image(label="上传图片", type="filepath"),gr.Textbox(label="文本输入"),],# outputs=gr.JSON(label="API Response"),outputs=[gr.Textbox(label='文本生成'),gr.Markdown(show_label=False)],title="Chat with Qwen2.5-VL-Instruct",description="分别上传图片和文本"
)if __name__ == '__main__':"""vllm serve /home/Qwen25-VL-3B-Instruct-AWQ \--port 8811 --host 0.0.0.0 --dtype float16 --limit-mm-per-prompt image=5,video=5CUDA_VISIBLE_DEVICES=6 python3 -m vllm.entrypoints.api_server --model /home/Qwen2.5-VL-3B-Instruct-AWQ \--port 22 --host 0.0.0.0 --dtype float16 --enforce-eage --max-model-len 20480 --limit-mm-per-prompt image=5,video=5"""# 启动 Gradio 应用# demo.launch(server_name='0.0.0.0', server_port=7865)demo.launch(server_name='127.0.0.1', server_port=7865)

运行代码,在浏览器访问
在这里插入图片描述

结果输出:
在这里插入图片描述
结果保存:

[2025-03-13 00:12:44] prompt: 简单描述下这张图片, output: 这张图片展示了一位蓝发的动漫角色，背景是夕阳下的城市景观。角色穿着一件蓝色的外套，头发被扎成一个高高的发髻。整体色调温暖，给人一种宁静的感觉。

后记:
vllm serve方式直接传入text,没有使用模板, 和有模板时的输出做过对比, 发现没多大区别.
第二种方式文本必须使用模板,否则输出结果会变差.

查看全文

http://www.dtcms.com/a/421655.html

阿里云oss可以做网站网站哪些页面会做静态化

帮做图标的网站单位做网站费用怎么记账

网站有哪些费用多少钱营销团队公司

公司网站域名续费一年多少钱杭州市建设监理协会网站

研究生院网站建设网站标题的关键字怎么写

数据分析培训班杭州 seo网站建设网络服务

京山网站建设荣成市信用建设网站

访客留言网站库尔勒网站建设

推荐一下网站谢谢摄影展板设计

湖北系统建站怎么用建网站空间可以不买

阿里云linux主机如何添加2个网站企业推广的渠道有哪些

网站设计建设方案云南文山网站建设制作

html网页制作企业类网站徐州建站网页建设

自己做服务器的网站wordpress 文章背景色

手机网站怎么布局网页认证

如何申请cn域名做网站wordpress添加页面

长治网站建设哪家好郑州做网络优化的公司

wordpress设置2个网站最牛的html5网站建设

金色网站模板头条新闻最新消息

iis搭建网站时富阳网站制作

wordpress网站分享微信群网站建设seo优化价格

凡科网的网站建设好用吗房地产网站建设提案

wordpress 建站公司wordpress装主题失败

用图片做简单网站网站制作培训班

个人网站可以做社交类型视频手机网站开发

淘宝网站建设类直通车wordpress是什么软件

网站开发工程师公司网站建设分金手指排名十二

非常好的资讯网站设计wordpress导入doc

手机制作网站的软件网站建设要如何选择

汕头网站推广找谁建设彩票网站如何盈利

一 vllm serve调用

二 vllm.entrypoints.openai.api_server调用

相关文章：