当前位置：首页 > wzjs >正文

门户网站属于新媒体吗如何优化网络

wzjs 2025/8/25 8:45:53

门户网站属于新媒体吗,如何优化网络,建设部网站有项目经理资质查询系统,陇南市响应式网站建设vllm 部署 Qwen2.5-VL-7B-Instruct-AWQ （ 基于 docker ） 作者项目不允许部署 Qwen2.5-VL-7B-Instruct 非量化版，因为作者目前是 4090 48G 魔改过的， 上面已经跑了一个ollama程序，导致显存只剩下了20G不到&#xff0c…

vllm 部署 Qwen2.5-VL-7B-Instruct-AWQ

（基于 docker ）

作者项目不允许部署 Qwen2.5-VL-7B-Instruct 非量化版，因为作者目前是 4090 48G 魔改过的，
上面已经跑了一个ollama程序，导致显存只剩下了20G不到，
如果是 24 G 内存，可以跑 Qwen2.5-VL-7B-Instruct 非量化版，操作一样

目前作者环境如下：

驱动	CUDA	显卡型号	显卡块数
560.35.03	12.6.1	4090 48G	8

下载模型

modelscope download --model Qwen/Qwen2.5-VL-7B-Instruct-AWQ --local_dir  /data/qwen2.5/Qwen2.5-VL-7B-Instruct-AWQ

开始配置

docker 配置

vim /etc/docker/daemon.json
{
"registry-mirrors": ["https://docker.cloudmessage.top","https://kfp63jaj.mirror.aliyuncs.com","https://j47dskil.mirror.aliyuncs.com"],
"ipv6": false,
"max-concurrent-downloads": 10,
"log-driver": "json-file",
"log-level": "warn",
"log-opts": {
"max-size": "10m",
"max-file": "3"},"runtimes": {"nvidia": {"path": "/usr/bin/nvidia-container-runtime","runtimeArgs": []}},
"default-runtime": "nvidia",
"data-root": "/data/docker"
}

docker 安装 vllm

###镜像比较大16G多，还是先拉下来再运行
docker pull vllm/vllm-openai:latest

运行程序

docker run --runtime nvidia --gpus "device=0"   --name vllm-qwen2.5-vl-7b_AWQ \
-v /data/qwen2.5:/data/qwen2.5 \
-v /data/vllm_cache:/root/.cache/vllm \
-p 8110:8000 \
-e CUDA_VISIBLE_DEVICES=0 \
-d vllm/vllm-openai:latest \
--model /data/qwen2.5/Qwen2.5-VL-7B-Instruct-AWQ \
--dtype float16 \
--block-size 16 \	
--use-v2-block-manager \
--max-num-batched-tokens 8192 \
--max-num-seqs 32--gpus "device=0"  # 指定显卡，0是第一块，1是第二块
--name vllm-qwen2.5-vl-7b_AWQ \ # docker 容器名称
-v /data/qwen2.5:/data/qwen2.5 \ # 模型存放目录
-v /data/vllm_cache:/root/.cache/vllm \ # vllm 目录
-p 8110:8000 \  # 映射端口
-e CUDA_VISIBLE_DEVICES=0 \ #强制容器仅使用 GPU 设备 0，因为容器中只能看到一块显卡
-d vllm/vllm-openai:latest \  # 指定镜像
--model /data/qwen2.5/Qwen2.5-VL-7B-Instruct-AWQ \ # 指定模型
--dtype float16 \  # 混合精度推理
--block-size 16 \  #  KV缓存块大小	
--use-v2-block-manager \  # 新版显存管理器	
--max-num-batched-tokens 8192 \ # 最大批处理tokens（4096-16384）
--max-num-seqs 32 最大并发请求数

测试程序

# 创建虚拟环境
conda create -n qwenvl python=3.11 -y
conda activate qwenvl

vim vllm_ocr.py
import base64
import time  # 导入time模块
from openai import OpenAIdef encode_image(image_path):with open(image_path, "rb") as image_file:return base64.b64encode(image_file.read()).decode('utf-8')# 初始化 OpenAI 客户端
client = OpenAI(base_url="http://192.168.3.164:8110/v1",api_key="NOT_NEED"
)# 本地图片路径
image_path = "1744184033544.jpg"# 编码图片
base64_image = encode_image(image_path)# 记录开始时间
start_time = time.time()response = client.chat.completions.create(model="/data/qwen2.5/Qwen2.5-VL-7B-Instruct-AWQ",# 仔细分析图片中的内容后，请以HTML结构化(含所有非表格文字)完整输出。\n注意：不需要 <style>标签messages=[{"role": "user","content": [{"type": "text", "text": "完整输出图中所有相关文字"},{"type": "image_url","image_url": {"url": f"data:image/jpeg;base64,{base64_image}",},},],}],max_tokens=4096,
)# 计算耗时
elapsed_time = time.time() - start_timeprint(response.choices[0])
print(f"\n请求耗时: {elapsed_time:.2f}秒")  # 打印耗时，保留两位小数

python vllm_ocr.py

在这里插入图片描述

docker ps -a
docker logs -f vllm-qwen2.5-vl-7b_AWQ

在这里插入图片描述

1744184033544.jpg 图片内容如下

在这里插入图片描述

查看全文

http://www.dtcms.com/wzjs/479048.html

做轻时尚的网站怎样做seo搜索引擎优化

建网站兴田德润官网设计公司

建设企业网站管理的重要性企业官网网站

深圳网站建设公司平台上海网站seo排名优化

襄樊做网站网站推广建站

哪个网站做h5比较好看网站seo规划

做电商网站电商公司合肥做网站哪家好

如何做服装微商城网站厦门seo代理商

福州网站建设哪家好域名注册服务机构

网站建设服务搜索网站有哪几个

网页网站开发工具百度seo关键词排名价格

网站开发方案免费做网站推广的软件

做网站难度营销方案包括哪些内容

大连商城网站制作seo是什么意思为什么要做seo

南通优化网站费用临汾网络推广

抖音小程序制作网站如何优化流程

dede 门户网站uc浏览网页版进入

wordpress主题去版权乱码怎样优化网站排名

做网站被捉济南网站运营公司

新加坡建设局网站百度公司地址在哪里

东莞骄阳网站建设怎么做网站赚钱

河南省住建厅网站豫建设标网站制作报价表

杭州软件开发制作小红书seo是什么意思

青海省建设厅报名网站百度指数查询工具app

上海金融网站建设公司加盟培训机构

手机网站要求潍坊网站排名提升

企业为什么需要搭建一个网站电商网站上信息资源的特点包括

如何建立自已的购物网站设计网站的软件

一级a做爰片51网站长春免费网上推广

网站后台管理系统的重要技术指标市场营销咨询

vllm 部署 Qwen2.5-VL-7B-Instruct-AWQ

下载模型

开始配置

运行 程序

测试程序

相关文章：

运行程序