当前位置: 首页 > wzjs >正文

我在征婚网站认识一个做IT刚刚突发1惊天大事

我在征婚网站认识一个做IT,刚刚突发1惊天大事,厦门网络公司网站,武汉文理学院机电与建筑工程网站Qwen-VL 是阿里云研发的大规模视觉语言模型(Large Vision Language Model, LVLM)。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。Qwen-VL 系列模型性能强大,具备多语言对话、多图交错对话等能力&#xff…

Qwen-VL 是阿里云研发的大规模视觉语言模型(Large Vision Language Model, LVLM)。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。Qwen-VL 系列模型性能强大,具备多语言对话、多图交错对话等能力,并支持中文开放域定位和细粒度图像识别与理解。

https://github.com/QwenLM/Qwen2.5-VL

安装方法

pip install git+https://github.com/huggingface/transformers accelerate
pip install qwen-vl-utils[decord]

模型硬件要求:

PrecisionQwen2.5-VL-3BQwen2.5-VL-7BQwen2.5-VL-72B
FP3211.5 GB26.34 GB266.21 GB
BF165.75 GB13.17 GB133.11 GB
INT82.87 GB6.59 GB66.5 GB
INT41.44 GB3.29 GB33.28 GB

模型特性

  • 强大的文档解析能力:将文本识别升级为全文档解析,擅长处理多场景、多语言以及包含各种内置元素(手写文字、表格、图表、化学公式和乐谱)的文档。
  • 精准的对象定位跨格式支持:提升了检测、指向和计数对象的准确性,支持绝对坐标和JSON格式,以实现高级空间推理。
  • 超长视频理解和细粒度视频定位:将原生动态分辨率扩展到时间维度,增强对时长数小时的视频的理解能力,同时能够在秒级提取事件片段。
  • 增强的计算机和移动设备代理功能:借助先进的定位、推理和决策能力,为模型赋予智能手机和计算机上更出色的代理功能。

使用案例

基础图文问答

from transformers import Qwen2_5_VLForConditionalGeneration, AutoProcessor
from qwen_vl_utils import process_vision_infomodel = Qwen2_5_VLForConditionalGeneration.from_pretrained("Qwen/Qwen2.5-VL-7B-Instruct", torch_dtype="auto", device_map="auto"
)# 传入文本、图像或视频
messages = [{"role": "user","content": [{"type": "image","image": "https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-VL/assets/demo.jpeg",},{"type": "text", "text": "Describe this image."},],}
]# Preparation for inference
text = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True
)
image_inputs, video_inputs = process_vision_info(messages)
inputs = processor(text=[text],images=image_inputs,videos=video_inputs,padding=True,return_tensors="pt",
)
inputs = inputs.to(model.device)# Inference: Generation of the output
generated_ids = model.generate(**inputs, max_new_tokens=128)
generated_ids_trimmed = [out_ids[len(in_ids) :] for in_ids, out_ids in zip(inputs.input_ids, generated_ids)
]
output_text = processor.batch_decode(generated_ids_trimmed, skip_special_tokens=True, clean_up_tokenization_spaces=False
)
print(output_text)

多图输入

messages = [{"role": "user","content": [{"type": "image", "image": "file:///path/to/image1.jpg"},{"type": "image", "image": "file:///path/to/image2.jpg"},{"type": "text", "text": "Identify the similarities between these images."},],}
]

视频理解

  • Messages containing a images list as a video and a text query
messages = [{"role": "user","content": [{"type": "video","video": ["file:///path/to/frame1.jpg","file:///path/to/frame2.jpg","file:///path/to/frame3.jpg","file:///path/to/frame4.jpg",],},{"type": "text", "text": "Describe this video."},],}
]
  • Messages containing a local video path and a text query
messages = [{"role": "user","content": [{"type": "video","video": "file:///path/to/video1.mp4","max_pixels": 360 * 420,"fps": 1.0,},{"type": "text", "text": "Describe this video."},],}
]
  • Messages containing a video url and a text query
messages = [{"role": "user","content": [{"type": "video","video": "https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen2-VL/space_woaudio.mp4","min_pixels": 4 * 28 * 28,"max_pixels": 256 * 28 * 28,"total_pixels": 20480 * 28 * 28,},{"type": "text", "text": "Describe this video."},],}
]

物体检测

  • 定位最右上角的棕色蛋糕,以JSON格式输出其bbox坐标

在这里插入图片描述

  • 请以JSON格式输出图中所有物体bbox的坐标以及它们的名字,然后基于检测结果回答以下问题:图中物体的数目是多少?

在这里插入图片描述

图文解析OCR

  • 请识别出图中所有的文字

在这里插入图片描述

  • Spotting all the text in the image with line-level, and output in JSON format.

在这里插入图片描述

  • 提取图中的:[‘发票代码’,‘发票号码’,‘到站’,‘燃油费’,‘票价’,‘乘车日期’,‘开车时间’,‘车次’,‘座号’],并且按照json格式输出。

在这里插入图片描述

Agent & Computer Use

The user query:在盒马中,打开购物车,结算(到付款页面即可) (You have done the following operation on the current device):

在这里插入图片描述

编辑推荐

系统地介绍大语言模型的提示词工程以及AI Agent的基本概念和设计方法论。许多用户在使用ChatGPT等AI工具时,常常感到困惑:为什么有时候能得到满意的回答,有时候却答非所问?通过本书,读者将学习如何构建有效的AI提示词,以及如何设计合理的对话流程,从而更好地驾驭AI工具。

http://www.dtcms.com/wzjs/320365.html

相关文章:

  • 本地电脑做网站谷歌推广代理
  • 做网站是要云空间吗网络推广外包公司
  • 产品做网站如何谁来维护价格做一个企业网站大概需要多少钱
  • wordpress 列表页面sem优化策略
  • 自己做电影网站违法吗三只松鼠网络营销方案策划书
  • 网站 手机版 电脑版 怎么做十大营销策划公司排名
  • 怎么用PS做网站广告图北京网站seo招聘
  • 免费制作网站平台淘宝关键词优化
  • 家政保洁公司网站建设方案营销策略有哪些内容
  • 福建建设工程有限公司网站在线视频观看免费视频22
  • 网站建设柚子网络科技在哪里chrome官网下载
  • 网站制作是不是要一个后台百度网站统计
  • 佛山专业网站建设报价世界羽联巡回赛总决赛
  • 电商网站开发详细介绍百度指数明星人气榜
  • 租用服务器建设网站费用宣传推广方案模板
  • 郑州网站建设 .cc西安seo工作室
  • 网站建设青岛上海百度推广优化排名
  • 做网站销售大概多少钱潍坊新闻头条最新消息
  • 深圳做网站行业网站优化有哪些技巧
  • 怎么用阿里云建设网站重庆网络seo
  • 深圳网站建设便宜信科网络查看网站流量的工具
  • 视频网站后台登陆seo怎么弄
  • 自己做网站用什么软件百度推广手机版
  • 17网站一起做有人看片吗免费的
  • 南昌网站建设公司价位seo sem关键词优化
  • 杭州网站建设出 名网络营销总监岗位职责
  • 企业网站如何建设和推广网站推广怎么写
  • 装修门户网站程序 cms最近一周新闻
  • 成都旅游公司上海关键词优化排名哪家好
  • 做电商宠物带哪个网站最好销售方案