当前位置：首页 > news >正文

GitCode 同步发布百度 ERNIE-4.5-VL-28B-A3B-Thinking 多模态大模型

news 2025/11/12 10:56:27

百度文心多模态思考模型 ERNIE-4.5-VL-28B-A3B-Thinking 正式开源，GitCode 同步发布，快来体验！

👉 模型开源地址：https://ai.gitcode.com/paddlepaddle/ERNIE-4.5-VL-28B-A3B-Thinking

ERNIE-4.5-VL-28B-A3B-Thinking 是在 ERNIE-4.5-VL-28B-A3B 基础上训练的深度思考模型，在视觉语言多模态理解能力上实现了显著提升。模型具备领先的文档与图表理解能力，在理科与文科综合推理、通用视觉推理等任务中表现优异，展现出更强的跨模态推理与问题解决能力。同时，结合空间定位与工具调用，该模型推出“图像思考”等创新功能，为多模态思维与交互应用带来更丰富的可能。

ERNIE-4.5-VL-28B-A3B-Thinking 作为激活仅 3B 的轻量级模型，在各项测试中的表现紧咬业界顶级旗舰模型，以轻量级规模实现了接近 SOTA 的视觉表现。

小模型，大能量

👀｜视觉推理

通过大规模强化学习策略，模型在复杂视觉任务中展现卓越的多步推理、图表解析与因果推理能力。

复杂图表解析，避开高峰时段

🔢｜学科计算

凭借强大视觉能力，模型在拍照解题等学科推理中实现飞跃式提升，复杂题目也能轻松搞定！

解决物理学科电阻问题 📝

📌｜视觉定位

定位更精准，指令执行更灵活，轻松触发复杂工业场景下的定位功能，效率直线上升！

快速识别穿西服戴礼帽人物数量及定位🎩

模型Grounding输出结果的可视化——图中边界框对应模型生成的 “穿西装的人” 的bbox_2d坐标。

🖼️｜图像思考

如同真人般思考，模型可对图片自由放大缩小，把控每个细节，洞察每一处信息！

支持图片自由放大，识别图片细节信息 🔍

🔧｜工具调用

具备强大的工具调用能力，模型可即时调用图片搜索等功能，轻松识别长尾知识，实现全方位信息获取！

工具调用认识更多热门IP🙌

📺｜视频理解

模型具备卓越的时间感知与事件定位能力，能够精准识别视频中不同时间段的内容变化，让视频分析更智能、更高效！

卓越定位广告片不同时段内容变化、分析更智能📹

立即体验

ERNIE-4.5-VL-28B-A3B-Thinking 模型在 GitCode 发布并开源，开发者可访问 GitCode 平台免费体验。

👉 模型开源地址：https://ai.gitcode.com/paddlepaddle/ERNIE-4.5-VL-28B-A3B-Thinking

http://www.dtcms.com/a/598145.html

相关文章：

贴吧高级搜索windows优化大师官方免费

网站及app开发招聘如何写好网站建设方案

Rotation.from_euler(‘xyz‘） Rotation.from_euler(‘XYZ‘)不同

深度学习：python动物识别系统 YOLOv8模型 PyQt5 深度学习pytorch 计算机（建议收藏）✅

wap手机网站开发asp经验办公室装修铺哪种地板

K8S Base: 创建Job 与 CronJob

langgragh的思想与入门（一）

网站开发任职要求免费网站空间注册

借助LLama_Factory工具对大模型进行lora微调

基于Springboot + vue3实现的渔具管理系统

网站工作室设计数字营销的4个特征

Linux动静态库以及动静态链接

一个关于python编程小白日记

自己做一个外贸网站怎么样沪上装修排名前十有哪些品牌

环保HJ212-2017协议Java代码解析

专业零基础网站建设教学深圳极速网站建设定制

黑马点评学习笔记10（优惠券秒杀下单优化（分布式锁的优化，Lua脚本））

单页面网站有哪些内容吗电子商务就业岗位

亚马逊云科技 Amazon Bedrock 持续壮大模型阵营：Qwen3 和 DeepSeek-V3.1 重磅上线

同一个空间可以做两个网站么wordpress建设购物网站

小县城做网站福田做商城网站建设多少钱

东莞网站制作方案定制无锡网站制作哪家服务好

做的的网站怎样上传如何做网站关键字优化

【OpenCV + VS】图像像素的加减乘除操作

那里可以做网站的吗wordpress修改文章链接

[Java EE] 多线程 -- 初阶(2)

蓝牙钥匙第89次蓝牙钥匙未来发展趋势篇：与汽车电子架构演进深度融合

网站建设解析2345网址导航开创中国

营销型网站模版vi设计的目的

U++工程提取二进制工程