PPIO上线智谱GLM-4.5V
今天,PPIO 首发上线智谱新一代视觉推理模型GLM-4.5V,该模型基于GLM-4.5-Air基础架构开发,继承了GLM-4.1V-Thinking的技术路线,采用1060亿参数的混合专家(MoE)架构实现高效扩展。
GLM-4.5V具备全方位的视觉理解能力,包括图像/视频分析、图形界面交互、复杂文档处理以及精准的视觉元素定位等核心能力。
在中国GeoGuessr地理定位挑战赛中,GLM-4.5V仅用16小时就超越了99%的人类选手(共21000人参与),一周内攀升至第66名。
现在,前往 PPIO 官网即可体验 GLM-4.5V,新用户填写邀请码【MLDYQ1】注册可得 15 券。
模型特点
据智谱官方表示, GLM-4.5V在42项基准测试中均达到同规模开源模型的最高水平。并且,通过高效的混合训练,GLM-4.5V能够处理各种类型的视觉内容,实现全场景视觉推理。
图像推理
在图像推理上, GLM-4.5V不仅可以进行场景理解,还能够对复杂多图像进行综合分析。
例如:
上传一张小狗图片,并尝试让 GLM-4.5V解读一下图片内容。
地理识别
并且, GLM-4.5V还支持高精度的地理空间识别。
例如:
上传一张无锡照片,让 GLM-4.5V尝试分析该照片拍摄地区。
可以看出,GLM-4.5V可以准确理解图片内容,并作出精准分析。
此外,GLM-4.5V还具备GUI任务处理能力、复杂图表和长文档分析能力,以及视觉元素定位能力,为各类应用场景提供技术支撑。
PPIO 一直致力于为企业和开发者提供更高性能的模型 API 服务,帮助企业将先进技术快速集成到企业现有的工作流程中。现在,前往PPIO官网即可在线体验 GLM-4.5V能力,新用户填写邀请码【MLDYQ1】注册还可得 15 元代金券。