当前位置：首页 > news >正文

智谱开源了最新多模态模型，GLM-4.5V

news 2025/8/16 7:01:33

模型已经在多平台开源了，可以任选一个下载。

Github：https://github.com/zai-org/GLM-V

Hugging Face：https://huggingface.co/collections/zai-org/glm-45v-68999032ddf8ecf7dcdbc102
在这里插入图片描述
国内用户直接访问网址：https://chat.z.ai/

我们来测试下识图辨地，结果让人眼前一亮，很准确

在这里插入图片描述

我们发送一个山坡给它，这次不太准确，不过也情有可原，毕竟标识不明显

在这里插入图片描述

然后我们测试一个“小猫摸球问题”：问题是到底哪个猫摸到了毛线球。

请添加图片描述
GLM-4.5V也找到正确的答案，还给了正经的操作方法。
在这里插入图片描述
在视觉推理能力上，GLM-4.5v确实有点东西，而且速度快的离谱。

接下来让她看个游标卡尺
请添加图片描述
来看结果
在这里插入图片描述
读取的很正确，在视觉推理能力上，GLM-4.5v确实有点东西，而且速度很快。

接下来，我们测试个识别地理位置的：横店明清宫苑的图片，想看看它能不能正确的分辨出来。

请添加图片描述
看下GLM-4.5V的回答：很正确，指出了这里是横店的明清宫苑。
在这里插入图片描述我很诧异，又接着问它，为什么不是故宫是横店呢？想看看它是如何分辨的

这回它给出了详细的解答，分了三个点，讲的相当有理有据。

在这里插入图片描述

除此之外，还有“视觉定位”、“网页复刻”、“视频理解”模块，也非常强

在这里插入图片描述

测试下网站复刻

我发送智谱的首页给它，结果出来的几乎一模一样，相当哇塞
在这里插入图片描述
最后，总结一下。

曾经的国产之光，智谱好像回来了。

连续两个开源GLM-4.5和GLM-4.5V，效果都非常的强。

查看全文

http://www.dtcms.com/a/332701.html

关系型数据库从入门到精通：MySQL 核心知识全解析

高并发系统性能优化实战：实现5万并发与毫秒级响应

Kafka生产者——提高生产者吞吐量

LeetCode 面试经典 150_数组/字符串_最长公共前缀（20_14_C++_简单）(暴力破解)(求交集)

简单使用 TypeScript 或 JavaScript 创建并发布 npm 插件

从零到一：发布你的第一个 npm 开源库（2025 终极指南）

IT资讯 | VMware ESXi高危漏洞影响国内服务器

Day62--图论--97. 小明逛公园（卡码网），127. 骑士的攻击（卡码网）

嵌入式 C 语言编程规范个人学习笔记，参考华为《C 语言编程规范》

使用CMAKE-GU生成Visual Studio项目

Visual Studio 2013.5 ULTIMATE 中文版怎么安装？iso镜像详细步骤

Pushgateway安装和部署，以及对应Prometheus调整

六维力传感器：工业机器人的“触觉神经”如何突破自动化瓶颈？

Linux crontab定时任务

3.1. CPU拓扑配置

4.2 寻址方式 (答案见原书 P341)

Nginx蜘蛛请求智能分流：精准识别爬虫并转发SEO渲染服务

嵌入式学习日记（29）进程、线程

Java 中 Map 接口详解：知识点与注意事项

HarmonyOS 实战：用 List 与 AlphabetIndexer 打造高效城市选择功能

Java-99 深入浅出 MySQL 并发事务控制详解：更新丢失、锁机制与MVCC全解析

中小体量游戏项目主干开发的流程说明

模板方法模式C++

基于 Spring AI + Ollama + MCP Client 打造纯本地化大模型应用

Java研学-SpringCloud(三)

如何安装 Homestead ？

【学习笔记】JVM内存模型

告别碎片化管理！飞算JavaAI实现端到端业务全流程智能监控

Ubuntu DNS 综合配置与排查指南

IP生意的天花板更高了吗？

我们来测试下识图辨地，结果让人眼前一亮，很准确

我们发送一个山坡给它，这次不太准确，不过也情有可原，毕竟标识不明显

然后我们测试一个“小猫摸球问题”：问题是到底哪个猫摸到了毛线球。

接下来，我们测试个识别地理位置的：横店明清宫苑的图片，想看看它能不能正确的分辨出来。

除此之外，还有“视觉定位”、“网页复刻”、“视频理解”模块，也非常强

测试下网站复刻

相关文章：