当前位置: 首页 > news >正文

智谱开源了最新多模态模型,GLM-4.5V

模型已经在多平台开源了,可以任选一个下载。

Github:https://github.com/zai-org/GLM-V

Hugging Face:https://huggingface.co/collections/zai-org/glm-45v-68999032ddf8ecf7dcdbc102
在这里插入图片描述
国内用户直接访问网址:https://chat.z.ai/
在这里插入图片描述

我们来测试下识图辨地,结果让人眼前一亮,很准确

在这里插入图片描述

我们发送一个山坡给它,这次不太准确,不过也情有可原,毕竟标识不明显

在这里插入图片描述

然后我们测试一个“小猫摸球问题”:问题是到底哪个猫摸到了毛线球。

请添加图片描述
GLM-4.5V也找到正确的答案,还给了正经的操作方法。
在这里插入图片描述
在视觉推理能力上,GLM-4.5v确实有点东西,而且速度快的离谱。

接下来让她看个游标卡尺
请添加图片描述
来看结果
在这里插入图片描述
读取的很正确,在视觉推理能力上,GLM-4.5v确实有点东西,而且速度很快。

接下来,我们测试个识别地理位置的:横店明清宫苑的图片,想看看它能不能正确的分辨出来。

请添加图片描述
看下GLM-4.5V的回答:很正确,指出了这里是横店的明清宫苑。
在这里插入图片描述我很诧异,又接着问它,为什么不是故宫是横店呢?想看看它是如何分辨的

这回它给出了详细的解答,分了三个点,讲的相当有理有据。

在这里插入图片描述

除此之外,还有“视觉定位”、“网页复刻”、“视频理解”模块,也非常强

在这里插入图片描述

测试下网站复刻

我发送智谱的首页给它,结果出来的几乎一模一样,相当哇塞
在这里插入图片描述
最后,总结一下。

曾经的国产之光,智谱好像回来了。

连续两个开源GLM-4.5和GLM-4.5V,效果都非常的强。

http://www.dtcms.com/a/332701.html

相关文章:

  • 关系型数据库从入门到精通:MySQL 核心知识全解析
  • 高并发系统性能优化实战:实现5万并发与毫秒级响应
  • Kafka生产者——提高生产者吞吐量
  • LeetCode 面试经典 150_数组/字符串_最长公共前缀(20_14_C++_简单)(暴力破解)(求交集)
  • 简单使用 TypeScript 或 JavaScript 创建并发布 npm 插件
  • 从零到一:发布你的第一个 npm 开源库(2025 终极指南)
  • IT资讯 | VMware ESXi高危漏洞影响国内服务器
  • Day62--图论--97. 小明逛公园(卡码网),127. 骑士的攻击(卡码网)
  • 嵌入式 C 语言编程规范个人学习笔记,参考华为《C 语言编程规范》
  • 使用CMAKE-GU生成Visual Studio项目
  • ​Visual Studio 2013.5 ULTIMATE 中文版怎么安装?iso镜像详细步骤
  • Pushgateway安装和部署,以及对应Prometheus调整
  • 六维力传感器:工业机器人的“触觉神经”如何突破自动化瓶颈?
  • Linux crontab定时任务
  • 3.1. CPU拓扑配置
  • 4.2 寻址方式 (答案见原书 P341)
  • Nginx蜘蛛请求智能分流:精准识别爬虫并转发SEO渲染服务
  • 嵌入式学习日记(29)进程、线程
  • Java 中 Map 接口详解:知识点与注意事项
  • HarmonyOS 实战:用 List 与 AlphabetIndexer 打造高效城市选择功能
  • Java-99 深入浅出 MySQL 并发事务控制详解:更新丢失、锁机制与MVCC全解析
  • 中小体量游戏项目主干开发的流程说明
  • 模板方法模式C++
  • 基于 Spring AI + Ollama + MCP Client 打造纯本地化大模型应用
  • Java研学-SpringCloud(三)
  • 如何安装 Homestead ?
  • 【学习笔记】JVM内存模型
  • 告别碎片化管理!飞算JavaAI实现端到端业务全流程智能监控
  • Ubuntu DNS 综合配置与排查指南
  • IP生意的天花板更高了吗?