当前位置: 首页 > news >正文

Grok 3当前唯一跑分超过1400分的模型,Grok 2 和 Grok 3 如何使用

下面教一下大家Grok 3性能如何?如何获得Grok3的访问权限,以及在哪里可以使用Grok3。

怎么安装Grok3移动版?

Grok3 网页版地址在哪里访问等。

本文分为两部分:Grok 2 和 Grok 3 。

先介绍如何访问 Grok 2,再进行介绍如何获得 Grok 3 的访问权限。

如果你知道如何访问Grok的话,可以直接看 Grok 3 如何使用访问部分。

Grok-3系列模型介绍

Grok-3系列模型分为2个版本,分别是Grok-3和Grok-3 mini,官方没有公布参数等信息。这两个版本的模型都支持推理模式,其中Grok-3 mini的Reasoning版本已经训练完成,而Grok-3 Reasoning目前是beta版本,并未正式发布。

Grok-3系列模型应该是普通的大模型和推理大模型的结合。其推理模式可以使用更长的推理时间和tokens来完成更加复杂的任务。但是官方没有给出不同的版本名称,也不确定是独立的推理大模型还是2种模式都支持的大模型类型。

根据马斯克透露的消息,当前xAI已经建成了20万卡集群的算力中心。从0开始搭建10万的集群用了192天,但是10万到20万集群的扩展只用了90多天时间,可见基础设施的扩展非常顺利且更为迅速。尽管,此前DeepSeek系列模型可以通过更低的训练成本完成高质量大模型的训练,但是马斯克的模型结果证明,更大更强的算力始终是有优势的。

评测结果大幅超过GPT-4o,打败了所有非推理模型

官方给出了Grok-3系列模型在不同评测的对比结果。主要是数学推理(AIME 2024)、科学事实(GPQA)以及编程(LCB)方面的评测结果。它们简单介绍如下:

AIME 2024:AIME全称是American Invitational Mathematics Examination,即美国数学邀请赛,是美国面向中学生的邀请式竞赛,3个小时完成15道题,难度很高。
GPQA:这里的测试应该是GPQA Diamond,基准旨在衡量模型在需要深度推理和领域专业知识问题上的能力,
LCB:这应该是Leet Code的测试,测试代码生成能力。

官方将Grok-3系列分为2个版本来对比,分别是经典的大语言模型能力和推理大模型的能力。

非推理模式的Grok-3与其它大模型能力对比

下图展示了Grok-3在非推理模式下与其它大语言模型的评测对比。

根据上图我们可以看到,传统的大模型对比上,Grok3评测结果很好。在数学评测上,即使是小版本的Grok-3 mini,得分也达到了40分,超过了6710亿参数的DeepSeek V3。而在专业推理GPQA的得分上,也超过了其它模型。Grok-3模型比GPT-4o高50%,性能十分恐怖。

推理模式的Grok-3与其它大模型能力对比

前面是非推理模式下Grok-3与其它模型的对比。但是,随着OpenAI o1/o3系列推理大模型的推出,这些评测并不能代表最新的水平。但是,这也是通过增加推理时间,生成更多tokens来获得的效果。而Grok-3本身也是支持推理模式的。其中Grok-3-mini Reasoning是已经完成训练,而Grok-3版本目前还没有训练完成。

下图展示了Grok-3推理版本模型与其他模型的对比结果。

可以看到,推理版本的Grok-3系列依然是超过了其它推理大模型的效果。这里浅色部分应该是用更长的推理时间获得的。但是可以看到,Grok-3 Reasoning Beta应该是训练还没有结束,所以才导致了效果似乎没那么好。而Grok-3 mini reasoning则是最强的。

Grok-3系列所有模型在一起的测试结果

为了更加清晰对比Grok-3模型和其它模型的对比结果,我们DataLearnerAI汇总了所有的大模型对比:

基本上Grok-3依然是最强的。此外,在Chatbot Arena大模型竞技场上,Grok-3也是最强的,是迄今为止唯一超过1400分的大模型:

Elo评分系统最初是为国际象棋棋手排名而设计的,用于衡量玩家的相对技能水平。Chatbot Arena 采用 Elo 评分系统来评估和排名不同的 LLM。根据Elo评分系统,如果一个玩家的评分比对手高400分,那么这个玩家的预期胜率是10:1。1400分以上表示Grok-3模型在Chatbot Arena的众多模型中表现非常出色,属于顶尖水平的模型。

访问Grok 2 方式

目前,Grok Web网页版 在英国/欧盟仍然无法访问。 但是你可以在 IOS 的 APP Store 上进行安装 

教程开始之前,我们先来了解一下 Grok 的 几个官方平台: web网页版、API平台 以及 移动端

(1)Grok 网页版

目前web网页版,美国、澳大利亚和印度地理位置是可以访问的,所以想要使用Grok,就得上魔法。

Grok不仅在官网上使用,你也可以在 X(原推特)上进行使用。打开 X 之后,(通常在界面底部或侧边栏)上就能看到 Grok。

(2)Grok API 平台

(3)Grok 移动端

注意,目前,安卓平台无法使用Grok, 只用苹果IOS系统才可以安装Grok。

你可以在 iPad 或者 iPhone 上的 APP Store 上进行搜索安装。目前还没有桌面端应用,所以你用Mac电脑是搜索不到的。

注意,是下面这个Grok。 因为有很多类似名称的应用,进行蹭流量。

Grok 3 访问教程

重点:Grok 3仅对X上的Premium+用户开放。你需要订阅X的Premium+服务才能访问Grok 3的功能。

也就是说,你需要注册一个X账号(原推特)。并且升级到对应的版本才能有权限访问 Grok 3。

订阅 Premium + 成功之后,你就可以使用 Grok 3 哦。你可以到 Grok 网页版上,登录时,使用 X 账号进行登录。

如何订阅X高级会员

详细本文参考:(2025最新)Grok 2 和 Grok 3 使用教程参考:教你如何获得Grok3的访问权限,内附Grok3订阅升级订阅高级会员教程 - AI is all your need!

订阅之后或者到 X 上,的侧边栏上的 Grok 上使用 Grok 3。

Grok-3模型总结

Grok-3模型应该是当前为止训练最多算力的模型之一,基于20万英伟达显卡训练。其结果也表明了堆算力依然是非常值得投入的事情。

相关文章:

  • 燕云十六声武器心法搭配推荐 燕云十六声心法怎么选择
  • GitBash输出中文乱码处理
  • 【ISO 14229-1:2023 UDS诊断(ECU复位0x11服务)测试用例CAPL代码全解析⑬】
  • 青少年编程与数学 02-009 Django 5 Web 编程 21课题、部署
  • idea-gradle打包运行配置
  • DeepSeek企业级部署实战指南:从服务器选型到Dify私有化落地
  • spring分层解耦(springboot)
  • 阿里云百炼通义大模型
  • 安全问答—评估和应用安全治理原则相关
  • Deepseek官方整理的13类提示词推荐
  • id生成系统和mp条件简化
  • 《模式和状态管理》知识总结
  • 百度搜索全面接入DeepSeek-R1满血版:AI与搜索的全新融合
  • 深入解析 Flutter Widget 树与布局:从电商首页到性能优化
  • 23种设计模式 - 建造者模式
  • Pytorch实现之SCGAN实现人脸修复
  • 【JavaScript】《JavaScript高级程序设计 (第4版) 》笔记-Chapter16-DOM2 和 DOM3
  • 数据在内存中的存储
  • 2025年02月17日Github流行趋势
  • JavaScript数组-创建数组
  • 李家超:明日起香港特区护照持有人可免签入境阿联酋
  • 西班牙政府排除因国家电网遭攻击导致大停电的可能
  • 陕西旱情实探:大型灌区农业供水有保障,大旱之年无旱象
  • 将人工智能送上太空,我国太空计算卫星星座成功发射
  • 事关心脏健康安全,经导管植入式人工心脏瓣膜国家标准发布
  • 特朗普开启第二任期首次外访:中东行主打做生意,不去以色列