当前位置：首页 > news >正文

Mac Studio 和 DGX Spark 可用性分析

news 2025/10/25 8:56:10

之前老有人给我说苹果的Mac Studio可以安装DeepSeek满血671B的模型，非常牛，最近网上对 Nvidia DGX Spark 又热火朝天。

首先，声明一下，个人囊中羞涩，没钱去买来试试，只是看了一些资料，来分析一下两种机器的性能，特别是在跑大模型时的性能，看是牛皮吹破天，还是真有其事。

首先，我们关注一下两款机器的价格：

一：价格

1：Mac Studio

做过苹果手机开发的人，应该都知道mac 的迷你盒子，你可以理解为它是盒子的升级版了，只是它的实力最强了（加了NPU，配置更高，还有一些新特性）

为什么我要选这个配置，因为512是我们准备装满血必须的，而硬盘，选个可以的就行了，再往上选，价格就虚高了。

2：DGX比较简单，我们就选NVidia的，只有这一种配置。现在网上很多人都在买它。

(DGX Deep Learning GPU eXtreme AI 训练/推理机器的品牌，Spark是桌面/开发版）

大家看了价格，相信就知道为啥我要纸上谈兵了。

二：关键特性——统一内存

查了一下资料，为啥这两款机器那么火，原因无非就是低配高能，高能当然指的就是大模型的装载能力。而大模型的装载，如果不看速度（当然，这是不正确的，也是最忽悠人的），那主要是就是显存的大小，而显存是可以用内存来达成的，所以，内存的大小就成了关键。

这两款机器，都提供了较大的内存，而且配备的内存是给到cpu和GPU共享的（在苹果m3中，实际也包括NPU)，也就是有相同的地址空间，可以协同共享读写，这样，大大的减少了CPU和GPU在做运算时，对于内存的搬运，当然，也直接方便了GPU、NPU和内存直接访问。

这就叫做统一内存，你可以简单理解为内存访问更高效了。

但是要注意：内存访问仍然是要时间的，相比服务器的HBM内存（直接核封内存），在这两款机器上的内存访问速度，仍然是差了很多。下面会给出数据。这也是为什么不能直接用主板的DDR内存来作为显存使用的原因，如果依赖PCIe的通讯，那速度就更慢了。因此它和算力芯片最好在一起，因为需要频繁的访问，读取，所以，装载参数的内存需要有访问的高带宽，高速率。

2.1：两个机器的内存都使用了 LPDDR5，且统一给到CPU, GPU, NPU（DGX没有）使用，这样，可以芯片间共享内存来使用，减少通过 PCIe 搬运数据。

2.2：提供的内存很大，可以在访问上将其作为传统的显存使用，提升装载模型的规模。

2.3：但是要注意——在访问内存时，带宽仍然不高。Apple是 800G（2颗），DGX是 273G。低于HBM内存访问速度，也低于独显内存的访问速度。DGX的内存是128G，苹果m3 Ultra最高配是 512G。

【最大装载能力】

单台DGX可以装 200B（MoE，活跃 20B）可达到 3-15 token，8k prefill 1-3 min

2台可支持 400B模型级别。

两台苹果可以装满血DeepSeek R1，但是，满血运行态，性能推算下来只有 2-10tokens/S，8k prefill 2-5分钟，基本是不可用的。

为什么会这么慢？继续分析原因：