英伟达诉求1亿IOPS SSD:打破AI算力存储瓶颈
当AI芯片的HBM带宽飙升至8TB/s,存储系统却成了拖累算力的最后一道枷锁。Silicon Motion首席执行官Wallace C. Kuo在Tom’s Hardware的独家专访中爆出猛料:英伟达正联合合作伙伴攻关随机读取性能达1亿IOPS的“超级SSD”,誓要消除AI训练与推理的存储瓶颈。
这一目标堪称疯狂——当前顶尖PCIe 5.0 SSD仅能提供200-300万IOPS,1亿IOPS意味着性能需跃升33倍。更严峻的是,AI工作负载不同于传统应用,其频繁的小规模随机数据读取(通常为512B块)对延迟极为敏感,传统为带宽优化的4K块SSD在此场景中完全失灵。
英伟达Blackwell架构B200 GPU的HBM3E内存带宽已突破8TB/s,存储带宽落后HBM达550倍。即便采用液冷设计的PCIe 5.0企业级SSD(如Solidigm与英伟达合作产品),顺序读取速度也仅达14.5GB/s。当GPU在毫秒内完成计算任务,等待数据的时间却可能长达数秒——存储延迟已成为AI算力进化的头号敌人。
攀登1亿IOPS:技术与材料的生死竞速
产业界正从两条路线发起冲击:
- 渐进改良:Kioxia率先出招,其基于XL-Flash的“AI SSD”预计2025年下半年上市,目标突破1000万512B IOPS。通过多盘阵列组合,或可逼近1亿IOPS目标。
- 革命创新派:传统NAND在成本与功耗约束下不可能实现单盘1亿IOPS。需要存储介质根本变革,惋惜停产的Optane本是理想方案。SanDisk的HBF(高带