当前位置: 首页 > news >正文

nvidia显卡架构列表

现代计算架构(Tesla 及以后)

这个时期的架构不仅是图形处理器,更是并行计算平台,支持 CUDA,是 AI 和科学计算的基石。

架构代际名称发布年份代表显卡 (核心代号)关键创新与特点主要应用与意义
Tesla2006-2008GeForce 8800 GTX (G80)
GeForce GTX 280 (GT200)
首款支持 CUDA 的架构,引入了统一着色器架构,将GPU转变为通用并行处理器。科学计算、早期GPGPU应用。
Fermi2010GeForce GTX 480 (GF100)
GeForce GTX 580 (GF110)
第一代真正的GPU计算架构。引入L1/L2缓存、ECC内存支持。计算可靠性大幅提升。HPC(高性能计算)的入门。
Kepler2012-2013GeForce GTX 680 (GK104)
GeForce GTX TITAN (GK110)
能效比重大提升。引入 SMX 流多处理器、GPU动态并行。GK110核心拥有强大的双精度性能。广泛应用于数据中心,如Titan超级计算机。
Maxwell2014-2015GeForce GTX 980 Ti (GM200)
GeForce GTX 970 (GM204)
能效比再次巨大飞跃。引入 SMM 流多处理器,大幅提高了每瓦特性能。游戏笔记本、台式显卡的能效标杆。
Pascal2016GeForce GTX 1080 Ti (GP102)
NVIDIA TITAN Xp (GP102)
Tesla P100 (GP100)
16nm FinFET工艺,GDDR5X内存。引入 NVLink。为AI加入半精度(FP16)计算单元。AI训练和推理开始爆发(如DGX-1)。
Volta2017TITAN V (GV100)
Tesla V100 (GV100)
专为AI和HPC设计。革命性的 Tensor Core 核心,极大加速深度学习。HBM2内存,NVLink 2.0科学计算和AI研究的标杆。
Turing2018GeForce RTX 2080 Ti (TU102)
GeForce RTX 2060 (TU106)
Tesla T4 (TU104)
革命性的图形和AI架构。引入用于光追的 RT Core 和用于AI的下一代 Tensor Core(支持INT4/INT8精度)。消费级市场引入实时光追,AI推理(T4)。
Ampere2020GeForce RTX 3090 (GA102)
GeForce RTX 3080 (GA102)
Tesla A100 (GA100)
大幅提升的通用计算和AI性能。第二代 RT Core,第三代 Tensor Core(支持TF32, FP64)。GA100支持多实例GPU(MIG) 技术。当前AI训练和HPC的绝对主力(A100)。
Hopper2022(无消费级卡)
Tesla H100 (GH100)
H200 (GH100)
专为超大规模AI和HPC设计。第四代 Tensor Core,支持Transformer引擎(FP8精度)。HBM3内存。与Grace CPU组成超级芯片。用于训练超大规模模型(如LLaMA, ChatGPT)。
Blackwell2024RTX5060
RTX5070
RTX5090
Tesla B100/B200 (GB100)
GB200 NVL72
下一代平台。第二代Transformer引擎,支持FP4精度。通过NVLink 5.0将多个Die连接成一个巨大的统一GPU旨在支撑万亿参数规模的生成式AI和LLM的实时推理和训练。

早期经典图形架构(Pre-Tesla)

这些架构主要专注于图形渲染,是现代GPU的雏形。

架构代际名称发布年份代表显卡 (核心代号)关键创新与特点
Curie2004-2006GeForce 7800 GTX (G70)支持Shader Model 3.0,图形渲染管线更加灵活。
Tesla
(图形架构)
2006-2007GeForce 8800 GTX (G80)首次采用统一着色器架构,颠覆了传统的分离式渲染管线。这也是计算架构的开端。
更多早期架构1995-2003GeForce 256 (NV10) - 世界上第一款GPU
GeForce 4 Ti 4600 (NV25)
GeForce FX 5950 Ultra (NV38)
从固定的3D渲染管线,到引入可编程着色器的概念,奠定了现代图形技术的基础。

总结与快速记忆点:

  • Fermi (费米):第一个“真正”的计算架构,有缓存和ECC。
  • Kepler (开普勒):能效很好,经典“战术核显卡”GTX 690就基于此。
  • Maxwell (麦克斯韦):能效极致,神卡GTX 970/980。
  • Pascal (帕斯卡):一代经典,游戏神卡GTX 1080 Ti。
  • Volta (伏打):AI先驱,首代Tensor Core,只有TITAN V和计算卡。
  • Turing (图灵):光影革命,首代RT Core,开启RTX时代。
  • Ampere (安培):性能猛兽,RTX 30系,当前AI/HPC主力。
  • Hopper (霍珀):AI巨头,专为超大模型设计,只有计算卡。
  • Blackwell (布莱克威尔):未来之王,万亿参数模型的基石。

文章转载自:

http://250BCYIX.rswfj.cn
http://X5tTM0qO.rswfj.cn
http://boGcTcV8.rswfj.cn
http://iREEahbB.rswfj.cn
http://kvGmmrb5.rswfj.cn
http://RAEJXuj4.rswfj.cn
http://Doo3Vij0.rswfj.cn
http://CFSLaxHz.rswfj.cn
http://76JCwq3t.rswfj.cn
http://tZpDcmAQ.rswfj.cn
http://VosNESAV.rswfj.cn
http://bZyEFuWU.rswfj.cn
http://1O1lLh5b.rswfj.cn
http://PYrtMR9l.rswfj.cn
http://9UUOC7H4.rswfj.cn
http://G3slD0Nk.rswfj.cn
http://8b3hdjkS.rswfj.cn
http://5JE2TtXJ.rswfj.cn
http://rTxak4oh.rswfj.cn
http://hf2GpxDO.rswfj.cn
http://IgISbSNA.rswfj.cn
http://u8OHbhD4.rswfj.cn
http://vXHEQqiO.rswfj.cn
http://Lt8lkgfk.rswfj.cn
http://jEGA9ebE.rswfj.cn
http://sZpu5W4P.rswfj.cn
http://VBjJDy7q.rswfj.cn
http://h6KgrwoN.rswfj.cn
http://r4O4VhB3.rswfj.cn
http://2EerfvOj.rswfj.cn
http://www.dtcms.com/a/388465.html

相关文章:

  • MySQL InnoDB存储引擎架构底层实现详细介绍
  • QT-UI 轮播窗口
  • Nginx动静分离实验步骤
  • 硬件驱动——I.MX6ULL裸机启动(7)(ADC相关设置)
  • 重读生成概率模型1----基础概念
  • File (文件)• Open (打开)•
  • DNS 服务原理与部署实战:从基础到主从架构搭建
  • 《黑夜君临》网络测试:XSX表现优于PS5及PS5 Pro
  • HDLBits-移位寄存器
  • C++宽度优先搜索算法(BFS算法):FloodFill问题模型
  • ThreadLocal 的工作原理
  • Windows 11 下载安装 CosyVoice2,一键启动
  • 《Vuejs设计与实现》第 16 章(解析器) 下
  • JavaSE——图书系统项目
  • PHP 中 Class 的使用说明
  • Android入门到实战(九):实现书架页——RecyclerView + GridLayoutManager + 本地数据库
  • 日常开发-20250917
  • 基于SpringBoot+Vue的近郊农场共享管理系统(Echarts图形化分析)
  • AI开发实战:从数据准备到模型部署的完整经验分享
  • 【漏洞预警】大华DSS数字监控系统 user_edit.action 接口敏感信息泄露漏洞分析
  • RFID赋能光伏电池片制造智能化跃迁
  • 大数据 + 分布式架构下 SQL 查询优化:从核心技术到调优体系
  • FPGA硬件设计-DDR
  • 卫星通信天线的跟踪精度,含义、测量和计算
  • 忘记MySQL root密码,如何急救并保障备份?
  • Java 异步编程实战:Thread、线程池、CompletableFuture、@Async 用法与场景
  • 贪心算法应用:硬币找零问题详解
  • while语句中的break和continue
  • 10cm钢板矫平机:一场“掰直”钢铁的微观战争
  • Python实现计算点云投影面积