找回密码
 立即注册
搜索

英伟达Vera Rubin超级芯片首次曝光

[复制链接]
xinwen.mobi 发表于 2025-11-3 09:31:47 | 显示全部楼层 |阅读模式
英伟达Vera Rubin超级芯片首次曝光,AI算力提升3倍
黄仁勋手持那颗闪耀着金属光泽的芯片,背后屏幕上“Vera Rubin”的字样格外醒目——这不仅是又一款新芯片的发布,更是英伟达向5万亿美元市值冲刺的底气。

在华盛顿特区举办的GTC DC 2025大会上,英伟达CEO黄仁勋首次向世界展示了下一代AI芯片——Vera Rubin超级芯片。这款以天文学家名字命名的芯片,不仅承载着英伟达对科学探索的致敬,更是其应对行业竞争、定义下一代计算模式的关键举措。

此次发布具有里程碑意义,它推动英伟达股价上涨2.99%,报收207.04美元/股,使英伟达成为全球首个市值破5万亿美元的科技公司。

01 架构突破:Vera Rubin的技术革命
英伟达Vera Rubin超级芯片采用一体化设计,在一块主板上整合了一颗Vera CPU和两颗Rubin GPU。

这种设计延续了英伟达Grace Blackwell的架构思路,但在性能和规格上实现了跨越式提升。

Vera CPU搭载了88个定制Arm架构核心,支持高达176线程,相比前代产品,其微架构可能进行了进一步优化,尽管英伟达尚未完全公布Vera CPU的具体架构细节。

每个Rubin GPU配备8个HBM4堆栈,容量达288GB。

HBM4是新一代高带宽内存,其带宽将从当前Blackwell的8TB/s提升至13TB/s,这意味着数据传输速度大幅提升,能够更好地满足AI大模型训练的海量数据需求。

互联技术一直是英伟达保持竞争优势的关键。

Vera Rubin超级芯片采用NVLINK-C2C互联技术,带宽达到了惊人的1.8TB/s,用于Vera CPU与Rubin GPU之间的高速连接。

02 性能飞跃:从Blackwell到Rubin
性能表现是Vera Rubin最引人注目的亮点。

单颗Rubin GPU的FP4精度计算能力约为50 PetaFLOPS,这意味着由两颗GPU组成的超级芯片FP4精度计算能力可达约100 PetaFLOPS。

在系统级性能方面,Vera Rubin NVL144平台可实现3.6 Exaflops的FP4推理算力与1.2 Exaflops的FP8训练算力,相比GB300 NVL72提升约3.3倍。

这一提升不仅源于芯片本身的设计,还得益于全系统优化。

Vera Rubin NVL144的系统总显存带宽为13TB/s,快速存储容量为75TB,分别较上一代提升60%。

同时,其具备双倍的NVLINK与CX9通信能力,最高速率分别达260TB/s与28.8TB/s。

03 产品路线图:从Rubin到Rubin Ultra
英伟达已经制定了清晰的产品路线图。

Rubin GPU目前已回到实验室进行测试,是由台积电代工的首批样品,预计将在2026年第三或第四季度进入量产阶段。

更为引人注目的是,英伟达计划在2027年下半年推出更高阶的Rubin Ultra NVL576平台。

这一平台将NVL规模从144扩展至576,CPU架构维持不变,GPU则升级为四颗Reticle尺寸核心。

Rubin Ultra NVL576平台的FP4推理算力高达15 Exaflops,FP8训练算力为5 Exaflops,相较GB300 NVL72提升高达14倍。

其HBM4显存带宽达到4.6PB/s,快速存储容量为365TB,分别是上一代的8倍。

这一系统将整个机架重新布局,单个机架规模解决方案内配有576个GPU,堪称真正的超算级别配置。

04 战略布局:不止于AI
黄仁勋特别强调,Rubin平台“并非单纯为AI设计,而是兼顧科研与AI的双重任务”。

它未为低精度AI性能牺牲传统高效能运算能力,依旧支持高精度FP64科学计算,确保物理模拟、气候模型、量子化学等科研任务能获得充分性能。

这一定位精准回应了AI平台常忽略科研需求的行业痛点。

英伟达的战略布局已经超越了传统的AI训练与推理市场,向更广阔的科研和国家战略领域扩展。

首批Vera Rubin系统将由惠普协助构建,部署于美国洛斯阿拉莫斯国家实验室(LANL)。

这些系统分别命名为“Mission”和“Vision”,前者专注国安任务,计划在2027年上线;后者服务开放科研与AI模型开发。

05 量子计算与AI工厂:生态系统的扩展
除了Vera Rubin芯片本身,英伟达还推出了NVIDIA NVQLink,这是一种开放式系统架构,可将GPU计算的极致性能与量子处理器紧密结合。

NVQLink实现了来自QPU的实时CUDA-Q调用,延迟低至约4微秒,以构建加速的量子超级计算机。

目前,已为17家QPU制造商、5家控制器制造商和9个美国国家实验室实现了量子和GPU计算的互联。

这一技术被黄仁勋称为“连结量子与经典超算的罗塞塔石碑”,解决了量子运算扩展中的整合难题。

同时,英伟达还推出了 Omniverse DSX,这是一个用于设计和运营100兆瓦到数千兆瓦(吉瓦级)AI工厂的综合蓝图。

一旦AI工厂完成虚拟设计,英伟达的合作伙伴就会提供工厂制造、测试并即插即用的预制模块,这将大大缩短构建时间并实现模块化可扩展性。

06 产业影响:重新定义竞争格局
Vera Rubin的发布正值竞争对手AMD刚刚拿下美国能源部10亿美元超算合约之际,在高性能计算市场掀起波澜。

为此,Vera Rubin被英伟达定义为“迄今最复杂计算平台”,从架构到性能均瞄准全面超越。

英伟达还与诺基亚合作打造支持6G的AI平台,推出AI原生无线6G技术栈NVIDIA Arc。

基于NVIDIA Aerial平台,并由加速计算驱动,未来诺基亚将集成这项技术。

此外,BlueField-4 DPU的推出进一步完善了英伟达的全栈式加速计算布局。

相较于之前的BlueField-3,BlueField-4可提供6倍计算能力且支持的AI工厂规模增加4倍。

Vera Rubin超级芯片的亮相不仅引发了行业震动,其“兼顾科研与AI”的定位、3.6 Exaflops推理算力的硬件指标,以及NVQLink对量子计算的布局,很可能将重新定义全球超算与计算竞争的全局。

当黄仁勋在GTC舞台上举起Vera Rubin芯片时,他手中握着的不仅是硅晶片与金属,更是未来几年全球AI发展的风向标。

从Blackwell到Rubin,英伟达的芯片迭代速度已让竞争对手难以企及,而Vera Rubin的问世,将进一步巩固其在AI计算领域的绝对领导地位。

回复

使用道具 举报

QQ|周边二手车|手机版|标签|新闻魔笔科技XinWen.MoBi - 海量语音新闻! ( 粤ICP备2024355322号-1|粤公网安备44090202001230号 )

GMT+8, 2025-12-18 04:19 , Processed in 0.150519 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表