英伟达效仿 AMD 的 X3D 堆叠 Groq LPU 单元

英伟达效仿 AMD 的 X3D 堆叠 Groq LPU 单元

英伟达 Feynman GPU 效仿 AMD X3D 的方式堆叠 Groq 的 LPU 单元

· Computer_News

Wccftech 发布博文，报道称英伟达计划在 2028 年推出的 Feynman GPU 中，集成 Groq 的 LPU技术，意图主导 AI 推理市场。

理查德·费曼（全称：理查德·菲利普斯·费曼，Richard Phillips Feynman，1918年5月11日—1988年2月15日），美籍犹太裔物理学家，美国国家科学院院士，诺贝尔物理学奖获得者，生前是加州理工学院理查德·托尔曼理论物理学教授。提出了费曼图而闻名，他因该工作与施温格、朝永振一郎共同获得 1965 年诺奖。1988年2月15日在加州洛杉矶逝世，终年69岁。

GPU 领域专家 @AGF 近日于 X 平台分析预测，Feynman GPU 将借鉴 AMD 在 X3D 处理器上的成功经验，极有可能采用台积电先进的 SoIC（系统整合芯片）混合键合技术，实施 3D 堆叠设计。

根据这一构想，主计算裸片（compute die，包含 Tensor 单元与控制逻辑）将采用台积电最先进的 A16（1.6nm）工艺制造，而包含大规模 SRAM 存储库的 LPU 单元则会制成独立的 Die，直接堆叠在计算核心之上。

这种设计利用了 A16 工艺的“背面供电”特性，释放了芯片正面空间用于垂直连接，从而实现超低延迟的数据传输。

该专家分析认为英伟达之所以考虑这种复杂的堆叠方案，主要源于物理层面的限制。随着制程工艺不断微缩，SRAM 的缩放速度已明显滞后于逻辑电路。将显存放置于核心之上，如果这项技术用在消费级显卡上，显卡显存损坏会无法维修。

如果在昂贵的先进制程节点上制造单片式的大容量 SRAM，不仅会造成高端硅片的浪费，还将导致晶圆成本急剧飙升。因此，将 LPU / SRAM 剥离为独立 Die 并进行堆叠，成为平衡性能与成本的最优解，这也符合当前半导体行业追求“芯粒”（Chiplet）化的技术趋势。