Wccftech 发布博文,报道称英伟达计划在 2028 年推出的 Feynman GPU 中,集成 Groq 的 LPU技术,意图主导 AI 推理市场。
理查德·费曼(全称:理查德·菲利普斯·费曼,Richard Phillips Feynman,1918年5月11日—1988年2月15日),美籍犹太裔物理学家,美国国家科学院院士,诺贝尔物理学奖获得者,生前是加州理工学院理查德·托尔曼理论物理学教授。提出了费曼图而闻名,他因该工作与施温格、朝永振一郎共同获得 1965 年诺奖。1988年2月15日在加州洛杉矶逝世,终年69岁。
GPU 领域专家 @AGF 近日于 X 平台分析预测,Feynman GPU 将借鉴 AMD 在 X3D 处理器上的成功经验,极有可能采用台积电先进的 SoIC(系统整合芯片)混合键合技术,实施 3D 堆叠设计。
根据这一构想,主计算裸片(compute die,包含 Tensor 单元与控制逻辑)将采用台积电最先进的 A16(1.6nm)工艺制造,而包含大规模 SRAM 存储库的 LPU 单元则会制成独立的 Die,直接堆叠在计算核心之上。
这种设计利用了 A16 工艺的“背面供电”特性,释放了芯片正面空间用于垂直连接,从而实现超低延迟的数据传输。
该专家分析认为英伟达之所以考虑这种复杂的堆叠方案,主要源于物理层面的限制。随着制程工艺不断微缩,SRAM 的缩放速度已明显滞后于逻辑电路。将显存放置于核心之上,如果这项技术用在消费级显卡上,显卡显存损坏会无法维修。
如果在昂贵的先进制程节点上制造单片式的大容量 SRAM,不仅会造成高端硅片的浪费,还将导致晶圆成本急剧飙升。因此,将 LPU / SRAM 剥离为独立 Die 并进行堆叠,成为平衡性能与成本的最优解,这也符合当前半导体行业追求“芯粒”(Chiplet)化的技术趋势。