发布时间:2025年11月09日 08:24
梦晨 发自 凹非寺量子位 | 公众号
英伟达最强芯片B200被迫推迟三个月,传闻闹的沸沸扬扬。
老黄的对策来了:阉割版芯片B200A曝光。
这难道就是“产能不够,刀法来凑”?
没错,经分析可知,B200所碰到的主要问题便是产能欠缺,进一步来讲,乃是台积电的新型封装工艺CoWoS-L产能不足。
阉割版的B200A将先用于满足中低端AI系统的需求。
阉割版B200A,内存带宽缩水
为什么说B200A是阉割版?
该指标主要体现于内存带宽,其值为4TB/s,相较于年初发布会所宣传的B200的8TB/s,直接缩减了一半,是这样的情况,没错吧,有问题否,句号。
这背后,是封装工艺,从CoWoS-L退回CoWoS-S了,甚至,B200A据称,也兼容三星等,其他非台积电的,2.5D封装技术。
总体而言,CoWoS先进封装当下存有三个变体,分别是CoWoS-S、CoWoS-R以及CoWoS-L,其主要的差异之处在于中介层()所具备的方案 。
中介层处在芯片晶圆与印刷电路板的中间地带,将芯片与封装基板间的信息交换予以达成,与此同时,把机械支撑以及散热能力都提供出来。
CoWoS-S结构最简单,中介层就相当于一片硅板。
CoWoS-R运用了RDL技术,也就是再分布层技术,中介层是那种多层结构的薄金属材料 。
CoWoS-L最为复杂,它在RDL中介层里加入了一种LSI芯片,也就是局部硅互联。凭借此, CoWoS-L实现了更高布线密度,还能被制作成更大尺寸。
台积电推出CoWoS-L,这是因为,旧版技术,在尺寸方面,继续增长面临困难,在性能方面球迷网,同样继续增长面临困难 。

比方说,在AMD的AI加速芯片MI300之上,CoWoS-S中介层已然扩展至原本标准的3.5倍之多,然而,依旧难以达成未来AI芯片性能增长的需求。
但当下,有消息传出CoWoS-L在产能提升进程里碰到了一些状况,或许会出现硅、中介层以及基片各自之间热膨胀系数不相符的情形,进而致使弯曲现象发生,这就需要进行重新设计了。
之前,台积电构建了诸多CoWoS - S产能,英伟达占有了最大份额 ,如今,英伟达的需求能够快速转向CoWoS - L,然而,台积电需要时间才可将产能转换至新工艺 。
又有消息表明,B200A的核心,也就是内部型号为B102的部分,在未来会被用以制造特别版B20,详细情况不提了,明白的人自然都清楚。
B200训大模型,还面临其他挑战
主要推行的规格乃是“新一代计算单元”GB200 NVL72,存在这样一种情况,一个机柜当中具备36块CPU以及另有72块GPU 。
算力极其到位,一个机柜,在进行FP8精度的训练之时,其所含算力竟然高达,简直直逼H100那个时代里,一个由1000个组成的DGX超级计算机集群。
可是耗电这方面也是十分到位的,依据估计来看,功率密度大概是每个机柜125kW,从来都没有过。在供电方面带来挑战,在散热方面带来挑战,在网络设计方面带来挑战,在并行方面带去挑战,在可靠性方面带去挑战。
其实呢,那被应用于大模型训练的H100万卡集群,在业界范围之内,也依旧未曾彻底将其驯服妥当呢。
比如说,Llama 3.1系列的技术报告表明了,在训练的过程当中,平均每3个小时就会出现一次故障,而在这些故障里面,由GPU所引发的问题占据了58.7% 。
共计419次故障里头,148次是因各类GPU故障导致,这里的故障涵盖了各种情况,72次能够确切知晓是由HBM3内存故障引发的 。
所以,从总体上去看,即便老黄最后进行了B200的发货,然而,AI领域的巨头要切实完成B200集群的搭建,并且使其投入到大模型的训练之中,依旧是需要更多的时长的。
此刻已然开启训练或者快要达成且有可能步入准备状态的GPT - 5、3方面5类别Opus、Llama 4等大概是运用不上了,得去往再下一代的新型模型才能够目睹其能够展现出来的那种具备强大效能的威力。
One More Thing
针对B200推迟的传闻,英伟达给出了官方回应:
的需求强劲,的样品试用已广泛开始,产量有望下半年增加。
具体会不会延迟三个月,不做具体答复。
然而,摩根士丹利于最新报告里展现出较为乐观的态度,觉得生产仅仅会停顿大概两周的时间 。
参考链接:,此处为:,斜杠杠杠杠杠,表示为:,斜杠杠杠杠,紧跟其后的是:,斜杠杠杠杠杠杠,再之后是:,斜杠杠杠杠杠杠杠杠,接着是:,斜杠杠杠杠!而那个则是:,斜杠杠杠杠杠杠杠杠,后面跟着的是:,。