机器之心报说念体育游戏app平台
裁剪:佳琪
发言东说念主将「工程迭代」称为「往往且在料思之中」。
本年的的 GTC 大会,将 AI 芯片的标杆推向了难以思象的高度。
为了匡助宇宙构建更大、更智能的 AI,英伟达开头拿出了宇宙上开端进的 GPU—— Blackwell 系列。
Blackwell 领有 2080 亿个晶体管,在合并颗芯片上集成了两个 GPU。其两块小芯片之间的互联速率高达 10TBps,绝对管束了内存瓶颈暖热存问题。
与前代家具 H100 比较,Blackwell 的性能普及不异令东说念主注重,达到了 Hopper 的 30 倍。
以熟识一个 1.8 万亿参数的 GPT 模子为例,如若使用 Hopper,需要 8000 个 GPU,消费 15 兆瓦电力,熟识 3 个月;而换成 Blackwell,仅需 2000 个 GPU,就能在不异的时期内完成,能耗只需 4 兆瓦,终清楚性能和效果的双重打破。
Blackwell 的量产问世,无疑将为 AI 模子熟识和东说念主形机器东说念主的发展注入刚劲能源,对通盘 AI 诓骗生态也将产生深刻影响。
自 3 月份发布,6 月份晓示投产以来,Blackwell 领先定于 2024 年第二季度发货,各人科技公司王人在猖獗求购。
但在原定的发货时期,传出了 Blackwell 因为良品率低,将推迟发货的音书。
那时,在 2025 财年第二季度财报电话会议上暗示,联想上的问题王人已建筑,有望在第四季度终了量产。
当今,英伟达的客户又在惦记一个新问题,当芯片荟萃到 Nvidia 我方的作事器机架时,会过热。
据 The Information 报说念,英伟达 Blackwell GPU 在 72 核的作事器上表露了过热隐患。这些作事器每个机架的功耗瞻望高达 120 千瓦,过热问题不仅铁心了 GPU 的性能,还可能损坏组件。为此,英伟达不得未几次重新评估作事器机架的联想决议。
这激勉了谷歌、Meta 和微软等大客户对能否如期在其数据中心部署 Blackwell 的担忧。
为此,英伟达已条款供应商对机架进行多项联想变更,进一步推迟了预期发货日历。该公司发言东说念主将「工程迭代」神情为「往往且在料思之中」。
此前,由于 GPU 良率不高的问题,Blackwell 的量产贪图就推迟了一次。
本年 8 月,有媒体称 Blackwell 存在联想过错。由于 Blackwell 是英伟达首个接受 MCM(多芯片封装)联想的 GPU,在合并个芯片上集成了两个 GPU。
这种「二合一」的改进,显着不成再通过传统模式来打造。Blackwell 的 B100 和 B200 GPU 两个型号使用台积电的 CoWoS-L 封装时期荟萃两个芯片,该时期依赖于配备局部硅互连(LSI)桥接器的 RDL 中介层,以终了约 10 TB/s 的数据传输速。
然而,由于 GPU 芯片、LSI 桥、RDL 中介层和主板基板之间的热推广特质不匹配,导致封装结构出现曲折,从而激勉系统故障。
对此,黄仁勋暗示:「咱们的 Blackwell 芯片存在联想过错,天然不错往往使用,但该联想过错导致良率低下」。
更多确定可参见:《100% 英伟达的错:黄仁勋证据 Blackwell 过错建筑,明岁首出货》
最终更动版的 Blackwell GPU 直至 10 月底才运行量产,这意味着英伟达最快也要比及来岁 1 月底智商向客户请托这些处理器。
而 Blackwell 正在濒临前所未有的需求。近期,黄仁勋在摩根士丹利举办的投资者会议上显现,Blackwell 还是沿途售罄。摩根士丹利分析师 Joe Moore 指出,英伟达高管称,Blackwell GPU 家具的订单积压已达 12 个月。
AWS、CoreWeave、谷歌、Meta、微软和甲骨文等科技巨头,还是采购了英伟达过甚制造结搭伙伴台积电在将来四个季度内能出产的扫数 Blackwell GPU。
这种焕发的需求标明,尽管 AMD、英特尔以及各大云作事商正极力分得一杯羹,英伟达在 AI GPU 的指点地位还将进一步谨慎并扩大。
四肢东说念主类历史上估值最高的股票,英伟达将于本周三公布收益。与 8 月份的情况相似,在雷同的时期节点,又传出了研究下一代 Blackwell 芯片出问题的音书。
在英伟达承认 Blackwell 存在联想过错导致良品率低后,那时刚创下历史新高的英伟达股票收跌 2.81 %,又回落到了 140 好意思元以下。
这一次,英伟达的股价又会发生怎样的变化呢?
https://www.theinformation.com/articles/nvidia-customers-worry-about-snag-with-new-ai-chip-servers
https://www.tomshardware.com/pc-components/gpus/nvidias-data-center-blackwell-gpus-reportedly-overheat-require-rack-redesigns-and-cause-delays-for-customers