目录

“疯狂”的H100遭遇微软砍单?

2023年初以来,由ChatGPT引发的AI大模型热潮,催生了庞大的AI算力需求,也带火了英伟达的AI芯片,特别是H100芯片不仅价格水涨船高,而且“一芯难求”。然而,9月20日,网传微软砍单英伟达H100芯片的消息。这一传言的真实性以及微软和英伟达之间的合作情况,引发了市场的广泛关注和猜测。

据了解,H100是目前训练大语言模型最需要的图形处理器(GPU),因为它对于大模型的推理和训练都是速度最快的,通常也是推理方面性价比最高的。它可以应用于各种AI场景,如AI聊天机器人、推荐引擎、视觉AI、数据分析、高性能计算等。H100芯片还可以搭配英伟达AI Enterprise软件套件,为企业提供端到端的AI就绪型基础架构。

作为一款功能强大的AI芯片,英伟达H100也是微软Azure云计算服务中的核心组件之一。2021年,微软与英伟达达成了合作协议,采用了数万颗英伟达H100芯片来支持其AI和云计算服务。这项合作计划在当时被视为一个重大的商业胜利,也为微软提供了更多的竞争优势。

然而,最近有传言称,从2022年底开始热销的英伟达H100市场开始饱和,导致客户下单状况不如以前疯狂。特别是随着ChatGPT的热潮逐渐退去,微软开始下调英伟达H100芯片的订单,并放缓了拉货速度。市场消息人士还指出,除了ChatGPT热潮消退外,AI协作工具Microsoft 365 Copilot的需求也不如之前强烈,也是微软下调芯片订单的一个原因。

此前,在《金融时报》的一篇文章中,Nvidia报告称,预计2023年将在全球范围内出货 55万个最新的H100 GPU。对 GPU 的需求显然来自生成式 AI 热潮,但 HPC 市场也在争夺这些加速器。甚至沙特、阿联酋也分别购买了数千个英伟达AI芯片,以推动其国内的生成式AI的发展。

据投行瑞杰金融估计,每枚英伟达H100芯片的制造成本为3320美元,而给客户的售价却高达25000至30000美元。而知名科技媒体Tom‘s Hardware也称,英伟达H100芯片的成本利润率高达1000%,即十倍。因此,回顾过去数月英伟达AI芯片强劲的市场表现,也不得不令人有些意外。

目前,尽管这一传言引发了市场的热议,但微软和英伟达尚未就此事发表正式声明或回应。同时,中国台湾厂AI供应链也表示,英伟达AI芯片仍然供不应求,微软仍然维持2024年需求量翻倍的展望。同时,微软还上调了GH200芯片的订单量,表明AI服务器长期增长动能不变。

据英伟达介绍,GH200 Grace Hopper超级芯片是专为计算和内存密集型工作负载而设计,它在最苛刻的前沿工作负载上提供了更高的性能,如基于Transformer的大型语言模型(具有数千亿或数万亿参数)、具有数万亿字节嵌入表的推荐系统和矢量数据库。

GH200 Grace Hopper 超级芯片的逻辑概述 来源:英伟达 

在MLPerf行业基准测试上,与H100 GPU相比,英伟达GH200 Grace Hopper超级芯片具有更高的内存带宽和更大的内存容量,性能高出17%。

Grace Hopper与DGX H100 SXM在MLPerf推理数据中心性能结果的比较  来源:英伟达

由此可见,在当前大模型等 AI 应用呈井喷式增长的背景下,智能算力的需求将依旧旺盛。

文章来自:https://www.eet-china.com/