在美国近期对中国和其他国家实施的出口限制背景下,英伟达公司(NVIDIA)迅速应对,开发了专为中国市场设计的新型AI加速器。这些加速器,包括HGX H20、L20 PCle和L2 PCle,旨在符合美国的新贸易限制标准。
美国的新出口规则主要针对专用AI加速器的整体性能,设定了一个较低的计算性能标准,甚至连GeForCE RTX 4090游戏显卡也被禁止出口到中国和俄罗斯等国。在新规则下,计算性能的总处理性能(TPP)不得超过4800,而英伟达的高端游戏显卡则超出此标准。
针对这些限制,英伟达推出的新型AI加速器H20、L20和L2,将从下个月开始批量生产,并将在本月下半月正式向中国市场推出。据悉,H20加速器基于Hopper架构的GH100图形芯片,并采用台积电的CoWoS封装技术。L系列加速器则可能与Ada Lovelace架构有关。H20在特定任务上的性能甚至优于受出口限制影响的H100加速器。
H20加速器配备96 GB的HBM3内存,吞吐量为4 TB/s,INT8整数运算的张量核心性能高达296 Tflops,其TPP值为2368,满足新的出口限制。在FP64操作中,H20提供1 Tflops性能,而在FP16/BF16操作中提供148 Tflops性能。此外,H20功耗为400 W,保留了900 GB/s的NVLink总线支持,允许最多八个加速器聚集。
NVIDIA L20和L2型号则采用PCIe外形尺寸,L20配备48 GB GDDR6显存,INT8操作下提供最高239 Tflops的计算性能。L2型号则配备24 GB GDDR6内存,INT8任务中的峰值计算性能为193 Tflops。L20和L2的TPP值分别为1912和1544。
此举旨在满足中国市场对高端AI加速器的需求,同时遵守国际贸易法规,并展示了英伟达在全球市场中灵活应对变化的能力。这些新产品的引入不仅填补了市场需求,还可能促进中国本地AI技术的发展和应用,提升国内AI产业链的竞争力和创新能力。同时,英伟达在中国市场的持续投入也可能为当地AI行业提供更多技术支持和合作机会。
然而,这也可能带来一些挑战和风险,如市场竞争不公平、国内企业的技术依赖和国际贸易形势的不确定性等。总的来说,英伟达针对新的贸易限制开发的这些专门AI加速器,为中国市场带来了新的机遇和挑战。