2024-06-04
近日,英特尔、Google、微软、Meta等八家科技巨头联合宣布建立“超加速器链接推广小组”(UALink Promoter Group,简称UALink),意在制定行业标准,指导数据中心内AI加速器芯片之间连接组件的发展。在业内专家看来,此举背后的真正深意,在于挑战英伟达的NVLink技术和其在AI加速器领域的霸主地位。
不止来势汹汹 而且有备而来
该小组成员包括英特尔、Google、微软、Meta、AMD、慧与、博通和思科。其中,英特尔、AMD和博通是全球领先的芯片制造商;微软和谷歌是云服务提供商,和身为社交媒体巨头的Meta都在自研芯片;慧与是专注企业业务的云和设备公司,思科是网络解决方案供应商。
在业内人士看来,八家公司明显有备而来,意欲通过全产业链联合,对抗英伟达在AI加速器领域的统治。
UALink在宣布成立的同时,就已开发出了一项新的行业标准,致力于推进数据中心内连接的大规模AI系统的高速和低延迟通信。UALink计划在今年第三季度成立一个官方行业联盟,并向加入该联盟的公司提供UALink 1.0技术。该技术将能够在单个集群中连接多达1024个AI加速器,通过将大量加速器连接在一起,共同完成大规模计算任务。在第四季度,UALink还将发布其互联技术的第一轮迭代版本UALink 1.1。
为了在AI领域不落人后,微软、谷歌、Meta等企业目前已经花费了数十亿美元购买英伟达的GPU。由于只要使用英伟达的GPU就必须使用英伟达专有的NVLink间连接技术,这让各大企业感到非常被动。UALink的组建,就是各大企业想联合起来摆脱对英伟达的依赖。
AMD数据中心解决方案总经理Forrest Norrod表示,行业需要一种标准,允许创新不受任何一家公司的束缚,快速推进。博通数据中心解决方案事业部副总裁Jas Tremblay表示,开放的生态系统协作对于通过各种高速和低延迟解决方案实现网络扩展至关重要。
据悉,首批UALink产品将在未来几年推出。
针锋相对 剑指英伟达
UALink“步步为营”的操作,剑指英伟达的NVLink技术。NVLink是英伟达在2014年发布的一种总线及其通信协议,采用点对点结构、串列传输,用于中央处理器(CPU)与图形处理器(GPU)之间的连接,也可用于多个图形处理器之间的相互连接。其特点包括高速、低延迟和高带宽,为多个GPU之间提供了直接连接,从而显著提升系统的性能和可扩展性。英伟达凭借NVLink技术约占全球AI数据中心市场中80%~95%的份额,实现了高度垄断。如今,英伟达已经推出了第五代NVLink和NVLink Switch 7.2T。
NVLink的连接协议并不是第一次被挑战。英特尔在2019年3月在Interconnect Day 2019上推出了Compute Express Link (CXL)协议,作为一种开放性互联协议,CXL能够让CPU与GPU、FPGA或其他加速器之间实现高速高效的互联,满足高性能异构计算的要求。但CXL目前尚未达到NVLink在GPU间直接连接的性能水平,尤其是在带宽和延迟方面。其他像PCIe、QPI和InfiniBand都有各自的优势,但在带宽、延迟以及与GPU间连接方面不及NVLink。
英伟达2024第一财季财报显示,公司期内实现营收260.44亿美元,同比上涨262%,远高于市场预期的247亿美元。数据中心业务营收为226亿美元,与上年同期相比增长427%。这些数据证明,英伟达依然拥有市场掌控权。
专家认为,英伟达在技术实力和生态建设上仍然具有明显优势,UALink的建立短期内对英伟达造不成太大威胁。英伟达的NVLink并不向行业开放,而UALink是完全开源的,不仅适用于大型企业,也为行业中的所有人提供了一个在规模和创新方面与英伟达竞争的机会。UALink能否激发行业更多的创新和竞争,降低行业对英伟达的依赖,时间将给出答案。
来源:中国电子报、电子信息产业网