一、美国超算中心采用,打入科研领域
Habana Labs创立于2016年,总部位于以色列特拉维夫,2019年被英特尔以20亿美元收购,成为英特尔数据产品集团独立运营的业务部门。
此前,其自研云端AI推理芯片Goya和云端AI训练芯片Gaudi已被云计算巨头亚马逊AWS应用。
如今,两款芯片迎来新的落地进展,加州大学圣地亚哥分校的圣地亚哥超级计算机中心(SDSC)将在其Voyager超级计算机中采用这两款芯片,这也是Habana Labs在科研领域的一次突破。
Voyager超算由美国国家科学基金(NSF)资助,从事天文学、气候科学、化学、粒子物理学等跨学科和工程领域的AI研究。例如在天文学,AI可以被用于对比外太空图像和判断是否有新的太空物质出现。
而Habana Labs的训练及推理芯片将为这些研究起到加速计算的作用。
Voyager集群采用了336片Gaudi芯片用于AI训练,每个训练节点使用了6个400GbE RoCE的高速互联,推理预测采用了16片Goya芯片,预计今年10月可供研究人员使用。
据于明扬分享,Gaudi和Goya提升了Voyager超算AI工作的性能和效率,使研究人员能够使用可编程张量处理器内核和内核库定制模型。
其中,Gaudi内置集成了10个支持RoCE v2(RDMA over Converged Ethernet)100G以太网端口,可以提升扩展的灵活性,避免扩展能力受于限吞吐量。如果搭配Habana的SynapseAI软件平台,使用者操作起来将更加便捷。
于明扬提到,作为一家初创公司,Habana Labs的产品细节还有待提升,其市场战略基本是选择主流的云厂商进行合作,通过与有代表性的用户进行合作,来打磨、完善产品。
二、背靠英特尔生态,仍独立运营
在被问到与英特尔相关的问题时,于明扬回应,Habana Labs仍然作为一家独立公司运营,其市场战略依旧比较独立,也可以及时对用户的问题进行反馈。英特尔为Habana Labs提供了很多客户资源,也使Habana Labs在业内的口碑有所上升。
同时,客户在选择AI芯片时,往往优先选择符合其处理器架构的芯片。在英特尔收购Habana Labs后,双方在生态上有所协同,英特尔的x86处理器也为Habana Labs带来了部分用户。
Habana Labs在被收购后,其技术路线图也没有发生太大的改变,其软件生态也会在模型、工具等方面有很大的进步,还将提供预处理等新功能。
于明扬还特别讲到,因为英特尔的代工业务刚刚起步,所以近两年Habana Labs暂时不会选择英特尔代工,双方会逐步开展更多的合作。
三、预告下一代训练芯片,性能提升超2倍
此前,在AI芯片的训练端,英伟达旗下的GPU(图形处理器)可谓一家独大。而Habana Labs的Gaudi则对这一现状发起了挑战。
于明扬称,Habana Labs的Gaudi芯片与英伟达的旗舰GPU A100相比,虽然性能上还略有不如,但是在性价比上已经实现了超越。他提到,Habana Gaudi基本上已经能够达到A100 70%的性能,而价格则只有A100的一半,这使得很多客户在实际体验后选择了Habana Gaudi。
Habana Labs预计将于明年上半年推出下一代AI芯片,代号为Gaudi 2,将采用台积电7nm制程工艺。与现有的Gaudi芯片相比,Gaudi 2将会有两倍以上的性能提升。
最后,于明扬谈到了未来AI芯片的发展趋势。他认为,异构计算将会是未来芯片的发展方向,GPU、FPGA、ASIC等各类芯片将会根据特点不同,在计算集群中担任不同的任务。而未来的挑战就是如何将不同的任务,部署到最合适的架构上。
结语:背靠英特尔,提升市场竞争力
在加入英特尔的整个生态体系后,Habana Labs的客户资源得到了提升,在产品性价比不错的前提下,为当今的AI芯片市场提供了一种新的选择。而英特尔也借此丰富了自己的武器库,加强了自己在AI芯片领域的实力。在于明扬看来,SDSC作为美国少数超算中心之一,选择Habana Gaudi、Goya,某种程度上说明SDSC看好ASIC芯片在超算集群中的应用前景,也证明Habana Labs的产品在科研领域有一定的发展潜力。
随着Habana Labs产品细节的完善,其AI芯片的市场竞争力也在不断提升,可能会对英伟达在AI训练等领域的地位发起挑战。