劲敌之下,英伟达如何领军AI的科技?

时间:2020-07-28 11:27:46       来源:亿欧网

随着企业和云巨头在人工智能领域的大量投资,英伟达的特斯拉服务器GPU的销量也飞速飙升。在市场规则下,会有更多同类竞争者涌入市场,那么英伟达是否能继续保持其现有市场份额?

本文从四方面进行分析:1)英伟达特斯拉GPU目前市场销售情况;2)英伟达的技术优势;3)英伟达在深度学习领域的成果;4)英伟达与谷歌、英特尔产品的差异。

随着英特尔、AMD、富士通和谷歌的加入,英伟达在为人工智能化项目提供服务器协同处理器的白热化市场中面临更加激烈的竞争环境。但是英伟达作为GPU巨头,近年来所建立的生态系统,以及其正在进行的大规模研发投资,应该能让它在这一领域保持重要的地位。但是不可否认的是,英伟达所面临的市场竞争压力也越来越大。

经济学的一条基本原则是,当市场需求激增,导致少数供应商获取巨额利润时,更多的供应商将会进入这一领域,他们也希望能从中获取大量利润。这一现象在应用于AI项目的服务器加速卡方面尤为明显,因为随着企业和云巨头在人工智能领域的大量投资,英伟达的特斯拉服务器GPU的销量也飞速飙升。

在一定程度上,由于与AI相关需求的猛增,英伟达的数据中心产品部门在继2017年1月份实现增长205%之后,2017年4月营收同比增长186%,达到4.09亿美元。这样的增长是不容被忽视的。在过去的12个月里,其他几家芯片制造商及一个云巨头已经推出了竞争芯片或宣布了同类计划。

要理解为什么这些竞争对手的产品可以在原材料价格和性能方面与特斯拉GPUs竞争,那么明白为什么英伟达的芯片在一开始就备受欢迎就显得十分重要。然而正如它们在电脑和手机方面的竞争者一样,服务器的CPUs拥有少量相对强大的CPU内核。应用在因特尔Xeon Scalable服务器CPU上最强大的芯片有28个内核,GPUs可以实现上千个内核并行工作,并能实现瞬间存储。

因此,在AI子领域深度学习方面,GPUs具有明显的优势。深度学习涉及到训练模型,该模型试图实现像人类大脑神经元一样工作,来检测内容模式,比如声音,文字和图像,同时算法在该模型的应用能让模型在同时接受更多内容时有更好的理解,而且把它们学到的应用于未来的工作中。一旦算法变得足够好,它就可以用在推理活动中,来处理真实世界的事件。

推理算法并不需要大量的处理能力。GPU可以很好地处理它们,而英伟达当然也在尝试增加它在这个领域的曝光率,但是很多服务器的推理工作使用的是因特尔的Xeon CPU。苹果公司以隐私为由,更倾向于在iOS设备上直接针对用户数据运行人工智能算法。

然而,通过培训一种深度学习模型来创建一个算法需要非常严苛的计算,而对这种算法的要求是能很好的理解所显示的数据,比如翻译文本或在自动驾驶系统中能检测停车标志和交通信号灯。在训练中,成千上万甚至数百万的人工神经元被分成负责不同任务的“层”来与另一层的神经元进行交流,从而来衡量对数据做出的特定判断是否准确。

通过使用特斯拉GPU集群,其中每一个都有成千上万的内核来分解所有这些人工神经元,同时实现并行工作,那么相对于使用少于30个内核的服务器CPU,AI研究员可以更快地训练出一个深度学习模型。而且也有利于增强英伟达高端特斯拉GPU在深度学习算法执行的数学运算能力,并可以提供一种具有大量内存带宽和用于通信的高速芯片与芯片互连的模型。

但这并不意味着GPU是唯一适合于培训深入学习模型的处理器。理论上,芯片制造商可以开发出一种具有数千个可以优化处理深度学习算法的ASIC,并能高速地与其内存和其他ASIC进行沟通。

英特尔似乎也有这样的想法。随着技术和人才的帮助,英特尔从去年收购的创业公司Nervana Systems中受益颇多,芯片巨头正在准备一种深度学习的ASIC——Lake Crest芯片,它承诺该芯片将具备“前所未有”的并行处理能力和“比当今GPU具备更多的原始计算”能力。据说,Lake Crest能支持每秒1TB的内存带宽,并且依赖于一个比标准PCI Express链接快20倍的交互。

英特尔还想推出Knights Crest,这是一款集成了Nervana技术的产品,应用于Xeon Phi协同处理器。Xeon Phi芯片通常用于不太复杂的人工智能项目,以及用于分析和高性能计算工作负载。

与此同时,谷歌也推出其张量处理单元(TPU)的第二代版本。而谷歌在2016年推出的第一代TPU仅仅是为了进行推理,第二代的版本作为一个4芯片的模块,由几十个集群组成,也有能力培训深度学习模型。

谷歌声称TPU模块能提供高达180次的浮点运算,超过英伟达近期推出的其120次浮点运算的Tesla V100旗舰服务器GPU,该GPU可以提供一定的深度学习操作。然而,它只是用于谷歌的TensorFlow软件框架,也只是其中一个常见的深度学习框架。此外,谷歌没有直接销售TPU的计划,谷歌只计划使用该模块为内部人工智能项目提供服务,并为云基础设施客户提供访问它们的机会。

关键词: 英伟达的科技