人工智能芯片有两个功能。AI 构建者首先获取大量(或真正庞大的)数据集并运行复杂的软件来寻找该数据中的模式。这些模式被表示为模型,因此我们有芯片来“训练”系统生成模型。在芯片工艺中,等离子清洗机能够提供出色的表面处理方案,解决表面处理难题。

AI训练芯片.png

然后,该模型用于根据新数据进行预测,并且该模型从该数据中推断出一些可能的结果。在这里,推理芯片针对已经训练过的模型运行新数据。这两个目的是非常不同的。

训练芯片旨在全速运行,有时一次运行数周,直到模型完成。因此,训练芯片往往很大。

推理芯片更加多样化,其中一些用于数据中心,另一些用于智能手机和摄像机等设备的“边缘”。这些芯片往往更加多样化,旨在优化不同方面,例如边缘的电源效率。当然,还有各种中间变体。关键是“AI芯片”之间存在很大差异。对于芯片设计师来说,这些是非常不同的产品,但与所有半导体产品一样,最重要的是在它们上面运行的软件。从这个角度来看,情况要简单得多,但也复杂得令人眼花缭乱。

很简单,因为推理芯片通常只需要运行来自训练芯片的模型(是的,我们过于简单化了)。之所以复杂,是因为在训练芯片上运行的软件千差万别。这是至关重要的。现在有成百上千个框架用于训练模型。有一些非常好的开源库,但也有许多大型 AI 公司/超大规模公司构建了自己的库。

由于训练软件框架的领域非常分散,实际上不可能构建针对它们优化的芯片。正如我们过去指出的那样,软件中的小改动可以有效抵消专用芯片提供的增益. 此外,运行训练软件的人希望该软件针对其运行的芯片进行高度优化。运行这个软件的程序员可能不想弄乱每个芯片的复杂性,他们的生活已经够辛苦的了,构建这些训练系统。他们不想只为一个芯片学习低级代码,以后又要为新芯片重新学习技巧和快捷方式。即使该新芯片提供“20%”更好的性能,重新优化代码和学习新芯片的麻烦也会使该优势变得毫无意义。

AI训练芯片.png

这让我们想到了 CUDA——Nvidia 的低级芯片编程框架。至此,任何从事培训练系统工作的软件工程师都可能对使用 CUDA 有所了解。CUDA并不完美、优雅或特别简单,但它很熟悉。巨大的财富建立在这样的奇思妙想之上。由于用于训练的软件环境已经如此多样化且变化迅速,因此训练芯片的默认解决方案是 Nvidia GPU

所有这些人工智能芯片的市场目前规模为数十亿美元,预计在可预见的未来每年将增长 30% 40%。麦肯锡的一项研究(可能不是这里最权威的来源)显示,到 2025 年,数据中心 AI 芯片市场将达到 130 亿美元至 150 亿美元——相比之下,目前 CPU 市场总额约为 750 亿美元。

在价值 150 亿美元的人工智能市场中,大约三分之二是推理,三分之一是训练。所以这是一个相当大的市场。所有这一切的一个问题是训练芯片的价格在 1,000 美元甚至 10,000 美元,而推理芯片的价格在 100 美元以上,这意味着训练芯片的总数只占总数的一小部分,大约 10%-20% 的单位。

从长远来看,这对市场如何形成很重要。

Nvidia 将获得大量训练利润,它可以在推理市场竞争中发挥作用,类似于英特尔曾经使用 PC CPU 来填充其晶圆厂和数据中心 CPU 以产生大部分利润。

需要明确的是,英伟达并不是这个市场上唯一的参与者。AMD 也生产 GPU,但从未开发出有效(或至少被广泛采用)的 CUDA 替代品。他们在 AI GPU 市场的份额相当小,我们认为这种情况不会很快改变。

芯片等离子清洗机.png

有许多初创公司试图构建训练芯片,但大多因上述软件问题而陷入困境。值得一提的是,AWS 还部署了自己的、内部设计的训练芯片,巧妙地命名为Trainium。据我们所知,这取得了一定的成功,AWS 除了自己的内部(大量)工作负载外,在这里没有任何明显的优势。然而,我们知道他们正在推进下一代 Trainium,因此他们对目前的结果一定很满意。

其他一些超大规模企业也可能正在构建自己的训练芯片,尤其是谷歌,它即将推出专门针对训练进行调整的新 TPU 变体。这就是市场。简而言之,我们认为训练计算市场上的大多数人都希望在 Nvidia GPU 上构建他们的模型。

本文来源于半导体行业观察 ,仅供分享,如有侵权请联系管理员删除!

昆山普乐斯电子14年专注于等离子表面处理工艺研究,专业的等离子清洗机设备生产厂家,在等离子清洗机、大气低温等离子表面处理系统、大气常压等离子清洗机设备、真空等离子清洗机等等设备都有多年生产经验;如果你有等离子表面处理的需求,欢迎联系普乐斯,在线客服或者拨打全国服务热线400-816-9009,普乐斯随时为你服务哦!