AI新时代降临　英特尔如何重现运算王者荣耀？-莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

在这其中，曾骄傲自称「已是AI硬件领域的基础」的英特尔（Intel），是否真能在新时代发光发热？或是终究要被NVIDIA、超微（AMD）等后起之秀超越？

至少在目前，外界对于英特尔能否在AI领域保持过往那样的优势地位，看法不一。

路透（Reuters）曾引述投资银行Piper Sandler分析师说法指出，目前在硬件与处理技术领域，引领AI革命的2家企业，除了NVIDIA以外就是超微，除此之外再无人能比肩—NVIDIA GPU市场占有率高达80%，超微则略低于20%，可见英特尔几乎没有存在感。

有观点认为，CPU较具通用性，针对AI等专门领域的运算效率不比GPU，所以，英特尔即便贵为长期以来的全球CPU龙头，但因为在AI GPU领域至今尚未做出太显眼的成绩，而被视为AI新科技潮流下的「掉队者」，甚至可能错失抓住这下一个成长引擎的机会。

产品蓝图变动惹猜疑

美国投资机构Wedbush Securities分析师曾指出，虽然英特尔为了进攻AI市场，开发出许多的解决方案，但市场给予的关注程度并不理想。

此外，英特尔近来大幅修改数据中心GPU产品蓝图，亦令人相当不安。原先，英特尔规划在2023年，推出代号Rialto Bridge的下一代Max系列GPU。Rialto Bridge号称透过架构的强化，以及Xe核心数大幅提升至160个等优势，有望将效能拉高到目前一代产品Ponte Vecchio的1.3倍。

然而英特尔近期已经确定，从产品开发蓝图当中剔除Railto Bridge，将各代产品的推出间隔拉长为2年；意味着等到再下一代的Falcon Shores于2025年推出以前，Ponte Vecchio得独力挑战实力强劲的NVIDIA Hopper架构H100，以及超微Instinct MI300等对手。虽然Rialto Bridge即便推出，市场表现大概也很难媲美H100，但是在AI正夯、资金大量涌入市场的当下，英特尔等于少了一项进入战场厮杀的武器，甚是可惜。

虽然有一派观察家不看好英特尔的竞争力，但也有一派持相反意见。英特尔本身当然也不作如是观，更否认这根本上会是一场你死我活的零和游戏。

据Fierce Electronics引述科技产业分析机构J. Gold Associates分析师说法指出，英特尔非常认真想要弥补过去这几年来在数据中心、云端与AI领域所留下的不足之处。而且NVIDIA GPU并非一枝独秀，一大部分的AI推论工作负载可以由CPU来执行，尤其是内建AI加速器的CPU。英特尔希望透过Xeon处理器来进攻这块市场。该机构还认为，虽然超微也拥有强大的数据中心CPU产品线，即Epyc，但在AI推论领域，目前还是无法与英特尔分庭抗礼。

在AI与机器学习应用上，CPU与GPU分别执行哪些工作负载，长期以来泾渭分明，如机器学习训练通常就被认为是GPU与专用加速器独占的领域。英特尔希望尽量抹除这种界线，让不同应用规模的客户，从训练、推论到数据准备工作，从网络边缘到云端，都能透过共同的数据中心平台，利用CPU来进行。

英特尔并预测，未来AI工作负载主要还是会使用CPU来执行，估计占所有AI模型的60%，其中以中小型模型为主。至于大型模型，则会占整体工作负载的40%，并以GPU或其他种类的特制加速器来运行。

英特尔AI逻辑芯片潜在市场规模展望

促进AI民主化的理想

在先前举办的数据中心与AI投资人在线研讨会中，英特尔估计，以5年为期，其数据中心芯片产品的潜在市场规模（TAM），会达到1,100亿美元，是1年以前估计数字的2倍。

英特尔解释，之所以会有这麽大的变动，原因除了英特尔将加速器、先进GPU产品整合进数据中心业务，以利服务范围更广大的客户以外，还有Xeon CPU在AI与高效能运算（HPC）、分析、安全、联网等领域的应用，正拉抬着主流运算的需求。

英特尔曾指出目前AI发展的一大问题，是技术掌握在少数人手中。英特尔为此做出的努力，可以Xeon第四代可扩充处理器Sapphire Rapids为例——这款产品内建多种加速器，因此除了NVIDIA新一代DGX H100 AI加速服务器系统这种高端AI设备以外，诸如一般公司内部数据中心较低端的服务器，也能借此享受AI技术带来的便利。

Sapphire Rapids所有型号都支持AVX-512、深度学习强化（DL Boost）、进阶矩阵扩充指令集（AMX）。作为最重要的AI创新之一，AMX为目前许多深度学习工作负载当中最核心的稠密矩阵乘法，提供CPU加速功能。

英特尔指出，虽然大型语言模型（LLM）的初步训练，一般来说还是需要独立式GPU的协助，但若是较为一般的使用案例，例如对已经开发完成的LLM，进行微调或重新训练的话，AMX功能就可以提供优良的效能表现。英特尔正在推广的迁移学习（transfer learning）概念，就是AMX的一个主要使用案例。

英特尔数据中心、AI与云端执行及策略总经理Kavitha Prasad曾在接受VentureBeat访谈时表示，生成式AI（generative AI）发展尚处于早期阶段。虽然过去这几个月以来，透过ChatGPT而受到大肆炒作，但关键在于如何转换成实际的商务成果，而这个目标尚待完成。

英特尔希望提升旗下硬件产品在生成式AI市场的占有率，为此拟定的策略，不仅仅只针对最大型的LLM，也包括从云端到边缘的实际使用案例。

Prasad指出，这项AI策略的其中一个重点，在于推广「一次打造，随处使用」的概念。以现实情况衡量，绝大多数企业都没有能力开发出LLM，因而一般较为可行的做法，是按照个别需求，针对现有模型进行微调，这通常需要使用到前面已提及的迁移学习技术途径。迁移学习意指将原先模型的学习，转移到一个新的数据集，因此可以更快速的进行模型的有效运用，是英特尔希望透过自家软硬件产品来促进发展的一个机器学习领域。

随着搭载Xeon处理器的服务器，被有效运用在包括企业、边缘、云端与电信等各种各样的环境当中，Prasad表示，英特尔对于AI模型的推广与普及，抱有很大的期望。

挑战王者非毫无希望

Prasad并将英特尔与NVIDIA的互动模式，形容为一种在IT业界愈来愈常见的合作性竞争（coopetition）关系。Prasad强调，世界正在朝向合作性竞争环境迈进，英特尔也只是其中的一个参与者。

举例来说，NVIDIA于2023年1月发表的新一代DGX H100 AI加速服务器系统，就采用Sapphire Rapids处理器。英特尔曾透露，Xeon有搭配H100一同执行虚拟机器，负责加速Azure的生成式AI模型，包括当红的ChatGPT。

健康的竞争关系仍旧是促进技术创新的关键所在。开源机器学习组织Hugging Face近期发布一系列报告，其中显示，英特尔硬件为机器学习模型的训练与执行工作，带来非常大幅度的效能改善，有望成为NVIDIA在AI运算芯片领域主导性地位的重要挑战者。

英特尔寄望于旗下最新推出的数据中心级产品，包括Sapphire Rapids以及专为AI需求设计的Habana Gaudi 2专用加速器，能够帮助自己在机器学习训练与推论领域占有一席之地。

Hugging Face报告指出，英特尔Habana Gaudi 2对1,760亿参数BLOOMZ模型的推论执行效能，比起NVIDIA 80G A100还要快上20%。如果是70亿参数版本的BLOOMZ，则这个差距会进一步拉大到3倍。Habana Gaudi 2目前已经出货，之后还会继续推出Habana Gaudi 3。

BLOOM是在2022年首次重大发布的以变换器（transformer）为基础的LLM，其开发计划的发起者为Hugging Face的一名共同创始人，NVIDIA、微软（Microsoft）、PyTorch等都有团队参与其中，希望打造出一个可免费供所有人试用的LLM，被视为OpenAI GPT-3模型的替代选择。至于BLOOMZ，则是BLOOM 的一个变化版本。

在CPU方面，则是由Sapphire Rapids与其前一代产品的比较。若以Stability AI的Stable Diffusion图片生成模型来测试，在没有修改任何程序码的前提下，可得出速度快上3.8倍的结果，显示英特尔在对比竞争对手，以及过去的自己，两方面都有不小的进步。

Hugging Face还指出，每天都会有超过20万人到Hugging Face Hub来试用模型。因而，能否为所有的模型，都提供良好的推论速度，是非常重要的；以英特尔Xeon技术为基础的云端实例（instance），能够令Hugging Face得以更有效率地、大规模地提供服务。其中可见Hugging Face对于英特尔所抱持的高度青睐。

英特尔曾指出目前AI发展的一大问题，是技术掌握在少数人手中。李建梁摄（数据照）