AI新时代降临 英特尔如何重现运算王者荣耀?

1年前 289观看

在这其中,曾骄傲自称「已是AI硬件领域的基础」的英特尔(Intel),是否真能在新时代发光发热?或是终究要被NVIDIA、超微(AMD)等后起之秀超越?WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

至少在目前,外界对于英特尔能否在AI领域保持过往那样的优势地位,看法不一。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

路透(Reuters)曾引述投资银行Piper Sandler分析师说法指出,目前在硬件与处理技术领域,引领AI革命的2家企业,除了NVIDIA以外就是超微,除此之外再无人能比肩—NVIDIA GPU市场占有率高达80%,超微则略低于20%,可见英特尔几乎没有存在感。 WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

有观点认为,CPU较具通用性,针对AI等专门领域的运算效率不比GPU,所以,英特尔即便贵为长期以来的全球CPU龙头,但因为在AI GPU领域至今尚未做出太显眼的成绩,而被视为AI新科技潮流下的「掉队者」,甚至可能错失抓住这下一个成长引擎的机会。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany


WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

产品蓝图变动惹猜疑WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

美国投资机构Wedbush Securities分析师曾指出,虽然英特尔为了进攻AI市场,开发出许多的解决方案,但市场给予的关注程度并不理想。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

此外,英特尔近来大幅修改数据中心GPU产品蓝图,亦令人相当不安。原先,英特尔规划在2023年,推出代号Rialto Bridge的下一代Max系列GPU。Rialto Bridge号称透过架构的强化,以及Xe核心数大幅提升至160个等优势,有望将效能拉高到目前一代产品Ponte Vecchio的1.3倍。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

然而英特尔近期已经确定,从产品开发蓝图当中剔除Railto Bridge,将各代产品的推出间隔拉长为2年;意味着等到再下一代的Falcon Shores于2025年推出以前,Ponte Vecchio得独力挑战实力强劲的NVIDIA Hopper架构H100,以及超微Instinct MI300等对手。虽然Rialto Bridge即便推出,市场表现大概也很难媲美H100,但是在AI正夯、资金大量涌入市场的当下,英特尔等于少了一项进入战场厮杀的武器,甚是可惜。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

虽然有一派观察家不看好英特尔的竞争力,但也有一派持相反意见。英特尔本身当然也不作如是观,更否认这根本上会是一场你死我活的零和游戏。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

据Fierce Electronics引述科技产业分析机构J. Gold Associates分析师说法指出,英特尔非常认真想要弥补过去这几年来在数据中心、云端与AI领域所留下的不足之处。而且NVIDIA GPU并非一枝独秀,一大部分的AI推论工作负载可以由CPU来执行,尤其是内建AI加速器的CPU。英特尔希望透过Xeon处理器来进攻这块市场。该机构还认为,虽然超微也拥有强大的数据中心CPU产品线,即Epyc,但在AI推论领域,目前还是无法与英特尔分庭抗礼。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

在AI与机器学习应用上,CPU与GPU分别执行哪些工作负载,长期以来泾渭分明,如机器学习训练通常就被认为是GPU与专用加速器独占的领域。英特尔希望尽量抹除这种界线,让不同应用规模的客户,从训练、推论到数据准备工作,从网络边缘到云端,都能透过共同的数据中心平台,利用CPU来进行。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔并预测,未来AI工作负载主要还是会使用CPU来执行,估计占所有AI模型的60%,其中以中小型模型为主。至于大型模型,则会占整体工作负载的40%,并以GPU或其他种类的特制加速器来运行。
WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔AI逻辑芯片潜在市场规模展望WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany


WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

促进AI民主化的理想WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

在先前举办的数据中心与AI投资人在线研讨会中,英特尔估计,以5年为期,其数据中心芯片产品的潜在市场规模(TAM),会达到1,100亿美元,是1年以前估计数字的2倍。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔解释,之所以会有这麽大的变动,原因除了英特尔将加速器、先进GPU产品整合进数据中心业务,以利服务范围更广大的客户以外,还有Xeon CPU在AI与高效能运算(HPC)、分析、安全、联网等领域的应用,正拉抬着主流运算的需求。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔曾指出目前AI发展的一大问题,是技术掌握在少数人手中。英特尔为此做出的努力,可以Xeon第四代可扩充处理器Sapphire Rapids为例——这款产品内建多种加速器,因此除了NVIDIA新一代DGX H100 AI加速服务器系统这种高端AI设备以外,诸如一般公司内部数据中心较低端的服务器,也能借此享受AI技术带来的便利。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

Sapphire Rapids所有型号都支持AVX-512、深度学习强化(DL Boost)、进阶矩阵扩充指令集(AMX)。作为最重要的AI创新之一,AMX为目前许多深度学习工作负载当中最核心的稠密矩阵乘法,提供CPU加速功能。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔指出,虽然大型语言模型(LLM)的初步训练,一般来说还是需要独立式GPU的协助,但若是较为一般的使用案例,例如对已经开发完成的LLM,进行微调或重新训练的话,AMX功能就可以提供优良的效能表现。英特尔正在推广的迁移学习(transfer learning)概念,就是AMX的一个主要使用案例。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔数据中心、AI与云端执行及策略总经理Kavitha Prasad曾在接受VentureBeat访谈时表示,生成式AI(generative AI)发展尚处于早期阶段。虽然过去这几个月以来,透过ChatGPT而受到大肆炒作,但关键在于如何转换成实际的商务成果,而这个目标尚待完成。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔希望提升旗下硬件产品在生成式AI市场的占有率,为此拟定的策略,不仅仅只针对最大型的LLM,也包括从云端到边缘的实际使用案例。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

Prasad指出,这项AI策略的其中一个重点,在于推广「一次打造,随处使用」的概念。以现实情况衡量,绝大多数企业都没有能力开发出LLM,因而一般较为可行的做法,是按照个别需求,针对现有模型进行微调,这通常需要使用到前面已提及的迁移学习技术途径。迁移学习意指将原先模型的学习,转移到一个新的数据集,因此可以更快速的进行模型的有效运用,是英特尔希望透过自家软硬件产品来促进发展的一个机器学习领域。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

随着搭载Xeon处理器的服务器,被有效运用在包括企业、边缘、云端与电信等各种各样的环境当中,Prasad表示,英特尔对于AI模型的推广与普及,抱有很大的期望。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany


WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

挑战王者非毫无希望WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

Prasad并将英特尔与NVIDIA的互动模式,形容为一种在IT业界愈来愈常见的合作性竞争(coopetition)关系。Prasad强调,世界正在朝向合作性竞争环境迈进,英特尔也只是其中的一个参与者。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

举例来说,NVIDIA于2023年1月发表的新一代DGX H100 AI加速服务器系统,就采用Sapphire Rapids处理器。英特尔曾透露,Xeon有搭配H100一同执行虚拟机器,负责加速Azure的生成式AI模型,包括当红的ChatGPT。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

健康的竞争关系仍旧是促进技术创新的关键所在。开源机器学习组织Hugging Face近期发布一系列报告,其中显示,英特尔硬件为机器学习模型的训练与执行工作,带来非常大幅度的效能改善,有望成为NVIDIA在AI运算芯片领域主导性地位的重要挑战者。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔寄望于旗下最新推出的数据中心级产品,包括Sapphire Rapids以及专为AI需求设计的Habana Gaudi 2专用加速器,能够帮助自己在机器学习训练与推论领域占有一席之地。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

Hugging Face报告指出,英特尔Habana Gaudi 2对1,760亿参数BLOOMZ模型的推论执行效能,比起NVIDIA 80G A100还要快上20%。如果是70亿参数版本的BLOOMZ,则这个差距会进一步拉大到3倍。Habana Gaudi 2目前已经出货,之后还会继续推出Habana Gaudi 3。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

BLOOM是在2022年首次重大发布的以变换器(transformer)为基础的LLM,其开发计划的发起者为Hugging Face的一名共同创始人,NVIDIA、微软(Microsoft)、PyTorch等都有团队参与其中,希望打造出一个可免费供所有人试用的LLM,被视为OpenAI GPT-3模型的替代选择。至于BLOOMZ,则是BLOOM 的一个变化版本。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

在CPU方面,则是由Sapphire Rapids与其前一代产品的比较。若以Stability AI的Stable Diffusion图片生成模型来测试,在没有修改任何程序码的前提下,可得出速度快上3.8倍的结果,显示英特尔在对比竞争对手,以及过去的自己,两方面都有不小的进步。WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

Hugging Face还指出,每天都会有超过20万人到Hugging Face Hub来试用模型。因而,能否为所有的模型,都提供良好的推论速度,是非常重要的;以英特尔Xeon技术为基础的云端实例(instance),能够令Hugging Face得以更有效率地、大规模地提供服务。其中可见Hugging Face对于英特尔所抱持的高度青睐。
WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔曾指出目前AI发展的一大问题,是技术掌握在少数人手中。李建梁摄(数据照)WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

英特尔曾指出目前AI发展的一大问题,是技术掌握在少数人手中。李建梁摄(数据照)WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany


WJH莫卡妮生活网-记录每日创新科技时尚娱乐生活Mocany

本文链接:http://www.mocany.com/showinfo-1-23898-0.htmlAI新时代降临 英特尔如何重现运算王者荣耀?

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com。天上从来不会掉馅饼,请大家时刻谨防诈骗