第149期
2023 年 12 月 27 日
  北美智权官网 智权报文章分类/搜寻   历期智权报   订阅北美智权报  
 
各家业者磨刀霍霍向AI PC,但ARM架构已经先走一步
林宗辉/北美智权报 编辑部

在经历了一年多的销售低潮之后,PC市场虽然有止跌回升的迹象,但仍稍显温吞,且ARM架构PC不断攻城略地,英特尔、AMD等既有PC处理器霸主的市场地位遭受威胁,因此也开始寻找在现有PC上增加更多应用价值的附加功能。

随着AIGC(人工智能生成)成为主流应用之一,如何加速这些功能在本地端的实现,就成为软件与半导体产业很大的挑战,英特尔抢先推出AI PC概念方案,正式把AI挂在PC上,AMD似乎晚了一步。但不论如何,以现有AI生态的竞赛来看,ARM架构恐怕已经领先X86不只一个车头了。


图片来源 : shutterstock、达志影像

在这个AI计算机时代的滥觞中,专家们预测,AI将成为PC市场的重要驱动力。英特尔最新基于Meteor Lake架构的Core Ultra芯片,作为该公司的首款内建神经处理器的消费端PC处理器,预示着这一时代不只到来,更将迅速渗透市场,改变使用者习惯。

根据英特尔的说法,具备AI功能的新芯片的特点在于能够在笔记本电脑上运行像ChatGPT这样的技术,而不需要依赖云数据中心提供计算能力。这意味着即使在没有因特网连接的情况下,AI计算机也能够执行高级的语言模型和对话式AI。这种自主运算能力的提升,为AI计算机在个人使用和专业领域的应用带来了巨大的潜力。

以过去的英特尔产品作为比较基准的话,目前的英特尔在AI应用性能方面的确有相当大的进展,然而回过头去看这几年的整体处理器技术发展,英特尔到2023年底才推出具备AI功能的处理器,反而是动作比较慢的了。许多其他科技公司也在积极开发AI专用硬件和软件,这将进一步推动整个行业的发展,比如说苹果,他们透过新的硬件以及软件框架,使他们的PC产品在AIGC应用执行效率可以和高阶独立显示适配器同等的水平,且甚至可以执行更大的本地模型。

而随着更多的AI专用硬件和软件解决方案的问世,我们将看到AI计算机在更广泛的领域中被应用,从而带来更多的创新和变革。

晚到好过不到,X86的AI路

近日,英特尔在新一代的处理器平台上揭示了未来AI PC的样貌,不论在应用方面,甚至在芯片制造端也展示了英特尔前所未有的创新。随着新一代Core Ultra处理器的引入,英特尔寄厚望于该平台上,不论是AI应用,或者是未来在芯片制造能力的改善,都代表着该公司40年来最大的客户端架构转变,Core Ultra也是首次应用基于Foveros封装技术的客户端瓦片式设计。这种新的芯片设计利用了3D高性能混合架构,并且是首款在新的Intel 4制程节点上制造的客户端处理器。


图片来源:英特尔

代号Meteor Lake 的Core Ultra处理器,藉由采用英特尔的3D性能混合架构和英特尔4制程制程,提供了性能和功率效率之间的平衡,并强化AI应用执行的能力。英特尔在新闻发表会上亦强调,新一代的H系列和U系列处理器将改变人们使用个人计算机的方式,特别是在AI加速方面。

英特尔Core Ultra特别强调了其内置的神经处理单元(NPU),这种架构过去常见于手机芯片上,这也是X86架构首次引进该技术,透过内建的NPU,这使得处理器在AI加速方面的能效比上一代提高了2.5倍。英特尔Core Ultra还支持OpenVINO™工具包,这些工具包通过最小的代码更改和自动设备检测增强了AI性能,将工作负载路由到正确的计算引擎,并通过ONNX和ONNX Runtime实现更快的推理,从而简化了工作流程。

不过相较起性能,英特尔的新处理器更重视的是能效表现以及应用的兼容性,从实际测试结果来看,英特尔的AI执行速度可能还不如新一代的ARM架构处理器,但相较起性能,英特尔似乎更重视应用兼容性。而这也是为什么英特尔执行长基辛格近日不断攻击NVIDIA的原因,基辛格认为,英特尔推动的应用生态兼容计划将有机会推翻以往由NVIDIA的CUDA独霸的AI运算生态。

如果单看X86市场,英特尔已经在AI议题上抢了一波锋头,毕竟AIGC到AI PC,如果能摆脱云端的限制,达到随处可用的境地,不仅效率更快,许多资安要求高的工作应用也就不用因为害怕信息泄漏而故意忽视AIGC功能的存在,从而帮助工作效率的提升。因此,PC业者见到英特尔的新架构,无不蜂拥支持,毕竟不论是消费端或者是企业端,PC市场已经冷太久了,需要更多题材来炒热。也因此,我们认为英特尔目前的重点还是瞄准商用市场生态经营,消费端AI可能暂时还无法期待有太大的性能革新。

那么英特尔的最大对手AMD呢?根据业界讯息,他们也会如同英特尔般加入NPU功能,强化其AI应用执行能力,然而不可忽视的是,AMD在GPU的技术方面仅次于NVIDIA,且推动了使用者基础仅次于CUDA的AI开放社群标准,英特尔目前在AI PC上暂时领先了AMD,但后续的生态经营才是真正的挑战。

先走一步的ARM架构

X86这头AI PC概念炒的火热,但实际上AI功能在ARM架构已经是司空见惯,几乎每一颗ARM处理器都有NPU技术的存在,虽然AIGC概念在2023年才开始兴起,但作为先行者的ARM架构,似乎也有不错的潜力。

两大手机处理器公司,联发科和高通都先后推出可以进行AIGC的手机处理器,可以在手机上执行超过百亿参数规模的AI模型,这个参数大小的模型即便是放在PC上也是相当庞大,需要具备大容量的GPU才能有比较好的执行效率。


图片来源:联发科

联发科的方案是天玑架构,其最新的天玑9300手机芯片,使用了「全大核」设计策略,以达到更高的游戏、视讯捕捉和设备上的生成AI处理性能。该芯片采用台积电的4奈米制程技术,包含四个Cortex-X4核心和四个Cortex-A720核心。特别值得注意的是,Dimensity 天玑9300包含了一个AI处理器核心——APU790,这个核心能够提高生成式AI的性能和能效,并支持大型语言模型,具有可扩展性高达330亿参数。此外,天玑9300还具有改进的CPU核心和提高的效率表现。

虽然联发科在Windows on Arm的脚步并不明确,未来可能会透过与NVIDIA合作前进AI PC,而不是自己玩,但我们认为在手机市场已经逐渐走向饱和,不论就地缘政治风险,或者是市场潜力而言,都已经可以看到极限,往AI PC前进不仅可以增加新市场空间,也能分散风险。

高通除了在手机芯片上有和联发科类似的发展脉络,其整合NPU、GPU与DSP的AI运算能力,也帮助手机应用很早就走入AI时代。但与联发科不同的是,高通已经打造出一颗真正的PC处理器,并将以之挑战主流PC处理器。


图片来源:高通

高通推出了面向微软Windows笔记本电脑的新芯片,这一芯片被命名为Snapdragon Elite X。这款芯片专为处理人工智能(AI)任务而优化,包括电子邮件摘要、文本生成和图像创建等任务。Snapdragon Elite X芯片被设计为集成到高通的智能手机芯片中,Google和Meta计划利用这些功能。此外,据称Snapdragon Elite X在特定任务上的性能超过了苹果的M3与M2 Max芯片,同时在能源效率方面也优于苹果和英特尔的PC芯片。这款芯片的最大特点是其能够处理具有130亿参数的人工智能模型,这在生成文本或图像等AIGC任务中尤为重要。

但严格来说,联发科和高通都还没有针对主流PC的AI芯片产品,因此,我们把眼光看往另一个,也是目前市面上最强大的AI PC架构,也就是苹果的M3系列芯片。

苹果在其M系列处理器中引入了多项AI处理功能,这些功能主要集中在提高AI计算速度、增强神经网络引擎的能力,以及优化图形处理等方面。

M3系列处理器采用了3奈米制程技术,这不仅增加了性能和效率,还使这些处理器能够更有效地运行AI和机器学习模型。M3系列的神经网络引擎比M1系列快60%,这使得AI和机器学习工作流程得到了更快的处理速度。另外在GPU方面,M3系列具有最新一代的GPU架构,这不仅提高了整体的图形性能,还引入了如动态缓存、硬件加速光线追踪和网格阴影等创新功能。这些新特性增强了着色能力,使得图形更加细致和逼真。M3系列的GPU渲染速度比M1系列快达2.5倍。不仅在游戏或者是专业绘图性能方面更出色,也能有效帮助AI应用的执行加速。

但除了硬件以外,苹果最重要的一项工作是推出了名为MLX的新开源AI框架,这代表苹果在AI领域的一大进步。MLX专为在苹果的M系列处理器上高效运行而设计,并提供了统一的内存模型,使得操作可以在任何支持的设备类型上进行,而无需进行数据复制。这个框架基于ArrayFire、Jax和PyTorch,可以高效率训练AI工作,或者是执行AI推理工作。

MLX框架在AI研究和开发方面代表了重大进展,尤其是在影像生成速度上,与PyTorch相比有显著优势。此外,MLX框架还支持像是Stable Diffusion和OpenAI的Whisper这样的工具,这些都显示了苹果在AI研究和开发领域的进步。例如,苹果报告称,使用MLX生成16张图片大约需要90秒,而PyTorch则需要约120秒。

​而根据第三方的测试,在苹果M系列处理器上执行Whisper这个AI语音转录应用时,苹果处理器能表现出比NVIDIA的RTX4090显示适配器更强大的性能表现,值得注意的是,用来测试的苹果笔记本电脑的价格跟RTX4090显示适配器差不多。

值得注意的是,虽然在这个测试中的RTX4090使用的是未优化的模型,所以性能表现较弱,但以同样的测试基准来看,苹果系统的总功耗仅约50W,4090单单是显示适配器就消耗超过300W,就纯粹的能效比来看,苹果仍然领先。

图:苹果M3的AI性能实测超越NVIDIA的RTX4090高阶显卡。

数据源:AppleInsider。

这些进步意味着,苹果在PC产业中引入AI功能方面处于领先地位。MLX的推出不仅让苹果的硬件更具吸引力,也为AI研究者和开发者提供了更好的兼容性以及开发体验。这个框架的目标是使苹果的平台对AI研究者和开发者更具吸引力。随着苹果进一步开发其AI技术,未来可能会在MacBook上创建类似ChatGPT的生成AI应用程序。

结论

不论从略微姗姗来迟的X86架构,或者是早在AI经营已久的ARM产品,AIGC进入人们的日常生活已经是不可改变的趋势,AI PC的到来也宣示着AIGC要摆脱娱乐用途,转而迈向生产力应用。当然,谈到生产力,用户或是开发者更重视的生态的开发,英特尔野心很大,但苹果似乎略胜一筹,但无论如何,他们也能选择配备使用NVIDIA或AMD的GPU产品的PC产品,CPU不需换代也能具备AI功能。

AI PC的兴起不仅代表了一次技术上的革命,更是一次计算方式和用户体验的全面变革。随着AI技术的不断成熟,我们可以预期,在不久的将来,AI PC将成为个人和专业领域的标准配置,从而为我们的生活和工作带来深远的影响。并带领业界进入一个更加智慧、高效和创新的时代。

 

好消息~北美智权报有微信公众号了!

《北美智权报》内容涵盖世界各国的知识产权新闻、重要的侵权诉讼案例分析、法规解析,以及产业与技术新知等等。

立即关注北美智权微信公众号→ NAIP_IPServices

~欢迎读者分享与转发~


作者: 林宗辉
现任: 北美智权报资深编辑
学历: 台湾大叶大学
经历: 电子时报半导体资深分析师
MIT Techreview中文版研究经理
财讯双周刊撰述委员
美国波士顿Arthur wood投资顾问公司分析师

 


 





感谢您阅读「北美智权报」,欢迎分享智权报连结。如果您对北美智权电子报内容有任何建议或欲获得授权,请洽:Editorial@naipo.com
本电子报所登载之文章皆受著作权保护,未经本公司授权, 请勿转载!
© 北美智权股份有限公司 & 北美联合专利商标事务所 版权所有 234 台湾地区新北市永和区福和路389号五楼 TEL:+886-2-8923-7350