本文作者:访客

Intel Panther Lake揭秘:混合架构能效突破

访客 2025-10-10 13:11:32 16264
Intel Panther Lake混合架构能效突破,揭秘新型处理器技术。

十一长假前夕,Intel在美国亚利桑那州凤凰城举办了一场Tech Tour US技术之旅活动。

这也是继以色列(晶圆厂)、马来西亚(封装厂)、中国台北(电脑展)之后,第四次此类活动。

活动期间,我们参观了位于凤凰城的Fab 42/52晶圆厂,还提前了解了下一代酷睿Ultra处理器Panther Lake、下一代至强6+处理器Clearwater Forest的架构与技术细节,现在和大家分享!

首先强调一点,Panther Lake、Clearwater Forest此次解密的仅限架构设计、技术特性,而产品型号、规格参数、性能表现将在后续正式发布的时候公开。

Intel Panther Lake揭秘:混合架构能效突破

Intel Panther Lake揭秘:混合架构能效突破

【Intel 18A工艺与先进封装:四季度量产】

Panther Lake、Clearwater Forest是首个采用Intel 18A工艺的量产产品,这也是在美国本土最先进的制程工艺。

Intel 18A的技术特性之前已经讲了多次,如今量产在即,再做一次简单的回顾总结。

Intel Panther Lake揭秘:混合架构能效突破

Intel 18A标志着半导体制程工艺的一次重大突破,尤其是它首次加入了两大全新革命性技术:RibbonFET全环绕晶体管、PowerVia背部供电。

二者结合,彻底颠覆了多年来的晶体管与晶圆结构,奠定了Intel称之为"埃米时代"的基础,在密度、性能、能效等各方面都带来了显著变化。

Intel Panther Lake揭秘:混合架构能效突破

RibbonFET其实是GAA全环绕晶体管结构的一种实现方式,台积电、三星也都有类似的技术,但具体设计各有各的特色。

RibbonFET采用4条垂直堆叠的纳米带(Nano Ribbons)结构,使得栅极能够完全包围沟道,再加上沟道结构和栅极控制的优化,相比传统FinFET立体晶体管结构,驱动电流可增强20%,晶体管开关速度可提升15%。

同时,它还能有效减少漏电现象,支持八个不同的逻辑阈值电压,芯片设计也可以更加灵活。

另外,RibbonFET还融入了Intel的诸多工艺创新,包括全新的栅极光刻工艺、功函数工程优化、短沟道效应控制等等。

Intel Panther Lake揭秘:混合架构能效突破

PowerVia背部供电就比较好理解了,就是将传统上位于晶圆正面的供电电路,转移到背面,这可是Intel独有的,也是第一家投入量产的,台积电和三星都不具备。

多年来,晶圆设计都是将信号线(Signal)、供电线(Power)混合分布在晶体管之上,也就是晶圆的正面,但随着晶体管尺寸不断缩小,信号线、供电线布线越来越拥挤,功耗能效、信号干扰等问题越来越凸显。

PowerVia将供电层移至晶体管或者说晶圆的背面,并在每个标准单元中嵌入纳米级硅通孔(nano TSV),从而实现了供电线与信号线的分离,晶体管的供电路径变得更加直接高效。

这么做可以大大提高供电效率,减少损耗,降低芯片整体功耗;

可以有效减少压降(IR Drop)最多达30%,提升芯片运行频率最多6%;

可以减少甚至消除信号干扰,实现更好的信号完整性;

可以提升标准单元利用率最多达10%,进一步提高晶体管密度。

Intel Panther Lake揭秘:混合架构能效突破

当然,单纯使用背部供电,成本会显著增加,但是Intel PowerVia是一个完整方案,同时还有一系列配套优化,包括减少金属层、遮罩数量、工序步骤,以及精简正面工艺等等,使得综合成本显著低于传统正面供电工艺。

按照Intel给出的数据,同样是M0-M2金属层直接印刷EUV工艺,PowerVia加持的Intel 18A对比Intel 3,遮罩数量减少了44%,工序步骤减少了42%。

Intel Panther Lake揭秘:混合架构能效突破

RibbonFET、PowerVia两大变革结合,使得Intel 18A对比Intel 3综合能效提升最多15%、同等性能下功耗降低最多25%、芯片密度提升30%。

当然,这些指标只是工艺层面的,落实到处理器产品层面还要结合架构、规格的变化。

Intel Panther Lake揭秘:混合架构能效突破

对于大家非常关心的18A量产进度,Intel也给出了明确的时间表。

目前,18A早在2024年第三季度就已经投入试产,目前正在美国亚利桑那州、俄勒冈州两地的工厂积极推进,缺陷密度不断降低,计划量产时间是今年第四季度,正好和Panther Lake的发布计划相符合。

Intel还强调,18A的良品率和Intel过往15年的工艺水平基本相当,甚至更好一些。

Intel Panther Lake揭秘:混合架构能效突破

Intel Panther Lake揭秘:混合架构能效突破

除了先进工艺,Intel还有着丰富的先进封装技术,可以分为EMIB、Foveros两大家族,各自又衍生出了不同的版本,满足不同的封装需求。

Panther Lake就使用了2019年便已量产、久经考验的Foveros-S 2.5D封装技术,结合EMIB,将不同模块(Die)堆叠封装在一个被动无源基础模块之上,实现高效互联互通,方便灵活放大或缩小规模,而且成本可控。

Intel Panther Lake揭秘:混合架构能效突破

【Panther Lake整体布局设计:三大版本】

接下来,我们就看看Panther Lake的整体架构设计,通过这一节你可以了解到它的概况,想深入研究每个模块单元细节的可以继续往后翻。

注意,Panther Lake是一款专门定位移动市场的处理器,包括笔记本、二合一本、迷你机、掌机等,但没有桌面版,Intel桌面的下次更新要等到后年的Nova Lake。

Intel Panther Lake揭秘:混合架构能效突破

Intel Panther Lake揭秘:混合架构能效突破

按照Intel的说法,Panther Lake的设计目标有三:

一是提高架构灵活性,满足更广阔的市场需求,进一步推广和普及AI PC;

二是性能的伸缩性,可满足计算、图形、AI等各种消费级负载的需求;

三是领先的能效,带来出色的每瓦特性能和续航时间。

Panther Lake在很大程度上可以视为Lunar Lake、Arrow Lake的结合体,融合了二者的众多设计和优点,尤其同时拥有前者的超高能效、后者的灵活性能。

最终,Panther Lake带来了超过50%的CPU、GPU性能提升,而且依然拥有极高的能效,做到了鱼与熊掌也可兼得,这在历史上是相当罕见的。

从这个意义上讲,Lunar Lake虽然没有直接的后继者,但是除了整合封装内存,其实很多设计都延续了下来,后边你会在Panther Lake上不断看到Lunar Lake的影子。

Lunar Lake架构的卓越无需多言,它第一次实打实地证明,x86架构也可以有极高的能效,能让笔记本拥有20小时以上的超长续航,足以媲美苹果。

Arrow Lake架构其实也很出色,性能不俗的同时能效非常好,尤其是在移动端,但是Intel最大甚至可以说唯一的失误,就是几乎原封不动把它也用在了桌面上,导致绝对性能远不如竞品,严重影响了产品和品牌的形象。

Intel Panther Lake揭秘:混合架构能效突破

Panther Lake延续了Chiplets芯粒设计,但布局又发生了变化。

Meteor Lake、Arrow Lake都是计算、图形、SoC、IO四大模块组成,Lunar Lake简化为计算、平台控制器两部分。

Panther Lake则改成了计算、图形、平台控制器三个模块,统一封装在基础模块之上,还有一两个填料模块用于保持整体形状、压力的平衡。

Intel Panther Lake揭秘:混合架构能效突破

Intel Panther Lake揭秘:混合架构能效突破

计算模块自然就是各种计算引擎,主要就是CPU核心与缓存,同时还有内存控制器、NPU 5 AI引擎、Xe媒体与显示引擎、IPU 7.5图形处理引擎(也就是DSP)。

其中,CPU核心包括最多4个P核、8个E核、4个LPE核。

P核每个有自己的二级缓存,E核还是每四个一组共享二级缓存(4MB),P核+E核组成"性能簇",集体共享三级缓存。

LPE核单独组成"能效簇",一如既往它和E核都是每四个一组共享二级缓存(4MB)、没有三级缓存,但是频率相对更低或者说能效更高,并拥有独立的电源管理和内存连接,放置在了一个单独的供电岛上。

Panther Lake还设计了一个单独的Home Agent(HA),同时在性能簇、能效簇分别设计了一个Coherency Agent(CA),从而加强不同核心的互通,保持整个系统所有核心、缓存的一致性。这俩也都是来自Lunar Lake。

Intel Panther Lake揭秘:混合架构能效突破

除了二三级缓存,计算模块内还单独设置了内存侧缓存(MSC)。

这是从Lunar Lake上借鉴而来的,主要服务LPE核和I/O引擎,容量还是8MB,可以减少对系统内存的依赖,提升延迟与带宽,降低功耗。

MSC放置在计算模块里,所有的IP都可以高效地访问它,包括CPU、NPU、IPU、媒体与显示引擎、甚至是I/O,从而降低功耗、提升性能,有点像SLC系统缓存。

Intel Panther Lake揭秘:混合架构能效突破

内存控制器放置在计算模块的边缘,支持两种内存,一是LPDDR5X,最高频率9600MT/s,最大容量96GB。

二是DDR5,最高频率7200MT/s,最大容量128GB。

另外,它也支持LPCAMM2内存形态,更加灵活,不像LPDDR内存那样是焊接在主板上的,可以拆卸、更换、升级。

Intel Panther Lake揭秘:混合架构能效突破

NPU已经进化到第五代,但并没有盲目追求更高的算力,而是提高性能面积比、能效比,其中能效面积比提升了超过40%,并新增支持FP8精度。

INT8精度下,NPU 5的算力为50 TOPS,对比Arrow Lake-H上第三代的13 TOPS可谓翻天覆地,但对比Lunar Lake上第四代的48 TOPS几乎没变。

对比竞品,它和AMD Strix Point系列完全相同,远不及高通骁龙X2 Elite系列的80 TOPS。

因为在Intel看来,GPU始终都是AI运算的主要引擎,NPU只适合持续运行、追求极致能效的特定负载,不需要过高的算力。

Intel Panther Lake揭秘:混合架构能效突破

IPU也就是DSP单元紧挨着LPE核能效簇,非常小,但变化很大,支持3个并发摄像头,基于AI的降噪、局部色调映射,基于硬件的交错式HDR,可拍摄1600万像素照片、120FPS慢动作视频,功耗也降低了1.5W。

Intel Panther Lake揭秘:混合架构能效突破

Xe媒体与显示引擎没有和Xe GPU放在一起,而是安排在了计算模块内,同样挨着LPE能效簇,新增支持AVC(H.264)/AV1 10-bit编解码、索尼XAVC-H/HS/S编解码。

Intel Panther Lake揭秘:混合架构能效突破

GPU核显做成了单独的一个模块,升级到最新Xe3架构,这也是该架构的首秀,领先于独立显卡。

核心数量也增加到最多12个,搭配12个光追引擎、16MB二级缓存,算力可高达120 TOPS。

相比之下,Lunar Lake、Arrow Lake GPU算力最高分别为67 TOPS、77 TOPS。

Intel Panther Lake揭秘:混合架构能效突破

Intel Panther Lake揭秘:混合架构能效突破

图形模块、计算模块之间,采用了第二代Fabric连接通道,两边各设置了一个D2D直连接口,确保彼此的高速低延迟连接,以及全系统的一致性。

这部分,同样继承自Lunar Lake。

Intel Panther Lake揭秘:混合架构能效突破

阅读
分享