导语:
搭载麒麟9000S的 Mate60 系列,开售至今依然缺货,很明显是芯片产能跟不上。
这个缺芯的情况类似于几年前的麒麟9000,只不过麒麟9000是用一片少一片,而麒麟9000S则是用一片没来得及补上一片。
但这两个芯片的设计工作差不多始于同一时期,这便是除命名类似外的其它有趣之处了。
本文前两部分是关于麒麟9000的全解析,若不感兴趣可以直接跳到第三部分,看麒麟9000S的全解析。
1,较前代异同解析
麒麟9000的晶体管数量是153亿,麒麟990 5G的晶体管数量则是刚刚突破100亿,而在实际芯片面积上,前者还比后者小一点点——麒麟9000的晶体管密度之高可见一斑!
假如将上图右边的麒麟9000翻转180度,便可以看出其较麒麟990 5G的大体布局是一致的。但由于制程工艺的晶体管密度优势,麒麟9000还额外堆了一块 SLC(系统缓存)。
也就是说麒麟9000的总系统缓存容量为8MB,这是啥概念呢?晚两个月发布的高通骁龙888,SLC 容量仅为3MB,连麒麟9000的一半都不到!不过L3缓存容量倒是一致。
至于晚三个月发布的联发科天玑1200,则根本就没有 SLC 这玩意!而且其三级缓存仅为2MB(麒麟9000这边是4MB)。关键堆料方面的区别,便是这三者能效区别的一大因素。
第二个区别,就是CPU架构的升级。这次直接分出来一个A77大核(频率已经飙到超大核水平),搭配三个A77中核与四个A55小核,这与前代的“2+2+4”策略明显不同。
微架构层面,可以看出从前代的A76升级为了A77,ARM官方表示(上图)在同7nm工艺和3GHz的同峰值频率场景下,A77较A76的性能可以提升20%,可见能效提升并不小。
当然相较于骁龙888的A78中核,在能效上肯定比不了。但高通选择了三星的5nm工艺(晶体管密度远不及台积电的5nm工艺),SLC 容量又小,从而造就了一代火龙。
再搭配整数代升级的5nm工艺、8MB大系统缓存,最终让麒麟9000的CPU单核能效与多核能效,成功在同时代的安卓旗舰芯中以大优势脱颖而出——仅次于苹果的A14!
第三个区别就是GPU部分了,这次的Mali-G78跨过了有重大升级的G77(首次换用Valhall架构),所以其较前代之G76在同工艺条件下有着43%的能效提升。
不过,由于麒麟9000将GPU规模堆到了顶配的二十四核心,并将频率提升至759MHz,所以在GPU性能大幅提升76%的同时,峰值功耗也暴涨了一倍!架构大升级,制程工艺大升级,SLC 容量也翻倍了,结果这GPU峰值能效……
不过麒麟9000的GPU在中低频场景之能效表现还是不错的,妥妥超越麒麟990 5G。另外,若是和同时代的骁龙888和天玑1200比,麒麟9000的表现依然突出,仅次于苹果A14。
2,其它升级
在NPU方面,华为自研的达芬奇架构在麒麟9000这代,直接升级到了2.0版本,并带来了翻倍的 AI 算力!另外,得益于容量翻倍的 SLC,这代NPU所享受到的带宽也直接翻倍了,同时能效方面也有15%的提升。
再加上制程工艺的大幅升级以及架构升级,这代的NPU微核全天待机之耗电被巨幅压低到了3mA(前代的这个数据是6.4mA)!
在超强算力和极致能效的加持下,这代的NPU开始将 AI 实时处理复杂网络引入视频端,从而实现了 AI 视频超分等功能。结合这代全新升级的自研ISP6.0版本,业界首创的 ISP+NPU 融合架构就此诞生!
那么这个全新的融合架构能实现啥效果呢?展开来说就是,其通过硬件直连的方式,将NPU计算直接融入ISP的 pipeline(管线)中。
然后利用 SLC 的大带宽能力形成数据流的乒乓处理,做到同时在一帧内处理很复杂的色彩还原和平衡,同时还能将 AI 功能引进来,从而实现了以往来不及在视频中进行逐帧细节还原和降噪的操作。
那么以往ISP在处理传感器的视频数据时需要多长时间呢?答案是要在33ms时间之内处理一帧的所有像素——而这也是全新融合架构的超短处理时长!
结合新引入的 Quad-pipeline 架构,以及翻倍的 3A(自动白平衡、自动曝光、自动对焦)处理能力、提升50%的管线速度,最终实现了动态范围超越人眼的HDR视频拍摄(通过包围式曝光HDR合成)以及更清晰的暗光视频拍摄。
很明显,在全新NPU的鼎力支持下,ISP6.0在视频拍摄优化上有了质的飞跃,从而弥补了以往华为在视频拍摄领域的诸多不足,并助力 Mate40 Pro+ 在手机影像领域达成全能成就。
最后在基带部分,最大的亮点就是之前联发科在天玑1000发布会上,大力宣传的双载波聚合技术——这次巴龙5000基带也实装了,并带来了与天玑1000所宣传数据差不多的上行、下行速率。通信这块是华为老本行了,一个字形容就是“稳”。
3,麒麟9000S
这次Mate60系列的麒麟9000S,其自研CPU微架构 TaiShanV120 源于桌面级CPU鲲鹏930S——这是数据中心级鲲鹏CPU的桌面版(这个“S”后缀很重要),只不过由于制裁影响所以这款鲲鹏并没有发布。
这个CPU微架构的超线程设计之前已经出文讲解过了,所以这次就直接解析微架构,看看这个在实际测试中,CPU整体能效表现接近骁龙888的处理器,实力到底如何。
首先泰山大核方面,微架构和中核有点不一样,因为其拥有数量更多的浮点运算单元,而且二级缓存容量高达1MB——是中核的两倍。不过大核与中核微架构之前端是一样宽的,皆为6解码。
假如把骁龙888的X1微架构之前端5解码摆出来,再结合差不多的 ROB 深度,以及与泰山大核完全一致的4个后端整数ALU、1MB二级缓存、4MB三级缓存,那么泰山大核架构就是奔着对标X1架构去的。
不过由于制程工艺影响,以及这次的 SLC 容量缩水到4MB,还有泰山架构的甜点频率过低(中核主频2.15GHz附近),所以这个泰山大核的能效明显不如骁龙888之X1超大核。
可是若从多核能效方面来看,得益于三颗甜点频率的泰山中核与四颗主频低至1.53GHz的A510小核(较骁龙888的A55架构能效提升20%),麒麟9000S略胜一筹(如下图)。在制程工艺落后的情况下,此番表现实在难得。
GPU方面,这次华为自研的 Maleoon 910,采用了四核心设计,频率为750Mhz。每个核心拥有左右两组 ALU Core,每组又拥有128 ALUs,所以总计就是4×2×128=1024ALUs。
骁龙888的 Adreno660 GPU 其ALUs规模是512,但频率直接超到了840MHz!可见在架构没换代和规模没变化的情况下,高通为了挤性能就选择了最简单的超频骚操作。
可以看出,Maleoon 的规模比 Adreno 大一倍,频率又更低一些;外加高通在架构上的躺平操作,这便是其能在制程工艺落后之情况下取得与对方一样能效的两大关键因素。
至于两者完全一致的性能成绩,原因就是此为2020年的架构方案。因为鲲鹏930s本来是计划2021年发布,与其配套的会有海思显卡,而这个 Maleoon 便是源自海思显卡。
历史意义:
麒麟9000的历史意义之前已经出过专文解析过了(在绝境中用实力领先安卓旗舰芯两年),这里不再赘述。
但是麒麟9000S的历史意义,却被很多人忽略,因为他们盯着的,是性能与能效和骁龙888一致这件事。其实原因也很简单,这就是源自2020年设计的电脑端CPU和GPU之移动端自研架构。
想用几年前设计的架构打赢高通最新的处理器,而且还是在制程工艺严重落后的情况下,该不会以为这是三体人科技吧?
其实华为在处理器的命名上,也呼应了这个事实。
带个“S”后缀,表示整体架构源自华为的电脑部门,主体型号不变则代表其与麒麟9000的架构设计诞生于同一时期(从上图芯片标的丝印也可以看到这个时间节点)!
至于基带和制程工艺的事,问就是“4G改”和“???”,所以麒麟9000S的 Die shot 也就不分析了。
等未来真正做到“春暖花开”、老美喊破喉咙也没用的时候,麒麟9000S的历史意义便会得到二次升华。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.