芯东西(公众号:aichip001)
作者 ZeR0
编辑 漠影
芯东西12月27日报道,自研芯片技术已经是优化手机终端体验的重要途径。今日下午,OPPO亮出芯片调校技术的最新进展,首度公布其自研芯片软硬融合技术栈关键的潮汐架构。
潮汐架构能有效解决影响SoC计算效率提升的存算分离、芯片调度两大瓶颈:
1、对性能的优化深入到传统手机厂商无法精细化的片上缓存系统,首次实现系统级缓存及L3缓存的动态匹配,可将平均能效节约8%。
2、精准动态调度SoC计算单元,使得快手、高德地图、微博、浏览器等应用均能效提升明显。
3、解决了影响系统流畅性的GPU控制显示时延一致性难题,让安卓旗舰手机的启动性能一致性体验超越苹果。
除了潮汐架构外,面向安全隐私,OPPO独家VIP模式提供芯片级权限加密,内置国密认证安全芯片,实现隐私信息独立存储、物理隔离。
此外,OPPO预告潮汐架构还会有重大升级,将进一步拓展与联发科的合作伙伴关系,深度参与下一代天玑旗舰芯片相关硬件的设计。
一、缓存机制:精细化利用片上缓存,平均能效节约8%
OPPO软件技术规划与架构设计总监洪汉生说,做好芯片调校,需要兼具好的芯片和软件能力。
当前SoC芯片计算效率提升困难有两大瓶颈:1)智能手机性能链路沿用经典的冯·诺依曼式结构,存算分离,存储读写速度远低于CPU计算速度;2)芯片的调度方案缺乏场景级的认知。
对此,OPPO带来自研的软硬芯片融合技术栈——潮汐架构。
据洪汉生分享,潮汐架构是OPPO在手机芯片调校领域钻研多年的综合成果。这些年,OPPO一直让一些做系统软件的工程师学习芯片技术,又招聘了大量的芯片设计工程师,让他们理解软件场景。所以潮汐架构是由一群懂软件、懂系统、懂芯片的技术专家们共同打造出来的。
针对典型冯·诺依曼计算机体系结构普遍存在的存算分离问题,洪汉生认为,缓存的使用是所有策略中最没有副作用的、最有效的一个办法。
存储器的金字塔,越往高处,速度越快。因为价格贵,所以上面几层容量越来越小。越往下,因为成本优势,容量能做的比较大。
相比内存存储,缓存的读写速度优势能达到10倍甚至百倍。如果让数据读取发生在金字塔上层,那么整个计算链路的效率能得到很大提升。
用好缓存,有助于实现性能和功耗的兼顾。
OPPO过去几年在这方面取得了进步。相对传统手机公司仅能在ROM或RAM进行性能优化,潮汐架构深入到了片上系统缓存及L3缓存。
“里面的辛酸,可能只有我自己知道。”据洪汉生回忆,两年前OPPO团队决定做的时候,没有仿真平台,更不要说代码或者开放接口,工程师们只能通过调整CPU、GPU、DDR的参数,改变投票策略,看缓存的命中和缺失,改一组数据就测一个结果,硬是用这种“笨办法”,足足整理了一整年的数据,进行数据建模,看明白其中的规律和原理,从入门到精通,真正理解了技术。
然后,OPPO团队与芯片厂商深入合作,成立性能和功耗的联合实验室,一起设计了从L3缓存到系统缓存的分区管理机制。
潮汐架构基于单场景去判断当前应用对系统资源的需求,缓存能够根据CPU和GPU进行动态配比,并使CPU、GPU等计算核心在最优频点区间运行。如果是计算型任务占多,则主动分配更多缓存给CPU;如果渲染型任务占多,则将资源倾斜给GPU。
洪汉生说,这些方案看上去不复杂,但如果回到两年前,“黑盒子”曾经就像一座大山一样挡住了道路,不翻过去,永远不会知道山的那边是什么样子的,所幸OPPO团队翻过了那座大山。
经测算,在性能无损的情况下,潮汐架构可实现8%的平均能效节约。
二、算力调度:动态调度SoC计算单元,明显提升日常应用能效
下一个问题是芯片怎样做算力调度。
计算机CPU有一个甜点区间,在这个区间里,能效比是最佳的;在这个区间外,有时候为了一点点的性能提升,要付出极大的功耗损失。
如果一个场景变得复杂,计算需求如何在多个计算单元里以最低能耗执行?怎样让多个核心都处于这样的甜点区间?这是一门复杂的学问。
据洪汉生透露,在OPPO新一代旗舰上,有1+2+3+2的架构,也有全大核的架构。
由OPPO与芯片厂商深度合作打造的潮汐架构,通过对应用具体场景的准确识别,精细化地进行场景调度分析和精准的算力功耗匹配,实现SoC计算单元的动态调度,让计算单元更多地运行在最佳能效的甜点区间。
在跨平台的CPU频率映射上,潮汐架构帮助避免了一些过度的算力消耗。
如图是实测在重载游戏下满帧情况的一个频点分布。可以看到,性能该释放时,高频点不吝啬,但其他时候,其调度控制得非常精细,能够把整个频率能够压到非常低。
从其他常用的快手、高德地图、相册、微博、浏览器等各种头部应用测试结果看,潮汐架构使其在SoC整体能耗上取得了3%以上的收益。
洪汉生解释说,这些数据看起来不多,是因为芯片能效不是那么容易提升的,而这些,都是真真实实的数据。
三、流畅性:让安卓旗舰启动性能一致性超越苹果
除了能效外,潮汐架构还给安卓旗舰手机带来了流畅性上的显著进步。
洪汉生提到苹果手机总是给人以更加流畅的意向。在他看来,安卓手机的流畅性如果想要超越苹果,最大的鸿沟就是“总是”这两个字。
做一次流畅很容易,做百次、千次、万次也不难,但是做到十万次、百万次,需要解决看不到的问题,要实现基本环节的体验始终保持一致。
OPPO是怎么做的?洪汉生分享说,日常使用手机点开一个应用,从点击那一刻到这个应用的图标展开,区间大概是100多毫秒。经过长时间的分析,OPPO团队发现要把它做流畅,可能比做一个游戏120帧还要难。
这是因为有三个行业难题:一是触控响应一致性,二是软件上的线程调度一致性,三是GPU显示时延一致性。
跟GPU强相关的显示时延一致性怎么做呢?安卓手机采用的是分层次渲染,每一帧的动画显示都要经历过多次软件合成、硬件合成,会在GPU里进进出出。如果说这是一条生产线,GPU就像是控制中台,必须有能力根据整个生产线上所有环节可能产生的任何偏差进行及时纠正,去动态增加时钟信号、动态增强GPU驱动能力,只有这样,才能保证小到几毫秒级别的时延,做到始终一致性。
否则,如果整个生产线错过了一个时钟信号,就会导致整个工序往右移,会出现丢帧和延迟感,带给终端用户不好的体验,比如点击图标后没有响应,整个页面的显示是姗姗来迟的。
在解决掉这三个问题后,OPPO参考了苹果的设计,把响应时间调到了一个比较舒适的时间,不快也不慢,然后用高速摄像机反复进行测试,最后成功将整个应用的启动响应时间控制得像苹果那样非常平稳。
通过精准的芯片算力调度,基于场景动态增强GPU驱动能力,潮汐架构解决了影响系统流畅性的GPU控制显示时延一致性难题,从而保证了启动性能的一致性。
在模拟1天使用的320次应用启动测试,OPPO Find X7以低至11ms的启动响应标准差,做到了所有旗舰的第一名,甚至超越了以稳定流畅著称的苹果。
四、国密二级认证安全芯片加持,实现硬件级安全加密
在保障用户隐私安全方面,OPPO致力于通过全链路的应用、数据管控和软硬件结合的创新功能,已取得多项国内外安全隐私领域顶级认证。
在今年10月发布Find N3典藏版时,OPPO推出了行业首创的“VIP模式”,通过三段式物理开关,一键就能关闭麦克风、摄像头、定位等敏感权限,为用户隐私进行硬件级安全加密。VIP模式也将登陆下一代Find X系列旗舰。
OPPO为“VIP模式”加持了一个通过手机领域最高认证等级的国密二级认证安全芯片。该芯片能够独立存储各种敏感信息,相比传统的软件安全方案,芯片级的加密方式可以将敏感权限的管理、授权开关,与操作系统分离,锁进安全芯片的硬件层,由芯片级安全子系统进行管理。
安全芯片配合通话隐私双向保护、隐私信息自动打码、证件照片一键水印等隐私功能,从硬件到一系列软件功能,全方面守护用户的隐私安全。
结语:手机竞争卷向芯片调校
同一颗芯片,不同的芯片调校能力,影响了手机在实际使用中能够发挥的芯片性能。
随着摩尔定律濒临失效,每一代芯片制程提升,背后有行业千亿级美元的投入、百万级工程师的努力,也只能把芯片的整体能效提升百分之十几。OPPO实现8%的平均能效节约,足见芯片调校对于优化能效表现的重要性。
在有限的芯片选择中,通过软硬件协同实现手机体验差距的芯片调校能力竞争,已经从手机巨头们之间暗战转化为台前“秀肌肉”的焦点。
这些终端用户“看不见”的优化,拼得是不止是软硬件技术实力,还考验了手机大厂们的场景级认知、与芯片原厂合作深度等综合能力。
随着芯片调校愈发精细化,更高的性能、更优的能效,更稳定的流畅性,结合越来越多引入的智能优化技术,最终将使用户受益。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.