网易首页 > 网易号 > 正文 申请入驻

通过软件洞察和用例分析塑造的NPU IP架构

0
分享至

神经处理单元(NPU)的出现彻底改变了机器学习领域,使深度学习任务所需的复杂数学计算得以高效地执行。通过优化矩阵乘法和卷积运算,NPU极大地增强了AI(人工智能)模型在各个领域的能力,从服务器群到电池驱动设备。

TinyML(微型机器学习)的出现进一步推动了AI的发展,其重点是在资源有限的嵌入式设备上实现机器学习算法。TinyML的目标是在数十亿边缘设备上实现AI能力,使它们能够在本地实时处理数据并做出决策,而无需依赖云连接或强大的计算资源。

结合NPU技术基础和TinyML最新发展,Ceva推出了创新性的Ceva-NeuPro –Nano。这款紧凑高效的NPU IP是针对TinyML应用精心设计的,在性能和能效之间实现了完美平衡。Ceva-NeuPro-Nano的独特架构经过优化,能够端到端完整运行TinyML应用的整个流程,从数据采集和特征提取到模型推断,使其成为资源受限、电池驱动设备的理想自给自足解决方案。

来源 (Ceva)

设计理念:

Ceva-NeuPro-Nano的设计理念源于深入了解用户的需求和观点,我们希望提供一种功能强大且用户友好的解决方案。设计理念的主要指导思想是优先考虑软件的易用性和解决应用层面的难题,而不是仅仅关注神经网络层。这种方法确保了Ceva-NeuPro-Nano能够高效且无缝地处理神经网络、控制和DSP(数字信号处理)工作负载。

主要目标是创建一个嵌入式AI的NPU,在不降低能效的情况下提供行业领先的性能。Ceva-NeuPro-Nano的顶尖级硬件设计专门针对TinyML应用的低功耗、高效率需求进行了优化,这使得它成为资源有限的边缘设备的理想解决方案。

软件优先:

Ceva-NeuPro-Nano的综合软件生态系统支持两大TinyML推理框架:TensorFlow Lite for Microcontrollers和MicroTVM。这确保了能与各种TinyML应用无缝集成。与许多其他解决方案不同,Ceva-NeuPro-Nano不仅仅是一个依赖于主机微控制器单元(MCU)的加速器;它是一个完全可编程的处理器,具有出色的神经网络(NN)和数字信号处理(DSP)能力,这使得它能够应对未来的发展需求,并适应任何未来层级或运算操作。

除了对主流TinyML框架的支持,Ceva-NeuPro-Nano还配备了一个全面的神经网络库,用于需要手动调整模型的情况,并且提供完整的数字信号处理(DSP)功能的DSP库。这些全面的库增强了Ceva-NeuPro-Nano的适应性和多功能性,使开发者能够轻松地将其应用到各种独特的应用需求中。

创新架构:

Ceva-NeuPro-Nano架构引入了多项创新功能,解决了TinyML应用中的关键痛点。它支持直接处理压缩模型权重,无需进行内存密集型的解压缩操作,这使其非常适合内存有限的TinyML设备。先进的数据缓存系统简化了硬件管理,提高了整体效率,消除了直接内存访问(DMA)调度的复杂性。

Ceva-NeuPro-Nano的硬件架构经过专门设计,旨在处理非线性激活,使其能够支持各种机器学习模型。它还集成了尖端节能技术,确保高效率,非常适合对功耗敏感的边缘设备。凭借对对称和非对称量化方案的硬件级支持,以及本地4位数据类型支持,Ceva-NeuPro-Nano可适应各种TensorFlow模型,进一步扩大其适应性,并实现更高效的数据处理和存储。

MAC数量大比拼

许多NPU制造商会吹嘘其设计中的MAC(乘法累加)单元数量越来越多,暗示MAC越多性能越好。然而在Ceva,我们对Ceva-NeuPro-Nano采取了不同的方法,重点关注MAC的利用率而不是单纯的数量。

我们认识到,如果不能有效利用MAC单元,那么拥有大量的MAC单元并不一定就意味着能实现更优秀的性能。事实上,MAC数量更多,往往导致功耗增加,却不会带来相应的性能提升。Ceva-NeuPro-Nano NPU有两个版本:Ceva-NPN32有32个8×8 MAC,Ceva-NPN64有64个 8×8MAC。通过大量的实验,我们证明了我们的32-MAC版本可以与其他128 MAC的解决方案相媲美。我们的创新设计和架构提高了MAC利用率,从而实现了这一卓越的效率。

在Ceva-NeuPro-Nano中,我们优先考虑MAC利用率而非简单的追求数量,因此在保持较低功耗的同时,提供了令人瞩目的性能。这种方法完美契合TinyML应用的需求,因为TinyML应用对功耗方面要求极高。我们专注于效率的优化,使Ceva-NeuPro-Nano能够在性能上超越那些MAC数量更多的竞争对手,证明智能设计和优化远比参与MAC数量大比拼更为重要。

现实使用案例:

我们进行了严格的测试和分析,将各种TinyML模型在NeuPro-Nano上的执行情况与其他解决方案进行了比较。结果突显了NeuPro Nano的惊人价值。它的面积缩小了45%,能效提升了3倍,内存消耗减少了高达80%,并且在TinyML网络性能上提升了10倍。

我们通过专注于分布在三大支柱(3 V)上的现实TinyML使用案例,实现了这些出色的性能和效率指标:视觉、语音、振动:

  • 在视觉支柱方面,我们认识到人脸检测、地标检测、物体检测和图像分类等轻型计算机视觉任务,在可穿戴设备和物联网设备进行交互和了解环境方面发挥着重要作用。EfficientNet、MobileNet、Squeezenet和Tiny YOLO等稳健的、经过行业验证的神经网络设计,可以处理主要的轻量级计算机视觉任务,这些是我们考虑的模型的几个例子。这确保了Ceva-NeuPro-Nano能够优雅而高效地处理CNN、深度卷积和其他层次。
  • 在振动支柱方面,我们借鉴了Ceva在IMU硬件、软件和应用开发方面的独特经验,这些经验帮助我们解决了诸如人体活动识别和异常检测等任务,这些任务在可穿戴技术和工业应用中具有重要意义。
  • 在语音支柱方面,作为人机交互的下一个重要步骤,我们利用了自身在语音传感应用开发方面的丰富经验(如关键词检测、降噪和语音识别),以及对该领域工作的深入了解。我们考虑到从循环神经网络(RNN)和卷积神经网络(CNN)到轻量化Transformer模型等多种设计的网络,确保了NeuPro Nano设计可以驾驭各种网络结构。

在整合三大支柱(3 V)时,我们意识到了基于神经网络应用中经常被忽视的一个重要部分——特征提取的重要性。这促使我们在Ceva-NeuPro-Nano设计中集成了强大的控制和DSP功能。

结论:

Ceva-NeuPro-Nano独特的架构,高效的MAC利用率,和全面的软件生态系统使其成为一个强大的多功能解决方案。它的设计理念侧重于现实使用案例和应用层面的挑战,确保能够高效、无缝地处理各种任务。凭借其突破性的性能、效率和适应性,Ceva-NeuPro-Nano将革新TinyML领域,为数十亿资源受限的设备带来机器学习的力量。

Ceva-NeuPro-Nano成为了Ceva-NeuPro系列NPU中的一员,扩展了我们的客户现在可以处理的边缘AI工作负载范围,涵盖了从TinyML应用到大规模生成式AI模型的各种需求。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普失算了,开战第十天,除了俄罗斯,又有一个强国选择了伊朗

特朗普失算了,开战第十天,除了俄罗斯,又有一个强国选择了伊朗

铁锤简科
2026-03-10 14:18:24
默多克95岁生日!邓文迪带俩女儿盛装出席,与继母和大哥相处融洽

默多克95岁生日!邓文迪带俩女儿盛装出席,与继母和大哥相处融洽

阿纂看事
2026-03-10 20:14:58
2026年清明将至,这5类人切记别上坟,老祖宗的忠告别当耳旁风

2026年清明将至,这5类人切记别上坟,老祖宗的忠告别当耳旁风

老特有话说
2026-03-08 15:30:41
伊朗警方:已逮捕81名向境外提供情报的人员

伊朗警方:已逮捕81名向境外提供情报的人员

看看新闻Knews
2026-03-11 07:30:02
美媒:中国储备14亿桶石油,天然气仅6%采购中东,中国现在最不慌

美媒:中国储备14亿桶石油,天然气仅6%采购中东,中国现在最不慌

影像温度
2026-03-10 14:42:28
史诗狂怒行动第二阶段:地下战争

史诗狂怒行动第二阶段:地下战争

南文视界
2026-03-08 22:59:27
原来她是孙千妈妈,全国开70家店,舅舅更不一般,难怪女儿这么红

原来她是孙千妈妈,全国开70家店,舅舅更不一般,难怪女儿这么红

以茶带书
2026-03-10 16:19:47
两会还没结束,央媒对霍启刚称呼变了,四字之差释放两大强烈信号

两会还没结束,央媒对霍启刚称呼变了,四字之差释放两大强烈信号

以茶带书
2026-03-10 13:33:47
穆杰塔巴负伤在身,革命卫队铁心要让哈梅内伊断子绝孙

穆杰塔巴负伤在身,革命卫队铁心要让哈梅内伊断子绝孙

移光幻影
2026-03-09 16:45:20
阿尔茨海默病者逐渐增多,医生提醒:55岁后,尽量改掉6个坏习惯

阿尔茨海默病者逐渐增多,医生提醒:55岁后,尽量改掉6个坏习惯

39健康网
2026-02-17 18:31:37
演都不演了?离婚传闻仅7月冯小刚再惹争议,和养女互动成导火索

演都不演了?离婚传闻仅7月冯小刚再惹争议,和养女互动成导火索

阿纂看事
2026-03-09 18:43:04
地产大佬一个个在香港隔岸观火

地产大佬一个个在香港隔岸观火

包邮区
2026-03-09 11:37:16
秦亡后王翦家族的抉择:分家避祸求生,竟无意间缔造两大千年豪门

秦亡后王翦家族的抉择:分家避祸求生,竟无意间缔造两大千年豪门

掠影后有感
2026-03-08 10:19:14
范志毅女儿嫁了!那个被要求“先买房”的申花门将,终抱得美人归

范志毅女儿嫁了!那个被要求“先买房”的申花门将,终抱得美人归

东方不败然多多
2026-03-11 09:28:13
把老百姓当傻子的操作,开始行不通了!

把老百姓当傻子的操作,开始行不通了!

胖胖说他不胖
2026-03-11 09:00:20
推断又正在被证实:美以的全面轰炸已逐渐开始

推断又正在被证实:美以的全面轰炸已逐渐开始

邵旭峰域
2026-03-10 10:20:32
余额高达508586.51元!一邯郸职工公积金引发热议,网友:一般般

余额高达508586.51元!一邯郸职工公积金引发热议,网友:一般般

火山詩话
2026-03-08 11:24:05
4月1日起,医保卡将不能这样用了,4月1日起医保卡新规来了

4月1日起,医保卡将不能这样用了,4月1日起医保卡新规来了

一品v
2026-03-09 22:36:55
时间节点如何?轰炸1月,全面轰炸即将开始、大体1周,月底有眉目

时间节点如何?轰炸1月,全面轰炸即将开始、大体1周,月底有眉目

邵旭峰域
2026-03-09 12:52:01
“活不起了?”男子横幅威胁引发热议,真相令人震惊!

“活不起了?”男子横幅威胁引发热议,真相令人震惊!

一丝不苟的法律人
2026-03-10 12:45:20
2026-03-11 11:52:49
爱集微 incentive-icons
爱集微
集微网官方账号
109133文章数 98338关注度
往期回顾 全部

科技要闻

腾讯急了急了,微信绝密AI智能体首度曝光

头条要闻

牛弹琴:更想打的伊朗 下一步或是"三板斧"

头条要闻

牛弹琴:更想打的伊朗 下一步或是"三板斧"

体育要闻

执教过李铁的英国老头,77岁又出山了

娱乐要闻

杨幂连续五年为刘诗诗庆生,刘诗诗回应

财经要闻

油价大转头?一天,从末日到曙光!

汽车要闻

丰田向左,本田向右

态度原创

艺术
亲子
房产
数码
公开课

艺术要闻

这组剪纸太美了!

亲子要闻

拍视频才这样,平时不这样的‍

房产要闻

信号!千亿巨头入局,三亚开启新一轮大征拆!

数码要闻

小米科技家电创新展官宣3月12日开启 多款家电首发

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版