网易首页 > 网易号 > 正文 申请入驻

浅谈深度神经网络处理器架构演进

0
分享至

深度神经网络(DNN)因其强大的表征能力,在图像识别、自然语言处理、物体识别、自动驾驶等多个领域取得了突破性进展。为了适应更复杂的应用场景,深度神经网络不断发展,模型参数呈指数级增长,如近期表现惊人的GPT-3模型具有1751亿个参数。
深度神经网络对硬件的算力、能耗以及访存带宽的需求极高。最早的深度学习系统由上千台CPU服务器搭建,只单纯训练一个能识别猫的神经网络。层数众多、每层又有大量并行且层间流水的神经网络架构,充分暴露了CPU在并行性与访存带宽上的弱势,使CPU强大而复杂的缓存机制形同虚设。GPU的高并行和高带宽优势非常契合神经网络架构的上述需求,成为了云服务器上的主要硬件平台。
以寒武纪DianNao系列与谷歌TPU为代表的AI领域专用架构随后掀起热潮,其基本思想是进一步提高并行度,增加算力密度,摒弃缓存而显式地优化数据流与内存,精简控制。首先,针对DNN模型中占据绝对计算与访存开销的张量(tensor)运算,以张量为粒度设计运算器阵列并进行调度,同时减小每个乘法单元的位宽(INT8)。其次,针对已知的DNN计算与访存行为(静态计算图),进行BUFFER与运算器的显式优化,减少与DDR的交互(如TPU脉动阵列旨在提高数据在片上的复用率)。同时进行算子融合与调度优化等编译器优化(如利用多面体技术的算子融合以及TVM3中的调度自动优化等)。控制器设计也很简单,不再需要运行时调度、分支预测与复杂的缓存机制设计。更小的位宽、更精简的缓存和控制使片上更多的晶体管用于计算。比如英伟达最新的A100芯片上的540亿个晶体管中,只有45万个INT8乘法器(用作DNN推理),粗略估计有4.8亿个晶体管用于计算,比重不到9%;而有2.5亿个晶体管的TPU中用于计算的晶体管数量约占芯片总面积的24%。


近年来,深度神经网络在手机、可穿戴设备和机器人等端侧设备部署的趋势愈发明显。但这些设备的算力和带宽有限,难以进行部署和高能效运算大模型。DNN具有的高度稀疏性为我们带来了曙光:参数矩阵在正则化之后存在大量零参数,能省去大量乘加运算;DNN还能容忍更小的数据位宽。于是,DNN模型的压缩技术成为近几年一大研发热点,支持各种稀疏类型、不同位宽的压缩算法层出不穷。然而,压缩算法若不能获得硬件架构的友好支持,其实用性和能效优势会大打折扣。当前的DNN加速器正处于软硬件协同设计阶段。
由于存储器工艺发展速度远落后于CMOS工艺,存储与计算分离的冯·诺伊曼架构会导致经典的存储墙问题。DNN海量的操作数使存储墙问题更为突出。存算一体架构将DNN庞大的参数矩阵固定在存储器中,使乘加运算通过模拟(或数字)的方式发生在存储器件上(或外围电路中),有可能带来千倍的能效比优势。2020年,欧洲微电子研究中心(IMEC)联合格芯(Global Foundries)推出了一款Analog-in-Memory-Computing(AiMC)架构,能效比达到了创纪录的2900TOPs/W。可见,DNN专用架构的下一步演进将是存算一体架构。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刘昊然王宝强加盟河南春晚,堪比湖南春晚阵容,天津春晚压力倍增

刘昊然王宝强加盟河南春晚,堪比湖南春晚阵容,天津春晚压力倍增

晓徙历史
2025-01-23 08:40:25
一场3-0!让阿森纳基本出线,欧冠乱了:9队差2分,争4个晋级名额

一场3-0!让阿森纳基本出线,欧冠乱了:9队差2分,争4个晋级名额

体育知多少
2025-01-23 07:48:40
演员朱亚文,被爆离婚!

演员朱亚文,被爆离婚!

紫雨说娱乐
2025-01-22 13:26:45
真有排面!C罗祝Speed生日快乐:希望你今天过得愉快

真有排面!C罗祝Speed生日快乐:希望你今天过得愉快

直播吧
2025-01-23 09:47:30
特朗普上任第二天,喊话对华加税,但满足3条件,可以不打贸易战

特朗普上任第二天,喊话对华加税,但满足3条件,可以不打贸易战

今墨缘
2025-01-23 10:31:38
中国股市又爆猛料,明天A股或将要大变天,万千散户抄底还是逃跑

中国股市又爆猛料,明天A股或将要大变天,万千散户抄底还是逃跑

一丛深色花儿
2025-01-23 11:40:56
拜登离任前宣布一名单,其中被美国称“下一代领袖”的华人引热议

拜登离任前宣布一名单,其中被美国称“下一代领袖”的华人引热议

华人星光
2025-01-22 16:27:54
凯尔特人VS快船:霍勒迪、霍福德和波尔津吉斯因伤缺阵

凯尔特人VS快船:霍勒迪、霍福德和波尔津吉斯因伤缺阵

直播吧
2025-01-23 10:29:19
获释人质:在加沙被囚于地道,有时候被转移到“人道主义区”

获释人质:在加沙被囚于地道,有时候被转移到“人道主义区”

桂系007
2025-01-21 15:27:09
1952年,何应钦之妻患癌后,其小叔子提出一个要求,何应钦:多谢

1952年,何应钦之妻患癌后,其小叔子提出一个要求,何应钦:多谢

简史档案馆
2025-01-22 10:40:14
1991年,刘銮雄为蔡少芳过18岁成人礼

1991年,刘銮雄为蔡少芳过18岁成人礼

视点历史
2024-12-21 23:15:28
陈天桥赢了马斯克?

陈天桥赢了马斯克?

BT财经
2025-01-23 07:00:03
事实证明,曾为安倍晋三哭丧的吕丽萍,走到今天怪不得旁人

事实证明,曾为安倍晋三哭丧的吕丽萍,走到今天怪不得旁人

吃瓜局
2024-12-05 17:49:55
山东男子存银行1.1亿,3天后全被转走,银行:钱都帮你还债了

山东男子存银行1.1亿,3天后全被转走,银行:钱都帮你还债了

坦然风云
2025-01-20 18:40:03
撕毁协议后悔了,地道冒出上万哈马斯,以军:他们怎么杀不完?

撕毁协议后悔了,地道冒出上万哈马斯,以军:他们怎么杀不完?

利刃号
2025-01-23 11:01:15
马斯克承认找代练!称不这样做就无法击败亚洲玩家

马斯克承认找代练!称不这样做就无法击败亚洲玩家

游民星空
2025-01-21 10:05:21
队长杨浪被曝睡粉,床照被女方公开,事后反馈“好大、好舒服”

队长杨浪被曝睡粉,床照被女方公开,事后反馈“好大、好舒服”

社会酱
2025-01-06 16:54:18
吴清:2025年第二批保险资金长期股票投资试点规模将不低于1000亿元

吴清:2025年第二批保险资金长期股票投资试点规模将不低于1000亿元

财联社
2025-01-23 09:16:26
火箭109-108力克骑士 球员评价:5人优秀,1人良好,3人低迷

火箭109-108力克骑士 球员评价:5人优秀,1人良好,3人低迷

篮球资讯达人
2025-01-23 11:40:00
顶级后场大战!欧文36+9完爆爱德华兹21分,独行侠或走上灰熊老路

顶级后场大战!欧文36+9完爆爱德华兹21分,独行侠或走上灰熊老路

你的篮球频道
2025-01-23 11:26:35
2025-01-23 12:27:00
我是天边飘过一朵云
我是天边飘过一朵云
科技改变未来,未来生活更美好
903文章数 896关注度
往期回顾 全部

科技要闻

三星Galaxy S25系列发布:尝鲜价6499元起

头条要闻

东方甄选6个月亏损近1亿 俞敏洪:我们裁掉了不少员工

头条要闻

东方甄选6个月亏损近1亿 俞敏洪:我们裁掉了不少员工

体育要闻

韩国的新规,柯洁的习惯,中国的申诉

娱乐要闻

演员胡歌,官宣新身份!

财经要闻

重磅!关于股市,证监会等5部门发声!

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

旅游
艺术
家居
教育
军事航空

旅游要闻

清远长隆森林王国将于1月25日试营业

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

家居要闻

法式轻奢 高效利用空间

教育要闻

父母为什么不要太尊重、太共情孩子

军事要闻

废墟之下 加沙正在寻找万名失踪者

无障碍浏览 进入关怀版