网易首页 > 网易号 > 正文 申请入驻

超图计算+目标检测,性能新SOTA!清华发布Hyper-YOLO:用超图捕捉高阶视觉关联

0
分享至


新智元报道

编辑:LRST

【新智元导读】Hyper-YOLO是一种新型目标检测方法,通过超图计算增强了特征之间的高阶关联,提升了检测性能,尤其在识别复杂场景下的中小目标时表现更出色。

YOLO(You Only Look Once)系列是目标检测领域中的主流方法,以其高效性和实时性而著称。然而,现有的YOLO模型在处理跨层特征融合和复杂的高阶特征关系时存在局限,无法充分捕捉跨位置和跨尺度的复杂特征关联。

为了解决这一难点,清华大学提出了Hyper-YOLO:一种基于超图计算的目标检测方法。Hyper-YOLO首次将超图计算集成到目标检测网络,对特征图中的复杂高阶关联进行建模,实现了高阶信息的跨层次和跨位置传播。


作者列表:Yifan Feng, Jiangang Huang, Shaoyi Du, Shihui Ying, Junhai Yong, Yipeng Li, Guiguang Ding, Rongrong Ji, Yue Gao.

论文地址: https://arxiv.org/abs/2408.04804

Github仓库: https://github.com/iMoonLab/Hyper-YOLOv1.1

零代码平台:http://hyperyolo.gaoyue.org:28501/#/predict


使用超图计算结合YOLO,性能在各种规模模型中都达到顶尖,在COCO数据集上的表现明显优于其他模型,尤其是对中小目标提升更加显著。其中,相比于最新的YOLOv9-T、YOLO11-S,同规模的Hyper-YOLO分别实现了2%和1%的平均精度提升。

目标检测的困境

近年来,随着深度学习的快速发展,YOLO(You Only Look Once)系列模型凭借其高效的单阶段检测架构,在目标检测领域中脱颖而出。YOLO模型通过将目标检测简化为回归问题,在保持高精度的同时实现了实时检测能力,受到了广泛关注和应用。


然而,随着应用场景的复杂化,现有的YOLO模型在处理跨层次特征融合和高阶特征关系时暴露出了一定的局限性。

下图展示了几个典型的案例 (YOLOv8为例)。在打网球的场景中,现有模型将网球拍误判为了棒球棒;在冲浪的场景中,现有模型将冲浪板误判为了风筝。这种错误正是由于现有的模型难以捕捉视觉对象之间的复杂关系。


因而,不同目标间的高阶语义关联推理限制了目标检测的性能。

高阶关联的建模方法

为了解决这些问题,学术界一直在探索更加先进的模型设计与优化方法。其中,超图计算作为一种能够捕捉多方关系的数学工具,逐渐被应用于包括社交网络、脑网络等复杂数据结构分析中。


超图覆盖了多种关联,是复杂关联计算的有效方法。在Hyper-YOLO中,作者首次将超图计算引入目标检测领域,以实现视觉高阶语义关联的建模与学习。

模型效果

该工作在COCO数据集上进行了丰富的实验。Hyper-YOLOv1.1提供了3种规模的版本(Tiny, Small , Medium),在对比实验中,均明显优于最新的YOLO模型。

其中,Tiny版本的平均精度(mAP)指标相比于YOLOv8、YOLOv9、YOLO11的同规模版本分别提升3.0%、2.0%、0.8%;Small版本的mAP指标相比于YOLOv8、YOLOv9、YOLO11的同规模版本分别提升3.1%、1.2%、1.0%。此外,对于骨干网络、Kernel大小、特征增强策略、超图构建策略的消融实验证明了所提出的方法的先进性。


以下两图为YOLOv8、Hyper-YOLO在目标检测和实例分割任务下的可视化结果。



下图为使用高阶关联学习对特征图增强前后的可视化图(通过HyperC2Net前后的特征图)。


上述实验结果证明,Hyper-YOLO具有目前最先进的检测性能,尤其对场景中不同视觉对象的高阶关系具有更准确的理解能力。

Hyper-YOLO零代码平台

智能媒体与认知实验室还推出了一款基于Hyper-YOLO的零代码训练平台。在该平台上,无需配置环境、修改配置文件等繁琐操作,既可以一键上传图像利用训练好的Hyper-YOLO模型进行推理,也可以上传数据集自定义训练、直观展示训练过程。(推荐使用PC端chrome/Edge浏览器)


项目链接:http://hyperyolo.gaoyue.org:28501/#/predict

项目支持自定义训练。


在训练完成后,可以对验证数据进行推理和评估,并可视化检测结果:


方法概述

超图计算

超图是图的推广形式,是一种高效的特征表示学习方法。在超图中,一条超边可以连接多个顶点,从而表示对象之间的高阶关联。超图神经网络作为超图计算的核心方法,通常包含以下几个步骤:

1. 从原始数据构建超边

2. 从顶点到超边的消息聚合(超边卷积)

3. 从超边到顶点的消息分发(节点卷积)

超图神经网络由于其灵活性和丰富的表达能力,广泛应用于社交网络分析、生物信息学、推荐系统等领域,能够更有效地建模和分析复杂的多层次数据关联。

Hyper-YOLO整体架构

Hyper-YOLO 继承了典型的 YOLO 架构,骨干网络通过引入混合聚合网络(MANet)来增强特征提取能力,从五个特征层中获取信息。


颈部网络(Neck)采用基于超图的跨层次和跨位置表示网络(HyperC2Net),通过超图计算集成多尺度特征,实现高阶信息的跨层次和跨位置传播,从而生成适用于目标检测的语义特征,显著提升模型的检测性能。

基于超图的跨层次和跨位置表示网络

在传统YOLO模型中,颈部为连接骨干网络和预测头之间的部分,通常采用类似PANet的结构,承担多尺度特征提取与融合的功能。虽然这类结构能够进行一定的多尺度特征融合,但直接的信息交互局限在相邻层之间。

而基于超图的跨层次跨位置表示网络(Hypergraph-Based Cross-Level and Cross-Position Representation Network, HyperC2Net)则突破了这一瓶颈,主要过程如下:

1. 超图构建:HyperC2Net将来自不同层次的特征图进行拼接,形成跨层次的视觉特征集合。然后通过计算特征点之间的距离,构建一个超图,其中每个超边连接多个顶点,代表多个特征点之间的高阶关系。超图能够表达跨层次和跨位置的复杂关系,而非简单的相邻层信息融合。


2. 超图卷积:在构建超图后,HyperC2Net利用超图卷积在特征图上进行消息传播。通过这种方式,不同位置和层次的特征点可以相互传递信息,建模特征点之间的高阶关联,增强了模型对于复杂场景中目标的识别能力。特别是在跨位置特征交互方面,相比于传统的卷积操作,超图卷积能够捕捉到更广泛和复杂的特征关联。


总结

Hyper-YOLO通过引入超图计算方法,突破了传统YOLO模型在多尺度特征融合上的局限。超图的高阶关联建模能力使得HyperC2Net能够在跨层次和跨位置的信息传播中表现出色,不仅在特征点之间实现高效的信息聚合和分发,还通过跨层次的消息传递显著提升了目标检测性能,尤其在处理复杂场景和多目标检测任务中表现优异。

参考资料:

[1] Feng Y, Huang J, Du S, et al. Hyper-YOLO: When visual object detection meets hypergraph computation[J]. arXiv preprint arXiv:2408.04804, 2024.

[2] Feng Y, You H, Zhang Z, et al. Hypergraph neural networks[C]//Proceedings of the AAAI conference on artificial intelligence. 2019, 33(01): 3558-3565.

[3] Gao Y, Feng Y, Ji S, et al. HGNN+: General hypergraph neural networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, 45(3): 3181-3199.

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
南京大屠杀后,有不少日本兵神秘失踪,经过调查,凶手竟是一只猴

南京大屠杀后,有不少日本兵神秘失踪,经过调查,凶手竟是一只猴

华人星光
2024-12-28 11:50:24
泪目!41岁体育老师病逝,400多名学生赶来送别

泪目!41岁体育老师病逝,400多名学生赶来送别

环球网资讯
2024-12-28 15:46:08
赵薇离婚躲巨债?赵露思拿病博弈?黄子韬后悔送车了?沙溢改头换面?假模假样的前辈女星?

赵薇离婚躲巨债?赵露思拿病博弈?黄子韬后悔送车了?沙溢改头换面?假模假样的前辈女星?

十锤星人
2024-12-28 22:57:52
CBA第23轮排名更新!辽篮大胜新疆,山西绝杀广厦,上海收10连胜

CBA第23轮排名更新!辽篮大胜新疆,山西绝杀广厦,上海收10连胜

体坛大事记
2024-12-28 23:03:40
江苏凯迪拉克女销售私吞客户购车款后续:本人已被拘留,4S店发声

江苏凯迪拉克女销售私吞客户购车款后续:本人已被拘留,4S店发声

老鹈爱历史
2024-12-26 11:43:27
《小小的我》评价两极分化,消费残疾人?脑瘫患者不该有性生活?

《小小的我》评价两极分化,消费残疾人?脑瘫患者不该有性生活?

祝晓塬
2024-12-28 17:11:43
5换2交易后,篮网全力兜售即战力!美媒支招火箭抢人:3换1追神射

5换2交易后,篮网全力兜售即战力!美媒支招火箭抢人:3换1追神射

锅子篮球
2024-12-29 00:21:59
48岁马伊琍官宣喜讯,网友恭喜:离婚五年,终于等到这一天了

48岁马伊琍官宣喜讯,网友恭喜:离婚五年,终于等到这一天了

探寻者
2024-12-27 13:48:51
肝癌都是拖出来的!身体一旦出现“2痛1痒”,劝你立刻就医!

肝癌都是拖出来的!身体一旦出现“2痛1痒”,劝你立刻就医!

肝病专家王杨
2024-12-15 14:38:32
还能踢球汪嵩:我禁足的这一年就拿到了冠军,职业生涯圆满了

还能踢球汪嵩:我禁足的这一年就拿到了冠军,职业生涯圆满了

直播吧
2024-12-28 20:34:28
中国最有可能成为世界级巨头的十家公司!1、比亚迪,2、大疆…

中国最有可能成为世界级巨头的十家公司!1、比亚迪,2、大疆…

魏家东
2024-12-21 09:49:17
“不把房给我弟,你会失去我”妻子回娘家三天,施工员被赶出家门

“不把房给我弟,你会失去我”妻子回娘家三天,施工员被赶出家门

施工员小天哥
2024-12-27 17:55:58
山东一88岁老人去世 骨灰回家时 天空突然飞来一群仙鹤

山东一88岁老人去世 骨灰回家时 天空突然飞来一群仙鹤

闪电新闻
2024-12-28 11:58:57
阿塞拜疆称证实俄军击落客机!议员发出警告,俄方否认

阿塞拜疆称证实俄军击落客机!议员发出警告,俄方否认

项鹏飞
2024-12-27 18:47:03
北京110-109险胜同曦,来看赛后许利民、周琦和曾凡博说了什么?

北京110-109险胜同曦,来看赛后许利民、周琦和曾凡博说了什么?

篮球资讯达人
2024-12-29 01:36:17
买来看饮水机的?广东外援莱斯2场一共打了6分钟 2次出手没有得分

买来看饮水机的?广东外援莱斯2场一共打了6分钟 2次出手没有得分

直播吧
2024-12-28 23:16:14
赵薇官宣离婚,与黄有龙最后合影曝光,离婚原因恐不简单

赵薇官宣离婚,与黄有龙最后合影曝光,离婚原因恐不简单

180°视角
2024-12-28 15:48:58
交警提醒:私家车或将实施2+3新式严查,已经有不少车主被罚了!

交警提醒:私家车或将实施2+3新式严查,已经有不少车主被罚了!

爱论历史
2024-12-27 22:51:44
中国股市:十匹黑马曝光,十倍收益不容错过!

中国股市:十匹黑马曝光,十倍收益不容错过!

态度先生
2024-12-28 18:19:32
搞好人际关系最好的方法,不是送礼,而是坚持“莫索尔法则”

搞好人际关系最好的方法,不是送礼,而是坚持“莫索尔法则”

诗词中国
2024-12-26 13:14:09
2024-12-29 08:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
11931文章数 65748关注度
往期回顾 全部

科技要闻

特朗普要求,暂停执行TikTok强制出售令

头条要闻

媒体:韩国"年度大戏"变离谱 朝鲜这次安静的有点反常

头条要闻

媒体:韩国"年度大戏"变离谱 朝鲜这次安静的有点反常

体育要闻

63岁传奇羽毛球解说员,还不想退休

娱乐要闻

突发!赵薇官宣离婚,与黄有龙已分开多年

财经要闻

谁是中国第一工业?谁在支撑就业?

汽车要闻

长安启源C798内饰官图发布 配备副驾零重力座椅

态度原创

手机
本地
艺术
房产
公开课

手机要闻

手机周报份额再次出炉:vivo挤进第二,小米掉到第三,第一没悬念

本地新闻

好吃潮州|尝一口,这里的美食有点“潮”

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

房产要闻

11号线启航,瞄准改善品质天花板!白鹅潭江岸红盘引领全城热潮!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版