网易首页 > 网易号 > 正文 申请入驻

清华夺SIGIR 2024「时间检验+最佳论文奖」!中国大陆研究机构首次牵头获奖

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】刚刚,信息检索领域的国际顶会SIGIR 2024,公布了最终获奖结果。在所有获奖名单中,来自清华计算机系的团队们斩获了两大奖项——时间检验奖、最佳论文奖,实至名归!

一年一届的信息检索领域顶会SIGIR 2024,终于开奖了!

今年,SIGIR组委会暂未汇总公布所有的获奖名单,不过已经有机构/网友纷纷晒出了自己的成绩单。

值得一提的是,清华计算机系今年一次摘得多项大奖:

2014年发表的论文斩获SIGIR 2024唯一「时间检验奖」,另一篇论文获得「最佳论文奖」。



网友对此表示热烈祝贺,「实至名归」!


另外,CS系助理教授艾清遥还获得了「青年学者奖」,这也是中国大陆研究学者首次拿下该奖项。


除清华艾清遥之外,还有微软研究院Bhaskar Mitra、拉德堡德大学Harrle Oosterhuis,以及中科大Xiang Wang教授(王翔)成为青年学者奖的获奖者!


此外,还有社区奖、DEI奖的三位获奖者。


今年,是国际计算机学会信息检索大会(SIGIR)第47届会议,于7月14日-18日在美国华盛顿特区正式召开。


这次会议共收到1148篇投稿,其中有791篇是有效投稿,仅有159篇长文被录用,录用率为20.1%。相较于CVPR、ICML这样的顶会,投稿数少了一大截。

根据艾清遥对接受论文的统计,从各研究机构教师的论文数量来看,今年亚洲的贡献似乎最大。



接下来,一起看看大家的获奖成果。

清华CS系抱走两项大奖

最佳论文奖——Scaling Laws For Dense Retrieval


这篇获奖论文,由共同一作方言、詹靖涛,指导老师艾清遥助理教授、刘奕群教授完成的论文。

这是来自中国大陆的研究机构首次牵头获得该奖项。


论文地址:https://dl.acm.org/doi/abs/10.1145/3626772.3657743

Scaling Law早已成为大模型公认的定律,即LLM智能水平与参数规模呈正相关性,成为大模型区别于传统AI模型的重要特征。

然而,这一定律是否适用于其他深度神经网络模型,仍旧存在巨大的争论。


在这项研究中,作者针对这一问题展开了深入的研究。

他们设计了新型检索性能评价范式,验证了Scaling Law在稠密信息检索中的适用性。

这对搜索引擎、推荐系统等信息检索系统的设计,将发挥重要的指导作用。


时间检验奖——Explicit factor models for explainable recommendation based on phrase-level sentiment analysis


时间检验奖,通常颁给10年以上的产生重要持久影响的学术论文。

这篇发表在2014年的论文,由时任计算机系张永锋博士、赖国堃等学生,在张敏教授、刘奕群教授、马少平教授指导下完成。

清华官微称,自2014年以来,这项「可解释性推荐」研究自发表以来,在互联网推荐系统的设计与实现中一直发挥着重要的引领作用。


正如论文题目所示,研究中首次定义了「可解释性推荐」的问题。

同时,研究人员设计了相应的情感分析算法,以解决这一技术挑战,


论文地址:https://dl.acm.org/doi/10.1145/2600428.2609579

根据Google Scholar的统计,截至目前,这篇论文被引数近千次。


其他奖项

最佳论文提名

来自山东大学、莱顿大学、阿姆斯特丹大学的研究人员发表的论文——Generative Retrieval as Multi-Vector Dense Retrieval,获得了最佳论文提名。



研究中,作者介绍了生成式检索在给定查询的情况下,使用序列-序列架构,以端对端的方式生成相关文档的标识符。

当前,生成式检索与其他检索方法(尤其是密集检索)的关系尚未完全清晰。

先前的研究发现,使用原子标识符的生成式检索,等同于单向量密集检索。然而,以前的研究仅关注检索阶段,而未考虑生成式检索解码器内部的深层交互。

本文通过证明生成式检索和多向量密集检索,共享衡量文档与查询相关性的框架来填补这一空白。


论文地址:https://arxiv.org/pdf/2404.00684

最佳论文奖亚军

还有一篇来自格拉斯哥大学和比萨大学的研究人员发表的A Reproducibility Study of PLAID,获得了最佳论文奖亚军。


此前研究中,ColBERTv2的PLAID(Performance-optimized Late Interaction Driver)算法,使用聚类的术语表示来检索和逐步筛选文档,以进行最终(精确)的文档评分。

最新论文,研究人员重现了原始工作,并填补了其中的空白。

通过研究PLAID引入的参数,作者发现了其帕累托前沿(Pareto frontier)是由三个参数之间的精心平衡形成的。

而超出建议设置的偏差可能会大幅增加延迟,而不一定能提高其效果。

之后,研究比较了PLAID和对BM25结果进行重新排序的方法,在低延迟情况下,重新排序方法表现更好。但在高延迟情况下,重新排序方法难以达到最佳效果。


论文地址:https://arxiv.org/pdf/2404.14989

最佳短论文奖

来自马萨诸塞大学阿默斯特分校的研究人员发表的Evaluating Retrieval Quality in Retrieval-Augmented Generation,获得了本届SIGIR最佳短论文奖。


这篇获奖论文,仅有6页。

研究中,提出了一种全新的评估检索增强生成(RAG)系统的方法,名为eRAG。

之所以提出全新的方式,是因为当前RAG系统评估面临着挑战。


论文地址:https://arxiv.org/pdf/2404.13781

一是传统的端到端评估方法计算成本高,另一个是基于查询-文档相关性标签的检索模型评估,与RAG系统的下游性能相关性较小。

eRAG方法可以将检索列表中的每个文档,都被单独输入到RAG系统的大模型中,针对每个文档生成的输出都基于下游任务的真实标签进行评估。

结果显示,eRAG显著改善了运行时间。相较于端到端的评估,GPU内存消耗减少了最多50倍。


参考资料:

https://x.com/thudcst/status/1813395091723272199

https://x.com/QingyaoAi/status/1785245799439630351

https://mp.weixin.qq.com/s/4SPX31Rt-j75pYHcBmGdTA



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
震惊香港网友!内地学生从北京到香港,不坐飞机不坐高铁,而是……

震惊香港网友!内地学生从北京到香港,不坐飞机不坐高铁,而是……

港你知
2025-01-06 20:02:48
除了性生活就是打麻将,揭露中国2000多个县城中,普通人的生活

除了性生活就是打麻将,揭露中国2000多个县城中,普通人的生活

跳跳历史
2024-12-31 17:21:40
禁赛四年?小彩娃跑路后果严重,上海女排诉求被曝光,非常解气

禁赛四年?小彩娃跑路后果严重,上海女排诉求被曝光,非常解气

跑者排球视角
2025-01-07 15:52:51
太羡慕!上海的公办小学,每天吃自助餐,6菜3主食1汤,小学生自己选→

太羡慕!上海的公办小学,每天吃自助餐,6菜3主食1汤,小学生自己选→

上观新闻
2025-01-07 12:35:51
开年大瓜,大学生暗战币圈

开年大瓜,大学生暗战币圈

邓姐姐的美好生活提案
2025-01-07 16:38:52
国家发展改革委:全面取消在就业地参保户籍限制

国家发展改革委:全面取消在就业地参保户籍限制

新华社
2025-01-07 11:02:18
连主持人都被骗进去了!缅北骗局再升级,“剧本”越来越精细了

连主持人都被骗进去了!缅北骗局再升级,“剧本”越来越精细了

乌娱子酱
2025-01-06 20:55:34
一场114-110给勇士送上大礼,文班亚马23+14,西部附加赛排名大变

一场114-110给勇士送上大礼,文班亚马23+14,西部附加赛排名大变

老鹈爱历史
2025-01-07 11:30:19
炸裂!浙江宣布目标在2035年实现全省共同富裕,网友:尽快打样!

炸裂!浙江宣布目标在2035年实现全省共同富裕,网友:尽快打样!

阿纂看事
2025-01-07 11:42:40
目前,仁爱礁局势再度紧张!

目前,仁爱礁局势再度紧张!

玲子日记
2025-01-07 14:09:18
重庆酉阳一小区业主称自来水多年浑浊有异味续:县住建委跟进处理

重庆酉阳一小区业主称自来水多年浑浊有异味续:县住建委跟进处理

澎湃新闻
2025-01-07 13:26:27
国王5连胜,NBA最新积分榜如下,4-7名差1胜场,8-12名差1.5胜场

国王5连胜,NBA最新积分榜如下,4-7名差1胜场,8-12名差1.5胜场

薇说体育
2025-01-07 16:46:28
强制退市被st,正股转债双双20cm跌停,一江苏股民满仓日亏11万!

强制退市被st,正股转债双双20cm跌停,一江苏股民满仓日亏11万!

历史阿务
2025-01-07 11:22:34
被“锤”7天又被换角,媒体喊话张颂文:别逃避,是时候站出来了

被“锤”7天又被换角,媒体喊话张颂文:别逃避,是时候站出来了

米椒娱乐
2025-01-06 16:09:35
郑爽晒5岁女儿庆生照,对女儿期望很大,希望她未来能进入娱乐圈

郑爽晒5岁女儿庆生照,对女儿期望很大,希望她未来能进入娱乐圈

小seven的囧囧啊
2025-01-06 17:51:19
一家长发帖高三一学期1500元打印费!网友:穷可以,但眼界不能穷

一家长发帖高三一学期1500元打印费!网友:穷可以,但眼界不能穷

火山诗话
2025-01-07 13:17:55
中日俄离婚率差距断崖:日本20%多,俄罗斯80%多,中国令人意外

中日俄离婚率差距断崖:日本20%多,俄罗斯80%多,中国令人意外

老鹈爱历史
2025-01-04 16:18:44
戒不掉!浙江一姑娘说自己每晚睡前都要用!有人担心:太依赖会不会对身体不好……

戒不掉!浙江一姑娘说自己每晚睡前都要用!有人担心:太依赖会不会对身体不好……

FM93浙江交通之声
2025-01-06 14:30:58
孙俪怀三胎传闻已有四五年!工作室首次正面回应,这次是真怀上了

孙俪怀三胎传闻已有四五年!工作室首次正面回应,这次是真怀上了

扒星人
2025-01-06 14:50:10
一个时代终结!维持50年后,俄罗斯被乌克兰彻底断气

一个时代终结!维持50年后,俄罗斯被乌克兰彻底断气

涛哥锐评
2025-01-06 18:33:25
2025-01-07 17:24:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
11970文章数 65752关注度
往期回顾 全部

科技要闻

黄仁勋化身"美国队长" 发布RTX 50系列显卡

头条要闻

27岁警察抓捕嫌犯时受伤流血 5名嫌犯中有3人患艾滋病

头条要闻

27岁警察抓捕嫌犯时受伤流血 5名嫌犯中有3人患艾滋病

体育要闻

广州队解散,一场注定徒劳的自救

娱乐要闻

泰媒曝在缅甸找到中国演员王星,7号移交泰国

财经要闻

重要通知!各地区不得违法开展异地执法

汽车要闻

10万元级无图智驾 悦也PLUS全路况实测

态度原创

旅游
亲子
家居
健康
公开课

旅游要闻

投诉量排名前十!北京16家旅行社被点名

亲子要闻

人类幼崽穿得好像小手办,小小的一只,也太可爱了

家居要闻

简约大气 居心之所

抑郁症患者称好的“乌托邦”宝地

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版