网易首页 > 网易号 > 正文 申请入驻

数据库顶会VLDB 2021大奖颁布!华人学者囊括三项荣誉

0
分享至

作者 | 琰琰、王晔

编辑 | 青暮

当地时间8月16至20日,第47届VLDB 2021会议在丹麦哥本哈根召开。

VLDB会议全称International Conference on Very Large Date Bases,是数据库领域的顶级学术会议和另外两大数据库会议SIGMOD、ICD共同构成了数据库领域的三大顶级会议。

按照惯例,今年VLDB会议开设了最佳研究论文奖、最佳EA&B论文奖(实验、分析和基准)、最佳可扩展数据科学论文奖、最佳工业论文奖等多个奖项。此前华人学者便在此领域一骑绝尘,今年也不例外!

大会共收录了216篇 Research Paper、23篇Industry Paper、56篇Demo Paper ,其中入选的最佳研究论文、最佳EA&B论文、最佳工业论文的一作作者均为华人学者,他们分别是新加坡国立大学研究员杨任驰、西蒙弗雷泽大学博士生Xiaoying Wang、加州大学伯克利分校博士生Audrey Chen。

AI科技评论将获奖华人学者及论文信息介绍如下:

最佳研究论文奖

获奖论文《Scaling Attributed Network Embedding to Massive Graphs》

论文作者:Renchi Yang,Jieming Shi,Xiaokui Xiao,Yin Yang,Juncheng Liu,Sourav S. Bhowmick

本篇论 文一作杨任驰,目前是 新加坡国立大学研究员。他在2015年获得北京邮电大学工学学士学位;2020年获得南洋理工大学计算机科学系博士学位,师从Xiaokui XIAO教授和Sourav Saha Bhowmick。主要研究大规模数据管理与分析,对图挖掘、海量高维数据设计、高效算法感兴趣。

个人主页:https://renchi.ac.cn/

论文地址:http://vldb.org/pvldb/vol14/p37-yang.pdf

论文摘要:

要想获得准确预测的属性网络嵌入( Attributed Network Embedding, ANE)是一项很有挑战性的工作,而将有效的 ANE 计算扩展到包含数百万节点的海量图上,又将其难度推到了一个新高度。现有的解决方案在这种图上基本上会失败,或造成过高的成本、低质量的嵌入,或两者兼而有之。

本文提出了一种有效的、可扩展的计算海量图的PANE方法,其在多个基准数据集上达到了最高性能水平,其衡量标准包括属性推断、链接预测和节点分类三种常见的预测任务的准确度。特别是,对于拥有超过5900万个节点、9.8亿条边和2000个属性的大型MAG数据,PANE是唯一已知的可行的解决方案,它可以12小时内在单个服务器上获得有效的嵌入。

PANE通过三种主要算法的设计实现了高扩展性和有效性。首先,基于一种新的属性随机游走(random walk)模型,提出了学习目标,而在处理大型图优化任务上,仍然具有挑战性。其次,PANE为解决优化问题提供了一个高效求解器,其关键模块在于精心设计的嵌入初始化,它大大减少了收敛所需的迭代次数。最后,PANE通过对上述求解器的非线性并行化利用多核CPU,从而实现了可扩展性,同时保留了高质量的嵌入结果。通过广泛的实验,在8个真实数据集上比较了10种现有的方法,证明了PANE在结果质量方面优于所有现有方法,同时速度要快几个数量级。

最佳EA&B论文奖(实验、分析和基准)

获奖论文:《Are We Ready For Learned Cardinality Estimation?》

论文作者:Xiaoying Wang, Changbo Qu, Weiyuan Wu, Jiannan Wang, Qingqing Zhou

本篇论文一作Xiaoying Wang,目前是西蒙弗雷泽大学数据库系统实验室的博士生,师从王健楠教授。2016 年 7 月至 2018 年 4 月,她在奇虎 360 担任 AdExchange 的 C++ 开发人员。

个人主页:https://wangxiaoying.github.io/

论文地址:http://vldb.org/pvldb/vol14/p1640-wang.pdf

论文摘要:

基数估计 (Cardinality Estimation)是查询优化中长期未解决的基本问题。最近不同研究小组的多篇论文一致指出,基于学习的模型有可能取代现有的基数估计器。对此,我们提出了一个具有前瞻性的问题:基于学习模型的基数估计方法是否已经可以应用于真实的数据库产品中?本文的研究包括三个主要部分:一是专注于静态环境(即无数据更新的数据库系统),在统一的工作负载设置下,比较不同的学习的方法和传统方法在四个真实数据集上的表现,结果表明,基于学习的方法比传统方法更精确,但需要更高的训练成本和推理成本。二是基于学习的方法是否可用于动态环境(即频繁更新的数据库系统)。实验证明,它们无法跟上快速更新的数据变化,并很可能引起较大的误差。第三,通过深

入地研究基于学习的方法可能出错的几种情况。我们发现,相关性、分配或领域大小的变化会极大地影响该方法的性能。更重要的是,这些方法的行为通常很难解释和预测。基于以上发现,我们确定了未来应该进一步研究的两个方向,即如何降低学习模型的成本,以及提升模型的可信性。希望这项工作能够指导研究人员和从业人员共同合作,将基于学习到的基数估计器应用到真正的数据库系统中。

最佳可扩展数据科学论文奖

获奖论文:《Optimizing Bipartite Matching in Real-World Applications by Incremental Cost Computation》

论文作者:Tenindra Abeywickrama, Victor Liang,Kian-Lee Tan

论文地址: http://vldb.org/pvldb/vol14/p1150-abeywickrama.pdf

论文摘要:

Kuhn-Munkres(KM)算法是一种经典的组合优化算法,在交通等诸多应用场景中被广泛用于最小成本的二部( bipartite)匹配。例如,网约车服务可以用它来匹配司机和乘客,以尽可能地缩短等待时间。通常情况下,给定的两个二部集合,需要计算所有二部对之间边的成本并找到最优匹配。然而,现有研究忽略了边成本计算对整体运行时间的影响。实际上,边计算会大大超过最优分配本身的计算,例如在为乘客匹配司机时,最短路径往往需要很高的计算成本。根据这一观察,我们发现,常见的现实世界的设置表现出一个有用的特性,即允许我们仅在需要时使用最低的下限启发式增量计算边成本。与原始KM算法相比,这种技术显著降低了分配的总体成本,这一点我们已经在多个真实数据集、工作负载上得到了验证。此外,该算法并不限于这个领域,它还可能适用于其他有下限启发式算法的环境。

最佳工业论文奖

获奖论文:《RAMP-TAO: Layering Atomic Transactions on Facebook's Online TAO Data Store》

论文作者:Audrey Cheng,Xiao Shi,Lu Pan,Anthony Simpson,Neil Wheaton,Shilpa Lawande,Natacha Crooks,Ion Stoica

论文一作Audrey Cheng目前是加州大学伯克利分校计算机科学专业在读博士生, RISELAB成员,师从Ion Stoica教授和Natacha Crooks教授,曾获得伯克利校长奖学金,对数据库与分布式系统感兴趣。

个人主页:https://audreyccheng.github.io/

论文地址:http://vldb.org/pvldb/vol14/p3014-cheng.pdf

论文摘要:

与其他分布式数据存储一样,Facebook社交图谱TAO会优先考虑可用性、效率和可扩展性等因素,而不是满足大型、可读性强的工作负载所需要的一致性或保密性。随着产品开发人员在此系统上构建不同的应用程序,他们开始更多地关注业务语义。然而,为选定的应用程序提供高级功能,同时保持系统整体的可靠性和性能一直是一项挑战。在本文中,我们首先描述了开发者多年来的业务需求,以及目前TAO出现的原子级错误(即写),以此探讨了如何引入一个直观的读取业务API。我们通过对潜在异常的测量研究,强调了API原子级可见性的必要性,这些异常通常在没有强读取隔离的情况下发生。我们的分析表明,1500次批量读取中有1次反映部分业务性更新,这可能使开发人员体验变得复杂化,并产生意外的结果。为了缓解这个问题,我们提出了RAMP-TAO协议,这是一个基于读取原子级多分区(RAMP)协议的变体,支持最小开销的部署,同时确保大规模读取优化工作负载的原子级可见性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
林诗栋下降到第五!温瑞博收获男单亚军,世排大幅提升创造历史

林诗栋下降到第五!温瑞博收获男单亚军,世排大幅提升创造历史

烧体坛
2026-03-15 22:46:09
狠话刚出口就殒命!伊朗高官扬言杀内塔尼亚胡,2小时后被炸身亡

狠话刚出口就殒命!伊朗高官扬言杀内塔尼亚胡,2小时后被炸身亡

老马拉车莫少装
2026-03-15 22:43:55
又有3名院士,被官网除名!

又有3名院士,被官网除名!

双一流高校
2026-03-15 00:14:55
伊朗高官:向以色列提供帮助,乌克兰已成为伊朗合法打击目标

伊朗高官:向以色列提供帮助,乌克兰已成为伊朗合法打击目标

新京报
2026-03-15 10:18:07
泪目了!伊朗向死而生,让美以最绝望的出现了!

泪目了!伊朗向死而生,让美以最绝望的出现了!

大嘴说天下
2026-03-14 19:36:56
315车展乱成一锅粥,车企不让维权车主进场,唯独BBA畅通无阻

315车展乱成一锅粥,车企不让维权车主进场,唯独BBA畅通无阻

一盅情怀
2026-03-15 19:16:22
激战七局不敌张本美和,蒯曼无缘WTT重庆冠军赛女单冠军

激战七局不敌张本美和,蒯曼无缘WTT重庆冠军赛女单冠军

澎湃新闻
2026-03-15 19:42:26
又一个跌下神坛的柑橘耙耙柑,意外还是已成定局?多重原因揭秘

又一个跌下神坛的柑橘耙耙柑,意外还是已成定局?多重原因揭秘

爱下厨的阿椅
2026-03-15 13:35:03
“甲醛大户”被发现,开水也洗不干净,少往家买,更要学会辨别!

“甲醛大户”被发现,开水也洗不干净,少往家买,更要学会辨别!

美食格物
2026-03-14 01:05:07
国际观察|六问美以伊战事走向

国际观察|六问美以伊战事走向

新华社
2026-03-15 21:44:30
比梨子润肺、比莲藕润肠,3月遇见它要多吃,脆嫩爽口,是下饭菜

比梨子润肺、比莲藕润肠,3月遇见它要多吃,脆嫩爽口,是下饭菜

阿龙美食记
2026-03-14 19:34:45
马斯克罕见公开道歉

马斯克罕见公开道歉

上观新闻
2026-03-14 19:30:10
稀罕!哈马斯居然开始咬伊朗了

稀罕!哈马斯居然开始咬伊朗了

山间听雨
2026-03-15 07:56:31
豪门悲喜夜:曼联3-1维拉跻身前3 利物浦1-1惨遭热刺绝平 巴萨5-2

豪门悲喜夜:曼联3-1维拉跻身前3 利物浦1-1惨遭热刺绝平 巴萨5-2

狍子歪解体坛
2026-03-16 02:37:11
油柑偷偷加人工甜味剂,日销万吨发往全国多地,本地人从不吃?

油柑偷偷加人工甜味剂,日销万吨发往全国多地,本地人从不吃?

福建第一帮帮团
2026-03-14 14:10:45
武契奇指控三方联合施压 塞尔维亚坚守中立强军

武契奇指控三方联合施压 塞尔维亚坚守中立强军

看看新闻Knews
2026-03-16 02:13:04
1984年,张宗逊之子张又侠8个多小时拿下松毛岭:预备队还没上呢

1984年,张宗逊之子张又侠8个多小时拿下松毛岭:预备队还没上呢

历史甄有趣
2026-03-13 12:45:14
古巴街头火光冲天:别扯革命情怀,民生塌了才是真痛

古巴街头火光冲天:别扯革命情怀,民生塌了才是真痛

老马拉车莫少装
2026-03-15 04:11:36
难以置信!广州31岁女幼师征婚,要求广州有房、年薪10万以上独子

难以置信!广州31岁女幼师征婚,要求广州有房、年薪10万以上独子

火山詩话
2026-03-15 08:12:59
73-76爆冷!中国女篮进世界杯,庆祝画面曝光,宫鲁鸣确定准核心

73-76爆冷!中国女篮进世界杯,庆祝画面曝光,宫鲁鸣确定准核心

何老师呀
2026-03-15 18:51:27
2026-03-16 04:35:01
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7118文章数 20740关注度
往期回顾 全部

科技要闻

传裁员20%,新模型难产:Meta AI仍没理顺

头条要闻

伊朗:对4处美军基地毁灭性打击 摧毁80%重要设施

头条要闻

伊朗:对4处美军基地毁灭性打击 摧毁80%重要设施

体育要闻

卢卡绝杀掘金:湖人有季后赛氛围了?

娱乐要闻

周小闹回应刘文祥塌房:我晚上吃啥啊

财经要闻

3·15晚会曝光7大乱象 这些企业被点名!

汽车要闻

倾听用户声音 东风奕派三款新车亮相

态度原创

本地
数码
手机
公开课
军事航空

本地新闻

坐标北京,过敏季反向迁徒

数码要闻

AWE2026海信空调诠释智慧空气新范式

手机要闻

4月新机潮:OPPO双潜望、华为双旗舰、两台天玑9500性能机齐发!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗船只逼近美航母 美连开数炮全打空

无障碍浏览 进入关怀版