文章转载于量子位(QbitAI)
作者:一水
曾经每天都用谷歌学术的科学家们,正在转向新的AI工具。
就在谷歌学术迎来20岁生日之际,Nature却担忧发文:
谷歌学术能否在人工智能变革中活下来?
没错,每月访问量超过1亿次的谷歌学术,正在被AI工具悄然颠覆。
2015年,艾伦AI研究所推出了Semantic Scholar;
2022年,OurResearch推出OpenAlex;
近来又推出了consensus、Emergent Mind等科研AI助手;
来自华盛顿大学的计算社会科学家Jevin West表示,即使自己每天都在用谷歌学术,但是:
鉴于一些新的AI工具的到来,现在,也许是谷歌学术作为主要搜索引擎被推翻的时刻。
1
Nature:谷歌学术正在被AI工具颠覆
可以看到,几个流行的AI工具正在实现科学家们眼中,“我们希望谷歌学术去做的事情”。
稍远的有,2015年艾伦AI研究所推出了Semantic Scholar,以及2022年OurResearch推出了OpenAlex。
前者提供了谷歌学术没有的相关论文推荐和AI问答等额外功能,收录超2亿篇出版物。
后者则是将4500万篇科学论文数据库与800亿参数LLM(大语言模型)结合,打造出一个在事实性与引用准确性方面超越GPT-4o的新物种。
为了具体说明AI学术工具当前的形态,我们挑几个来详细瞅瞅。
Consensus,一款专为科研设计的学术搜索引擎,两位创始人是西北大学校友兼足球队队友。
这个产品利用LLM和向量搜索的方式提取Semantic Scholar中2亿多篇同行评审论文,提供更精准的搜索结果。
首页是酱紫的,看上去还挺简洁:
话不多说,我们直接拿经典论文《Attention Is All You Need》打个样:
初步印象,Consensus免登录可用这一点还挺方便,在搜索结果中,它从上到下展示了论文摘要、关键洞察(Key Insights)、结论、以及相关问题等。
一番点点点之后,发现了两个有意思的功能:
其中之一,为了保证引用资料的可靠性,Consensus看上去下了功夫。它提供了信息来源的多个维度,包括作者背景、发表时期、期刊信誉、被引次数、基金支持和文章内容等。
另外,点击这个“Ask this paper”,还能一键展开论文全篇并提问互动。
提问框会先出现在页面底部,点进去就是完整论文。
不过需要注意,此时它会提醒,“Ask this paper”需要登录后才能使用。
登录解锁后,即可针对论文进行提问,也支持中文。
目前,Consensus的免费版本提供无限搜索和有限GPT-4摘要,其高级版本为每月8.99美元(大约65元人民币)。
和Consensus类似,Emergent Mind也是一款专为计算机科学家设计的AI研究助手,由独立开发者Matt Mazur创建。
与ChatGPT这类通用模型不同,它高度专注于计算机科学这一领域,能够搜索和总结最新的计算机科学论文。
丢给它同一篇论文后,结果看起来雀食显得“更专业”。
首先,它会在结果顶部展示论文pdf,点进去就是原文,非常直给。
然后概述、关键贡献、实验过程及结论、研究意义等一字排开,能看出基本贴合论文叙述大纲,逻辑一目了然,重点也全摘出来了。
不过遗憾的是,提问这个功能只有Pro用户才能解锁,一般人支不动(doge)。
但但但是,有项功能绝了,回答末尾竟提供了各大社媒的相关评论地址,推特、黑客新闻、油管等全都有。
点击就能直接跳转,甚至支持预览。
而且,论文作者发表了多少论文,也都整理汇总了。
目前,Emergent Mind允许每天进行5次免费搜索。
另一个比较有代表性的是Cambrian,专注机器学习领域,由Cambrian ML团队(谢赛宁和LeCun领导)开发。
Cambrian主要帮助人们快速发现最新的机器学习(ML)研究,收录了自2017年以来超24万篇ML论文。
还是同一套题:
一个明显不同是,Cambrian虽然在第一的位置提供了我们要的原文,但也依次展示了其他相关论文。
换句话说,它一开始就没有局限于我们指定的论文。
整体来看也很简洁,甚至还在论文底部提供了查看pdf、和论文聊天、提问、跳转开源社区等功能。
论文右下角也直观展示了引用量,方便筛选相关论文中大家关注更高的。
尝试了一下和论文聊天,页面展开后,又发现了两个小点很有意思。
一个是其他AI工具少见的,可直接查看论文大纲。
另一个是笔记功能,选中某一段或某个词后,既可以要求解释,也可以做标注,侧边栏还能看到所有标注。
小结一下,目前绝大多数AI学术工具主要在两个方向上发力:
初步搜索页面的结果展示
与论文进行交互
在大方向基本一致的情况下,各家在一些小细节之处稍有不同。
不过,和我们平时使用的类似国产工具相比,有一个功能貌似都没看到——全文翻译。
比如豆包插件,可以同屏左右对照翻译。
除了上面这类形态,以Agent(智能体)为代表的AI工具也开始冒头。
比如Undermind,它使用更复杂的基于Agent的搜索,虽然比传统搜索引擎用时更长(几分钟),但回答质量更好。
(一开始就要注册账号,且需要机构或公司邮箱地址)
一眼看过去,它把参考来源整理的非常清晰详细,整体也偏向正经科研。
更多类似工具在此不再赘述,我们能够看到,正如Nature所担忧的——
谷歌学术正在被AI工具颠覆。
1
谷歌学术:即将成立20年,每月访问量上亿
谁曾想,成立于2004年的谷歌学术,当时也是以“颠覆者”的姿态闯入文献检索领域。
在它出现之前,研究人员主要靠图书馆或付费数据库(如Web of Science和Scopus)来检索学术文献。不仅繁琐耗时,而且需要支付费用才能访问完整的文章。
甚至就在谷歌学术推出的同月,爱思唯尔(Elsevier)还推出了付费服务Scopus,这是一个包含大量科学参考文献和摘要的大型数据库。
面对当时的局面,谷歌学术打出了“站在巨人的肩膀上”这一广告标语。
简单说,谷歌学术的两位联合创始人Anurag Acharya和Alex Verstak(同为谷歌工程师)通过强大的网络爬虫技术,抓取了各种形式的学术资料。
比如书籍章节、报告、预印本和网页文档,甚至包括非英语的作品,这些资料涵盖了多个学科领域,包括自然科学、人文科学和社会科学。
按照Anurag Acharya的设想,其目标是:
让全世界的学者更加高效,帮助每个人都能站在科学共同前沿。
就在当年11月,谷歌学术推出了Beta测试版,主打快速、免费检索。
后来,他们一路升级打怪,不断丰富完善谷歌学术的功能。
上线初期,团队主要解决版权问题。
他们积极争取学术出版商的支持,同意让谷歌学术索引他们的内容。
一番努力下,全球最大的在线期刊库JSTOR最终同意向用户提供文章的第一页扫描,这对用户来说非常重要,因为他们至少可以看到摘要,从而决定是否需要进一步阅读整篇文章。
到了中期,随着收录了大量高质量的学术文献,团队将发力点放在了推出新功能上。
例如,他们推出了个人图书馆功能,使用户可以保存感兴趣的文章到个人账户中,便于后续查阅和管理。
此外,还推出了引用追踪功能,用户可以通过查看某篇文献被引用的情况来了解其学术影响力和引用趋势。
直到近期,谷歌学术继续优化其搜索算法和服务,引入了更多智能化的功能。
总之,经过近20年的发展,谷歌学术已经成为“最大的、也是最全面的学术搜索引擎”。
甚至有网友热烈表白,自己从未使用除了谷歌学术之外的东西。
截止目前,根据网络流量统计网站Similarweb的数据,谷歌学术每月的访问量超过1亿次。
而这,主要得益于谷歌学术这些年积攒的自身优势:
免费访问,且在搜索结果中倾向于展示文献免费版本;
资源覆盖广;
高级搜索选项;
在沃顿商学院Ethan Mollick教授看来,谷歌学术在现代研究中扮演着至关重要的角色。
它是免费的,并且绝对击败了其他所有学术搜索引擎,包括专门的搜索引擎。
不过,也是由于谷歌学术的免费性质,人们一直担心谷歌有天会“停办”。
对此,一家创业公司的创始人专门写了篇文章,探讨了谷歌学术背后的商业模式:
谷歌学术实际上可能对谷歌有内部商业价值
照他的观点,谷歌学术帮助谷歌提供了关于最新研究成果的情报,而且可以通过挖掘其数据库来寻找潜在员工。
这两个因素难以转化为金钱,但在谷歌规模的公司中,长期收益可能每年价值数亿美元。
但目前看来,谷歌学术的这些优势正在被AI取代。
Undermind:
https://www.undermind.ai/home/
consensus:
https://consensus.app
Cambrian:
https://www.cambrianml.org/
Semantic Scholar:
https://www.semanticscholar.org/
OpenAlex:
https://openalex.org/
Emergent Mind:
https://www.emergentmind.com/
参考链接:
[1]https://www.nature.com/articles/d41586-024-03746-y
[2]https://x.com/emollick/status/1587295619449864192
[3]https://x.com/rohanpaul_ai/status/1858970411658342407
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.