网易首页 > 网易号 > 正文 申请入驻

刷arxiv有哪些技巧?5个问题快速理解机器学习论文

0
分享至

译者:AI研习社(听风1996)

双语原文链接:How to Understand ML Papers Quickly

我所指导的ML学员经常会问我一些不同的问题:"你如何从每天大量充斥在Arxiv网址上的出版资料中选择阅读哪些论文?"

阅读大多数ML论文的好处是,你只需提出五个简单的问题就能跨越(忽略)一些专业术语。当我浏览论文时,我会尽可能快地回答这些问题。

1)函数近似器的输入是什么?

如:一张224x224x3的RGB图像,其中单个物体大致位于视图中心。

2)函数近似器的输出是什么?

如:一个对应输入图像的类维度为1000的向量。

请借助与具体(论文中的)方法无关的方式考虑整个系统的输入和输出,可以让你从算法术语本身中脱身,并考虑其他领域是否已经开发出使用不同方法(算法)在这里可能会有效的方法。我发现这种方法在阅读Meta-Learning论文时非常有用。

通过首先将ML问题视为一组输入和期望的输出,可以推断输入是否足以预测输出。如果没有这种推断练习,你可能会意外得到一个ML问题,其中输出不可能由输入决定。结果可能会是一个ML系统进行预测的方式是社会所认为有问题的方式(译者注:这里可能是想表达不符合人类常识与逻辑的执行方式)。

3)什么样的损失在监督输出预测(译者注:关注损失函数)?这个目标函数在什么样的背景假设下设立的?

ML模型是通过组合偏差和数据而形成的。有时偏差很强,有时偏差很弱。为了使模型具有更好的泛化能力,你需要添加更多的偏差或添加更多的无偏数据。天下没有免费的午餐。

举一个例子:许多最优控制算法都会假设一个固定的数据偶发过程,这个过程就是马尔科夫决策过程(MDP)。在MDP中,"状态 "和 "决策"通过环境的动态转换来确定映射到 "下一个状态、奖励以及事件是否结束"。这种结构虽然很笼统,但也是可以用来构造一个损失,让学习Q值遵循Bellman方程。

4)一旦模型被训练后,对于以前没见过的输入/输出对,模型能够泛化到什么程度?

归功于所捕获的数据信息或模型架构,ML系统可能会相当好地泛化到它以前从未见过的输入。近年来,我们看到越来越多和更高等次的泛化能力,所以在阅读论文时,我注意观察那些在论文中惊人的泛化能力以及它的泛化能力来自哪里(数据、偏差或两者都有)。

对于这个领域来说,更好的归纳偏差意味着存在更多的噪音,例如因果推理或符号方法或以对象为中心的表示。这些是构建稳健可靠的ML系统的重要工具,我发现将结构化数据与模型偏差分开的界限可能是模糊的。话虽如此,但让我感到困惑的是,有许多的研究人员认为推动ML前进的方式是减少学习量(译者注:训练轮次)并增加编写硬编码的量。

我们之所以进行ML研究,恰恰是因为有些东西我们不知道如何编写硬编码。作为机器学习的研究者,我们应该把工作重点放在改进学习方法上,把编写硬编码和符号方法留给那些研究编写硬编码的研究者。

5)论文中的说法是否可以证伪?

那些声称不能证伪的论文是不属于科学范畴的。

AI研习社是AI学术青年和AI开发者技术交流的在线社区。我们与高校、学术机构和产业界合作,通过提供学习、实战和求职服务,为AI学术青年和开发者的交流互助和职业发展打造一站式平台,致力成为中国最大的科技创新人才聚集地。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
独居1300平豪宅的北京大爷爆红全网:原来,有钱和富有不是一回事

独居1300平豪宅的北京大爷爆红全网:原来,有钱和富有不是一回事

老板手记
2024-10-29 19:10:17
意外宣布连续加息!10月30日,今日凌晨的四大消息全面发酵!

意外宣布连续加息!10月30日,今日凌晨的四大消息全面发酵!

风口招财猪
2024-10-30 00:26:46
80%拦截率地球最强,伊朗防空这次火了:中国装备打起来有底气

80%拦截率地球最强,伊朗防空这次火了:中国装备打起来有底气

帅先工场
2024-10-28 16:47:55
李渊退位后生下30多个孩子,令李世民头疼,武则天用一狠招解决

李渊退位后生下30多个孩子,令李世民头疼,武则天用一狠招解决

知否否
2024-05-16 15:41:57
李梦出镜不穿内衣,率真自信,网友:她做了女生想做却不敢做的事

李梦出镜不穿内衣,率真自信,网友:她做了女生想做却不敢做的事

南城无双
2024-10-26 13:07:52
美国终于“服软”?禁令撤回,阿斯麦“急眼”:这坑挖得深啊!

美国终于“服软”?禁令撤回,阿斯麦“急眼”:这坑挖得深啊!

魏家东
2024-10-29 09:07:16
全球十大镇国之宝,排第一的被称为全球最贵文物

全球十大镇国之宝,排第一的被称为全球最贵文物

牛锅巴小钒
2024-10-29 20:52:26
200元报名“保险旅游团”,老人被忽悠买下40万元乳山海景房

200元报名“保险旅游团”,老人被忽悠买下40万元乳山海景房

极目新闻
2024-10-25 13:43:03
将破150亿!胖东来单店盈利已超所有商超上市公司!“于东来又要为赚太多烦恼了”

将破150亿!胖东来单店盈利已超所有商超上市公司!“于东来又要为赚太多烦恼了”

北京商报
2024-10-29 19:59:38
揭秘女性性生活欲望强烈的四大原因

揭秘女性性生活欲望强烈的四大原因

智见派
2024-07-06 16:33:34
首位女航天飞行工程师王浩泽明日出征,家人:她从小刻苦上进,除夕夜也在学习

首位女航天飞行工程师王浩泽明日出征,家人:她从小刻苦上进,除夕夜也在学习

极目新闻
2024-10-29 17:15:32
野猪撞高铁致机械师身亡:全世界都泛滥,唯独国内受法律保护

野猪撞高铁致机械师身亡:全世界都泛滥,唯独国内受法律保护

胡言炫语
2024-10-30 04:13:07
再次提醒大家,真的只需要3个月

再次提醒大家,真的只需要3个月

新浪财经
2024-10-27 20:53:08
“家里死人先臭着”,是对劳动法和人性最大的侮辱

“家里死人先臭着”,是对劳动法和人性最大的侮辱

波哥评弹
2024-10-29 18:49:36
辛亥革命成功后,孙中山与黄兴分道扬镳,黄兴选择去了美国

辛亥革命成功后,孙中山与黄兴分道扬镳,黄兴选择去了美国

知否否知
2024-10-29 09:06:08
瓜帅:只有C罗能击败梅西,C罗是怪物,而梅西是怪物的爸爸

瓜帅:只有C罗能击败梅西,C罗是怪物,而梅西是怪物的爸爸

直播吧
2024-10-29 21:07:39
尴尬!C罗平梅西成足坛失点之王 梅迷嘲讽:4亿0冠 社媒金球奖

尴尬!C罗平梅西成足坛失点之王 梅迷嘲讽:4亿0冠 社媒金球奖

念洲
2024-10-30 06:32:22
中国刑事警察学院党委书记陈东升已任中石油纪检监察组组长

中国刑事警察学院党委书记陈东升已任中石油纪检监察组组长

澎湃新闻
2024-10-29 15:30:27
暗指谁?联合国会议上,有人提出反对在战争中采取斩首战术

暗指谁?联合国会议上,有人提出反对在战争中采取斩首战术

现代春秋
2024-10-28 17:49:37
比萝卜岗更狠的“祖坟岗”来了:14515人竞争,真考上能吹一辈子

比萝卜岗更狠的“祖坟岗”来了:14515人竞争,真考上能吹一辈子

妍妍教育日记
2024-10-29 19:02:29
2024-10-30 10:18:44
雷峰网
雷峰网
关注智能与未来!
65115文章数 655387关注度
往期回顾 全部

科技要闻

小米SU7 Ultra预售价超80万 加速推高端化

头条要闻

牛弹琴:中东遭遇非常血腥一天 欧盟外长说出狠话

头条要闻

牛弹琴:中东遭遇非常血腥一天 欧盟外长说出狠话

体育要闻

金球先生罗德里:拒绝社媒,住大学宿舍

娱乐要闻

74岁刘晓庆被曝曾出轨小20岁男生

财经要闻

张一鸣的首富与字节的烦恼

汽车要闻

不玩越野 主打智驾豪华 豹8凭什么抢豪华市场?

态度原创

旅游
艺术
手机
游戏
公开课

旅游要闻

“流放宁古塔”项目 真的能让游客满意吗?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

手机要闻

高危漏洞威胁三星 Exynos 设备,用户需尽快更新系统

《可怕可怕:人面犬》免费登陆Steam 恐怖冒险

公开课

AI如何揭开大自然和宇宙的奥秘

无障碍浏览 进入关怀版