NeurIPS 2020官方近日发布了一份开源指南。从2019开始,NeurIPS就“强烈建议”提交论文代码,不过仍非强制。

本文经AI新媒体量子位(大众号ID:QbitAI)授权转载,转载请联络出处。

AI论文,究竟该不应强制开源代码?

NeurIPS 2020官方近来发布了一份开源攻略。从2019开端,NeurIPS就“激烈建议”提交论文代码,不过仍非强制。

但无论如何,官方传达出了一种信号:AI学术顶会开源代码已是职业趋势。

NeurIPS此举也引发了一场“年经”式的评论:假如将来学术会议要求有必要开源,投稿人应该回绝吗?

而让人始料未及的是,不少网友以为:不开源,我有理。

对立一:代码并没有那么重要

首要,开源代码的意图是什么?是为了让其他研讨者可以复现效果。

假如一篇论文包括足够多的细节,那么他人就可以依据其间的公式自己写出代码,关于这类论文,可以不揭露代码。不过条件有必要是供给足够多的细节。

比方谷歌的AlphaGo就没有开源代码,可是没有人置疑它的正确性,事实上也有许多人依据谷歌论文复现了AlphaGo。

“我为什么对立AI论文强制开源代码”  AI 论文 开源 第1张

并且作者自己的代码可能会呈现过错,不开源的一个优点便是让其他研讨者独立复现。

假如作者在代码里挖了个不明显的“坑”,其他人也可以躲避,避免被带到沟里。

别的,也不要高估代码的价值,经典论文可以几十年长盛不衰,可是代码很可能十年后就难以运行了。

当然,还有一种观念便是,关于AI来说,数据集更重要。没有数据的代码是没有价值的,而许多数据集无法敞开,这意味着你即便拿到代码,也无法复现SOTA效果。

对立二:要为作者考虑

不开源一起也是为了照料作者的种种特殊情况。

比方一些研讨者是从事纯理论的研讨。有一个网友就说,他乃至都不知道怎样构建Docker容器,尽管宣布了多篇论文都在GitHub上开源了代码,但它从来不维护。

“我为什么对立AI论文强制开源代码”  AI 论文 开源 第2张

所以,论文是否开源应该依据代码关于文章的重要性而定,不应一刀切。

还有一些商业公司的研讨者,他们在写论文的时分用到了公司内部专有软件库,假如强制开源,他们有必要从头再写一遍代码,费时吃力,对这些人也是不公平的。

还有一些作者,自身并不是不想开源,而是期望可以将效果维护一段时间,在论文发布几个月后再开源代码,这关于从事医疗、法令范畴的学者很重要。

综上所述,反方网友以为,强制开源过于极点,应该对论文开源持鼓舞情绪,而不是强制。

支撑开源:不开源怎能让人服气

首要是一名从事石油职业的网友说,他们职业的数据都是商业秘要,所以不会发布任何数据和代码,乃至会在文章中丢掉一些公式来躲藏效果,还宣称98%的正确率。效果怎能让人服气。

他以为不揭露数据和代码,就像把一篇论文中所有的要害要素都删了,这样的研讨即便宣布出来也毫无价值。

还有一些人以为,强制开源会改动其他职业对机器学习的成见。

许多其他学科的人都把机器学习当作伪科学,这是为什么?由于AI范畴的论文发布进程十分不成熟。

科学办法的要害是一致性和可重复性。追逐单一的目标,每个人都对SOTA入神,这是一个巨大的问题。

而开源是处理此问题的一种办法。

上一年,AI闻名女学者Anima Anandkumar曾在个人博客里揭露喊话,激烈对立发论文却不给代码的行为,呼吁学术会议强制要求投稿一起有必要揭露代码。

“我为什么对立AI论文强制开源代码”  AI 论文 开源 第3张

她以为不开源代码不利于评定论文,不利于对论文造假的追责,更不利于职业敞开竞赛。

你觉得揭露的学术论文也应该揭露代码么?

转载请说明出处
知优网 » “我为什么对立AI论文强制开源代码”

发表评论

您需要后才能发表评论