参与魔王

一切为了开放科学:Papers with Code新增CS、物理、数学、统计学等多个学科

资源网站 Papers with Code 又有新举措。这次它向多个科学领域扩展,除了机器学习以外,还增加了物理学、数学、计算机科学、统计学和天文学的论文及代码,并且同样支持在 arXiv 页面上添加代码链接。

机器学习资源网站 Papers with Code 自创立以来,凭借丰富的开放资源和卓越的社区服务,成为机器学习研究者最常用的资源网站之一。近一年来,该网站更是动作频频,比如加入 Facebook AI与 arXiv 展开合作,支持在 arXiv 页面上添加代码链接

目前,Papers with Code 已包含将近四万篇机器学习领域论文、1879 项 ML 任务、3518 个相关评估基准和 3068 个 ML 领域数据集。

但是,Papers with Code 并没有满足于此。

刚刚,Papers with Code 宣布增加新的科学领域:物理学、数学、计算机科学、统计学和天文学,并且同样支持在 arXiv 页面上添加代码链接。


传送门:https://portal.paperswithcode.com/

也就是说,Papers with Code 将不再只是机器学习资源网站,而是向着多学科资源平台一路狂奔。

目前,Papers with Code 拥有 4583 篇计算机科学论文、3098 篇物理学论文、1724 篇数学论文、1699 篇天文学论文、1277 篇统计学论文。


Papers with Code 表示,此举旨在提升这些领域的可访问性(accessibility)和可复现性。

该网站联合创始人 Ross Taylor 发文表示:

目前,Papers with Code 已经追踪 60 万余篇研究论文。但这只是个开始,未来数周和数月我们将持续扩展覆盖范围。我们希望能够增强所有科学领域的代码可用性,使之成为研究规范,帮助整个研究社区共同快速进步!


一切为了开放科学!

Ross Taylor 还介绍了此举的初衷:


Papers with Code 最初旨在解决机器学习社区面临的问题,如可访问性、可复现性和信息过载。解决办法包括将论文与代码对应起来、提取科学结果、制定任务分类、创建方法库等。共有 6000 多名个人编辑为这些免费资源做出努力。

但这些问题并不是机器学习社区所独有的,同样的问题还存在于更广泛的计算科学领域。基于此,Papers with Code 决定扩展至多个科学领域。我们观察到科学社区存在两种趋势,此举正是对这些趋势的回应。

趋势一:对可复现性的要求增加

十月份,Papers with Code 和 arXiv 展开合作,引起了更广泛科学社区的共鸣,上传论文的同时提交代码的人数出现激增。同时,我们也看到大量物理学、天文学等领域论文被添加至 Papers with Code 网站。

因此,Papers with Code 扩展至多个领域的直接原因就是,服务更广泛的科学社区。过去 5 年中,25% 的机器学习论文公开了代码,而其他领域中这一比例只有 2.3%。Papers with Code 将帮助更多研究人员解决这一普遍问题,促进所有领域中的代码可用性。

趋势二:深度学习越来越多地应用到科学领域

另一个趋势是,机器学习越来越多地应用到科学任务中。神经网络成为科学家的重要工具,从蛋白质折叠到银河系检测等任务都在使用机器学习技术。因此,Papers with Code 的扩展旨在服务「使用机器学习的科学」社区。代码可用性只是第一步。

这两个趋势并非一体,机器学习赋能的科学领域不一定要是开放科学。但是我们认为将机器学习辅助的科学发展和开放研究协作结合起来将带来事半功倍的效果。以开放的方式展示科学进展将使每个人受益。

最后,Ross Taylor 重申了 Papers with Code 的目标——开放科学,即研究更加开放、可扩展,方法越来越多地受到计算技术和机器学习的驱动。

参考链接:https://medium.com/paperswithcode/papers-with-code-is-expanding-to-more-sciences-5d375d10ca3a

Powered by Froala Editor

产业arXiv代码论文
2
相关数据
基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

推荐文章
暂无评论
暂无评论~