Nature主刊及子刊将强制数据共享, 推进研究可重复性

Nature主刊及子刊将强制数据共享,推进研究可重复性

随着科研领域越发积极的数据分享,学术期刊也在与时俱进。从本月开始,所有被Nature和首批其他12个Nature旗下子刊所接收的论文将需要提供如下信息:用户是否能够以及如何获取相关原始数据。

9月7日,Nature杂志宣布数据分享新举措。自本月开始,所有被Nature杂志及其12家子刊所接受的研究论文,都必须提供他人是否能够、以及如何获取相关研究原始数据的信息。作者需要提供获取其最基本数据的方法,帮助其他研究人员理解、重复、以及推进论文的研究发现:

All manuscripts reporting original researchmust include a data availability statement. Data availability statements shouldprovide a statement about the availability of data supporting the resultsreported in the article. By data we mean the minimal dataset that would benecessary to interpret, replicate and build upon the methods or findingsreported in the article.

在2016年3月,Nature集团开始在其五家子刊尝试要求作者提供这样的数据分享声明,包括NatureCell Biology, Nature Communications, Nature Geoscience, Nature Neuroscience, 和Nature Physics。而这一政策,预计在2017年会推广至Nature旗下所有的期刊。

在某些领域,人们对数据分享的需求可谓迫在眉睫,甚至人命关天。去年,渥太华曾有儿童患有罕见的心理发展障碍。患者的头部异常之小,发育缓慢,医生一筹莫展。他们对该儿童进行基因组测序,希望从中找到遗传学解释,可是结果有太多的备选基因都可能是“凶手”。类似的案例常常在医学领域出现,由于数据分享不畅通,患有罕见疾病的人多难以获得准确的诊断。人们从而逐渐有了这样的共识:医学数据的共享将对人类健康福祉起到重要帮助。

而在其他一些领域,人们希望原始数据分享将能够缓解学术界当前所面临的科学研究可重复性危机以及数据造假等学术不端行为。此类行为近来因为一些高显示度案例,引起科学界和大众媒体的广泛关注。去年8月,Science杂志发表调查结果,显示在三家顶级心理学期刊所发表的100篇论文中,仅有39篇论文的研究结果被成功重复。究其原因,调查报告作者,弗吉尼亚大学心理学家Brian Nosek说新颖而赶潮流的结果更容易发表,从而带来系统性偏差(bias):

Publication is essential, and positive,novel, tidy results increase the likelihood of getting published everywhere.

事实上,这一现象普遍存在,Nature在今年5月发表的专题报道中称,通过对1576名研究人员的调查显示,超过70%的人曾未能成功重复他人研究结果,更有超过50%的人未能成功重复自己的研究结果。这一现象在生物学领域尤为严重,甚至被称为可重复性危机。

当然,Nosek等也指出,数据不可重复,并不证明相关论文的研究是错误的。新的发现指明一条可能的道路,重复性研究证实其可行,在科学进步之中,两者都不可或缺:

Innovation points out paths that arepossible; replication points out paths that are likely; progress relies onboth.

为部分解决数据分享问题,Nature旗下已有5大子刊试行了数据分享声明要求。通过这些期刊的试用,可以看到不同学科之间数据分享及获取的文化差异。另外,缺乏明确公开的资料库也给公共数据沉淀带来巨大障碍。不过,即便数据开放和分享程度较弱的学科,人们在这方面的意识和认知也在提高,数据沉淀有助于提高所发表研究的能见度和再利用,数据引用也能够提高数据创建者和分享者的被认可度。

当然,数据分享不仅关乎期刊。无论研究方、资助方还是出版界,都在力求增加研究数据的透明性和可用性。比如,项目资助方也在引入数据可用性的声明。英国七大研究理事会就要求资金持有人公开此类信息,美国国家卫生研究院和国家科学基金委都要求研究人员提供其研究数据的管理计划。在中国,类似政策还没有在基金委或者科技部展开。

Nature声称希望就论文数据可用性问题提供始终如一的信息,以帮助今后的科研人员对数据重复利用。就强制要求数据公开存储的期刊来说,种种迹象表明,在文章中包含数据可用性声明,并永久提供数据链接,对于保证方针的执行和数据的公开是一个有效的途径,甚至能增加论文的引用。

参考文献

http://www.nature.com/news/announcement-where-are-the-data-1.20541

http://www.nature.com/news/the-ups-and-downs-of-data-sharing-in-science-1.20124

http://www.apa.org/monitor/2015/10/share-reproducibility.aspx

http://www.nature.com/news/1-500-scientists-lift-the-lid-on-reproducibility-1.19970

Copyright © 2015  中国信息经济学会  www.cies.org.cn                  

ABUIABAEGAAgsPHPrgUo9KTLlQQwqwI4Uw
联系我们

  地址:北京市中国人民大学理工楼配楼四层  

   邮编:100872  

   电话:010-62511264

   邮件:info@ciesorg.com


网站导航