生信小白生物信息数据科学读书

5. 《Bioinformatics Data Skills》之

2021-05-24  本文已影响0人  DataScience

上文提到的提高科学研究鲁棒性建议已经可以很好地提高研究可重现性了,现针对可重现性进行一些建议的补充。

1. 共享数据与代码

这是最基本的要求,这样别人才能对你的工作进行重现。

2. 详细记录所有工作

类似于我们做实验的时候要记录实验笔记,电脑中进行数据分析也应该记录所有的细节。记录程度至少要比发表的论文更加详细。
可以使用一个纯文本文件记录所有步骤,包括:

  1. 数据的位置,来源,包含内容
  2. 软件的输入参数,版本与使用方式

3. 使用图表作为输出

整个研究由很多的结果组成,每个结果最好能够通过图或者表的方式呈现,也就是说使用图或者表作为脚本的输出。这样做可能会更加耗费时间,但是当我们重新生成结果的时候会很方便。

4. 使用代码作为实验记录

一个记录良好的代码其实足以展示复杂的工作流程,直接使用脚本记录流程要好过于输入命令行后再在别的地方记录。

上一篇下一篇

猜你喜欢

热点阅读