6. 《Bioinformatics Data Skills》之

2021-05-23 本文已影响0人 DataScience

清晰，整洁与统一的工程管理可以令我们事半功倍。今天介绍一下如何进行工程的组织与记录。

图片来源：https://www.ntaskmanager.com/blog/how-to-become-a-project-manager

工程目录结构

不同的生物信息学家的工程组织风格可能不同，这里作者给出自己的结构（以玉米SNP识别为例）：

mkdir zmays-snp
cd zmays-snp
mkdir data
mkdir data/seqs scripts analysis

注意：

有了清晰的结构后还需要清晰的记录方式，在几个月或者更久的时间后再看自己的工程依然能够清楚所有的细节，别人拿到你的工作后也可以在不询问你的情况下了解所有的内容。

# R 3.5.3版本
> set.seed(1999) 
> sample(LETTERS, 3) 
[1] "T" "N" "L"

# R 3.6.0版本
set.seed(1999)
sample(LETTERS, 3)
[1] "D" "Z" "R"

所以记录下软件版本号还是比较重要的，软件一般都可以通过命令行查阅版本号。如果没有版本号的话记录下软件发行时间与下载时间即可。

注意:

所有文件最好采用纯文本README的形式，简单方便可移植。
在工程的每个主文件夹下面都存放一个README文件，例如通过下面的代码生成README文件记录琐碎的数据信息。即使是简单介绍此目录里面是什么，怎么来的也可以。当你的工程变得庞杂起来，这些记录将变得很有帮助。

touch README data/README