学习总结day1——LA
2020-03-20 本文已影响0人
黑森林深处的小星星
1. 自学生信搜索方式
2. linux的用法
2.1 Linux的基础语法
- 1 cd: 使用 cd 命令可以切换目录。
在 Linux 里面使用 . 表示当前目录,.. 表示上一级目录, - 表示上一次所在目录,~ 通常表示当前用户的 home 目录。使用 pwd 命令可以获取当前所在路径(绝对路径)。绝对路径,起点为根目录:/home/1/2/3; 相对路径,起点为当前目录,cd ~/home/1/2/3。 - 2 mkdir(make directories),-p可以一连串建立文档
mkdir -p father/son/grandson
touch 只能建一个文档 - 3 cp(copy)命令复制一个文件到指定目录。 -r 或者 -R 参数,株连九族的意思
cp a b意思是把a复制到b文件夹中,cp -r a/c/d b把a/c/d一连串复制到b文件中 - 4 rm(remove files or directories), -f 参数强制删除,-r 或 -R 参数:株连九族”的意思
- 5 mv(move or rename files)命令移动文件(剪切)。 mv file1 myfile 将文件“ file1 ”重命名为“ myfile , rename 命令可以批量重命名
- 6 cat,tac 和 nl 命令查看文件, cat 为正序显示,可以加上 -n 参数显示行号,tac 为倒序显示。
- 7 more passwd,使用 more 命令打开 passwd 文件,q 退出
- 8 tail /etc/passwd
tail -n 1 /etc/passwd:直接的只看一行, 加上 -n 参数,后面紧跟行数 - 9 file 命令查看文件的类型
- 10 vim practice_1.txt,打开存在或者不存在的文件,vim启动进入普通模式,普通模式中按i(插入)或a(附加)键都可以进入插入模式,处于插入模式或命令行模式时只需要按Esc进入普通模式。普通模式中按shift+:进入命令行模式。命令行模式中输入:wq!回车后保存并退出vim,输入:w 文件名可以将文档另存为其他文件名或存到其它路径下。
(现在只知道这些以后继续更新)
2.2 linux在RNA-seq中
1 将raw data进行下载,上传到linux服务器中
2 用Trimmomatic进行去接头
for i in `cat name`;do java -jar ~/softwares/Trimmomatic-0.39/trimmomatic-0.39.jar PE -threads 10 -phred33 ../raw_data/${i}/${i}_1.fq.gz ../raw_data/${i}/${i}_2.fq.gz -baseout ${i}.fq.gz ILLUMINACLIP:TruSeq3-PE-2.fa:2:30:6 TRAILING:28 SLIDINGWINDOW:4:28 MINLEN:50 >> trimlog 2>&1;done
- 可以利用for循环,
-
~/softwares/Trimmomatic-0.39/trimmomatic-0.39.jar
软件位置 -
PE
双端测序两个输入文件 -
-threads 10
线程,不用管,可以没有 -
-phred33
格式,不用管,v0.32版本后的软件自动会识别
-../raw_data/${i}/${i}_1.fq.gz
指的是一个方向的数据
-../raw_data/${i}/${i}_2.fq.gz
指的是另一个方向的数据 -
ILLUMINACLIP:TruSeq3-PE-2.fa:2:30:6 TRAILING:28 SLIDINGWINDOW:4:28 MINLEN:50
指的是 运行算法
--baseout
参数指定输出文件的 basename,软件会自动为四个输出文件命名。 -
-trimlog
参数指定了过滤日志文件名
3 fastqc去接头
fastqc input_R1_paired.fastq.gz
- -o,结果输出路径,必须建好不会自动生成
- -t,程序运行时的线程数,不要太高4差不多了
后期继续更新
3. R语言(主要用来进行数据的可视化)
暂时还不太清楚,以后更新
4. 总结
![](https://img.haomeiwen.com/i12617751/47eafaaa49257312.png)