看老大RNA-seq视频-P5/P6:RNA-seq:4-软件安

2018-12-29  本文已影响24人  小梦游仙境

看老大RNA-seq视频

P5/P6:RNA-seq:软件安装-上/下

1.有源代码的下载源代码,一般的软件会提供多个平台

2.没有源代码的下载二进制版本

linux的软件中心---conda---类似360软件中心

$():把括号里的命令运行一下

安装完conda后,最重要的一步是添加清华源的镜像,提高下载速度,配置环境需要用到conda config。可用conda config --show查看已有的配置

查看已有环境

conda info --envs

建立一个python2环境,并且安装比对软件bwa

conda create -n biostar python=2 bwa

Create -n rna python=2 bwa

image-20181229110154604

点yes后会将添加到环境变量

image-20181229103047001

如果没添加到环境变量,单次install的时候就是miniconda3/bin/conda create -n biostar python=2 bwa

image-20181229103437140

如果添加到环境变量,就是conda create -n biostar python=2 bwa

用conda安装前可先conda search trimmomatic,看看这个软件是不是conda给他的名字

也可在下面这个网址搜索bioconda是否有这个包(看看大小写、下划线、中华线之类的)

http://bioconda.github.io/recipes.html

conda不是万能的

image-20181229114518490

删掉conda:rm -rf miniconda3/

cat ~/.barch
export PATH=/home/jmzeng/biosoft/myBIn/bin:$PATH#在变量里加入了👆
image-20181229115656043 image-20181229115534726 image-20181229120142675

P7:5-sratoolkit下载数据

一个RNA-seq实战-超级简单-2小时搞定

** http://www.bio-info-trainee.com/2218.html**

第一步:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177(在这里更改GSE号)

第二步: image-20181229161430724

第三步:

image-20181229161537206 第四步: image-20181229161639383
cat id |while read id ;do (prefetch $id &) ;done #写一个循环下载fa数据
image-20181229160853959 image-20181229160935680

批量杀任务

image-20181229164912868

生成SRA文件

image-20181229165239017

生成fq文件

image-20181229175915292

批量生产fq文件

ls /public/project/RNA/airway/sra/*sra |while read id;do ( nohup fastq-dump --gzip --split-3 -O ./ $id & );done

寻找gz结尾文件:
find ~/ -name "*gz"

一件我理解不了的了事

image-20181229190911195

可是我 find以后,咩有

而我find其他就有,证明find没用错呀,可能是没有下载下来

image-20181229191052471 image-20181229202232620

不知道为什么不能fastq-dump,链过来的也应该能用的啊,我删掉这个sra的路径再链一次,蓝色和红色什么区别呢?

image-20181229203110033 image-20181229212814230

我想起来了,红色是无效的链接,如果红色是tt从zy那链接 过来的,如果zy给移动或者删除了,那么就失效了,应该是这样的,那条tt和zy是一个从前下,一个从后下的,而我去zy里也找不到SRA文件了。

P8:6-qc

接下来要从fa转fq文件

ls -lh raw/|wc #看数据
less raw/nohup.out #有后台日志
grep failed raw/nohup.out
image-20181229180750515
zless SRR1039508_1.fastq.gz #查看

非常长,要用报告来看,如何做报告,如下:


P10:7-alignment-1

[图片上传失败...(image-d7e79b-1546091661334)]

从老大视频里扒来的链接,先收藏

https://blog.csdn.net/xubo245/article/details/50878760

https://blog.csdn.net/xubo245/article/details/50836185

vi tmp.sh

p12:RNA-seq:7-alignment-3

cat *|awk '{print $1}' |paste - - - - - - - - - - - - - -

linux文本处理3架马车

less -S 文本名 整行显示

Less -SN 文本名

grep RNA SraRunTable.txt |wc

head SRR_Acc_List.txt > id > cat id

mv SraRunTable.txt info改名为info

mv SRR_Acc_List.txt allid改名为allid

grep SRR5933809 info

可以直接grep SRR59338 id,输出来的结果为

SRR5933808

SRR5933809

SRR5933810

SRR5933811

上一篇下一篇

猜你喜欢

热点阅读