全基因组/外显子组测序分析RNASeq 数据分析Bioinformation

跟着NC做基因组数据分析

2022-12-08  本文已影响0人  小杜的生信筆記

本期内容为[跟着NC做基因组数据分析],这是你需要的教程,对你一定有帮助。

前言
今天花费找文章,看到一篇关于基因组,组装的文章,主要是里面的图吸引了我的关注。后面仔细一看,作者竟然提供了分析的代码流程,还是比较详细的。提供的代码,基本是可以满足大部分初学者的需求,作为初学者的你还不仔细看看呢??
原文



--
详细代码:



仅比对的流程就有6个,包括有参、无参比对

1-Genome analysis



Hista-samtools 流程

#!/bin/bash

genome=$1
index=${genome%.*}
rna_1_fq=`cat $2|grep 1P|sed ":a;N;s/\n/,/g;ta"` #1.fq path list
rna_2_fq=`cat $2|grep 2P|sed ":a;N;s/\n/,/g;ta"` #2.fq path list

#echo $index
hisat2-build -p 20 $genome $index

hisat2 -x $index \
           -1 $rna_1_fq\
           -2 $rna_2_fq\
           --threads 20 \
           --min-intronlen 20 \
           --max-intronlen 20000 \
           --dta \
           --score-min L,0.0,-0.4 \
           -S ${index}.sam


samtools sort -@ 20 \
                  -o ${index}.sorted.bam \
                      -O BAM \
                ${index}.sam

Trinty Denovo流程

#!/bin/bash

#conda activate trinity

export PATH="$PATH:/usr_storage/jcf/.conda/envs/trinity"

rna_1_fq="cat $1|sed ":a;N;s/\n/,/g;ta"" #1.fq path list 
rna_2_fq="cat $2|sed ":a;N;s/\n/,/g;ta"" #2.fq path list
bam="$3"  #sorted.bam from hisat
out=${bam%.*}


Trinity --left $rna_1_fq \
      --right $rna_2_fq \
    --seqType fq  \
    --max_memory 100G \
    --no_normalize_reads \
    --CPU 20 \
    --bflyCalculateCPU  \
    --output trinity_denovo_$out
    
Trinity --genome_guided_bam $bam  \
    --genome_guided_max_intron 10000 \
    --max_memory 100G \
    --no_normalize_reads \
    --CPU 20 \
    --bflyCalculateCPU\
    --output trinity_GG_$out

--

此外,还有Indel、SNP和SV的分析。

...........................
...........................
...........................



干活满满,就看你自己如何来学习。

--

获得代码,请回复正确的关键词!!



--

欢迎大家关注我的公众号!!

往期文章(总汇)


小杜的生信筆記 ,主要发表或收录生物信息学的教程,以及基于R的分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!
上一篇 下一篇

猜你喜欢

热点阅读