RNA-Seq 分析流程

慢病毒过表达转录组实战

2021-06-26  本文已影响0人  佳名

常用的病毒载体有腺病毒、逆转录病毒和慢病毒。逆转录病毒载体只能感染分裂期细胞,而且容量有限,腺病毒一般不能整合到染色体上,只能进行瞬时感染。与其它逆转录病毒相比,慢病毒(LV)具有可以感染非分裂期细胞、容纳外源性基因片段大,可以长期表达等显著优点。
慢病毒(Lentivirus)载体是以HIV-1(人类免疫缺陷I型病毒)为基础发展起来的基因治疗载体。区别一般的逆转录病毒载体,它对分裂细胞和非分裂细胞均具有感染能力。慢病毒感染的显著特点是感染个体在出现典型的临床症状之前,大多经历长达数年的潜伏期,之后缓慢发病,因此这些病原体被称为慢病毒。慢病毒载体的研究发展得很快,研究的也非常深入。该载体可以将外源基因有效地整合到宿主染色体上,从而达到持久性表达。
慢病毒质粒


pLV-IRES-PuroR

构建索引文件

hisat2-build -p 2 addgene-plasmid-128652-sequence-320737.fa pLV_IRES_GFP

raw reads过滤

mkdir -p fastp
ls *.fastq.gz|while read id;
do
fastp -5 20 -3 20 -i $id -o ${id%%.*}.clean.fq.gz \
-h ./fastp/${id%%.*}.html -j ./fastp/${id%%.*}.json;
done

比对

ls *clean.fq.gz |while read id
do
hisat2 -t -q -p 2 \
-x /media/lzx/0000678400004823/Indexs/Hisat2/plasmids/pLV_IRES_GFP \
-U $id 2>${id%%.*}.hisat2.log \
| samtools sort -@ 2 -o ${id%%.*}_ht2p.bam
done
IGV查看

发现基因间都是分开的,也就是说有很多的gap

zcat SRR9625467.clean.fq.gz |grep TCCTCGCCCTTGCTCACCAT
grep TCCTCGCCCTTGCTCACCAT
zcat SRR9625467.clean.fq.gz |grep CTTGTACAGCTCGTCCATGC
grep CTTGTACAGCTCGTCCATGC
zcat SRR9625467.clean.fq.gz |grep GTGGGCTTGTACTCGGTCAT
grep GTGGGCTTGTACTCGGTCAT
zcat SRR9625467.clean.fq.gz |grep AGGCACCGGGCTTGCGGGTC
grep AGGCACCGGGCTTGCGGGTC

grep结果显示这些基因的编码序列之间并不是独立的。

提取未必对序列

ls *.bam |while read id
do
samtools fastq -@ 2 -f 4 $id >${id%%_*}.unmap.fq;
gzip ${id%%_*}.unmap.fa
done

Trinity组装

ls *unmap.fq.gz |while read id
do
Trinity --seqType fq --max_memory 11G --single $id --SS_lib_type R --CPU 4 --min_contig_length 1000 --output ${id%%_*}> ${id%%_*}.trinity.log 2> ${id%%_*}.trinity_err.log
done
再比对
上一篇下一篇

猜你喜欢

热点阅读