0528

2022-05-27  本文已影响0人  坤坤呆又呆

将测序基因组对比到参考基因组:

RPKM>1:表达基因

WGCNA:基因聚类后与目的基因做相关性分析 ,找到核心基因。

qPCR实验验证:表达验证差异存在。

功能验证:敲掉基因,进行探寻

分子机制研究:寻找甲基化差异  :甲基化水平高抑制基因表达

转录组分析:

准备数据:测序数据  .fq/参考基因组/数据信息表

conda install sra-tools#下载

prefetch 序列号#下载文件

awk '{print "prefetch "$1"" } >run.prefetch.sh#在序列号前加入prefetch

cat run.prefrtch.sh#串行下载

awk '{print "prefetch "$1" &" } >run.prefetch.sh#转为并行下载"&"加载之后台

#下载文件是.sra文件

转换文件格式:

fastq-dump --split-3 序列名#转为fq文件

#数据信息表

.gff文件转换:gffread -T -o  gene.gtf A.gene.gff

mapping:测序数据的比对:

软件:hiseq

1、构建参考基因组

hisat2-build ../ref/genome.fasta ../ref/genome 1>hisat2-build.log 2>&1

2、比对:

hisat2 --new-summary -p 10 -x ../ref/genome -1 wenjian -2 wenjian -S shuchuwenjianlujing.sam --rna-strandness R >BLO_S1_L01.log 2>&1

#双末端测序 单末端测序-RF  

3、压缩和排序

samtools sort -o 文件.bam A.sam

4、bam index :

bam  index .bam

上一篇 下一篇

猜你喜欢

热点阅读