比较基因组基因组组装Linux与生物信息

分析 | 比较基因组 | 共线性分析

2022-07-21  本文已影响0人  shwzhao

网上已经有很多教程,自己尝试梳理。

共线性分析,你会想到什么?

  1. 基于蛋白编码基因
    1.1 MCScanX (updated MCscan)
    1.2 WGDI-icl (updated ColinearScan)
    1.3 TBtools
    1.4 JCVI (MCscan-(Python-version))、VGSC2 ......
  2. 基于基因组序列的结构变异检测
    2.1 MUMMER + SyRI
    2.2 Minimap2 + SyRI

比较基因组分析中,能不能把一些结果统一?

  1. OrthoFinder
    1.1 具有 blast 步骤,MCscanXWGDI 可以用;
    1.2 WGDI-icl结果可以被 MCscanX 代替。
  2. JCVI
    2.1 常规步骤:根据cdspep文件同源比对(BLAT?)、共线性分析(生成.simple文件)、可视化(依赖.simple文件);
    2.2 抛弃前两步,将 MCscanX 结果转化为.simple文件;
    2.3 circoslinks中间连线体现共线性,可以由.simple 文件转化。
  3. DupGen_finder
    依赖 blast 和 MCscanX 结果。
  4. 疑问:OrthoFinder 的不同物种间同源基因信息,如何跟 MCscanX_h 衔接?
  5. ......

很多软件我都没有探索过,甚至没有实践过,只是大概的想法,可能是错的。更多的分析应该能直接衔接、统一起来。
还是继续挖坑,以后慢慢实践。下面相当于【收藏夹】了,没必要看。

conda create -y -c bioconda -c conda-forge -n jcvi jcvi
conda activate jcvi
# conda deactivate

conda install -y -n jcvi -c bioconda bedtools emboss last

python3 -m jcvi.formats.gff bed spA.gff3 -o spA.bed
python3 -m jcvi.formats.gff bed spB.gff3 -o spB.bed
python3 -m jcvi.formats.bed uniq spA.bed
python3 -m jcvi.formats.bed uniq spB.bed

awk '{print $4}' spA.uniq.bed | seqkit grep -f - pep.fa > spA.pep
awk '{print $4}' spB.uniq.bed | seqkit grep -f - pep.fa > spB.pep
# python3 -m jcvi.formats.fasta format

mkdir pep
cd pep

ln -s ../spA.uniq.bed spA.bed
ln -s ../spB.uniq.bed spB.bed
ln -s spA.pep .
ln -s spA.pep .
# 比对,生成 `anchors` 文件
python3 -m jcvi.compara.catalog ortholog --dbtype prot --no_strip_names spA spB

# 共线性分析,生成 `.simple` 文件
python3 -m jcvi.compara.synteny screen --minspan=30 --simple spA.spB.anchors spA.spB.anchors.new
# python3 -m jcvi.compara.synteny depth --histogram spA.spB.anchors

# seqids
# chr1,chr2,chr3,chr4,chr5
# LG01,LG02,LG03,LG04,LG05,LG06,LG07

# layout
# # y, xstart, xend, rotation, color, label, va,  bed
#  .6,     .1,    .8,       0,      , spA, top, spA.bed
#  .4,     .1,    .8,       0,      , spB, top, spA.bed
# # edges
# e, 0, 1, spA.spB.anchors.simple

# 绘图
python3 -m jcvi.graphics.karyotype seqids layout
上一篇 下一篇

猜你喜欢

热点阅读