记录odgi 用法

2024-05-30  本文已影响0人  球果假水晶蓝

odgi 把GFA文件按染色体拆分

odgi explode -i joint-clip.P.og -g --prefix=subgraph
$ ls subgraph*
subgraph.0.gfa  subgraph.1.gfa  subgraph.2.gfa  subgraph.3.gfa  subgraph.4.gfa

odgi 提取PGGB泛基因组子图

gfabase 提取MC泛基因组子图

gfabase sub GRCh38-f1g-90-mc-aug11.gfab GRCh38.chr1:25240000-25460000 --range --connected --view --cutpoints 1 --guess-ranges -o RH_locus.walk.gfa
odgi extract -i chr1.pan.smooth.og -o chr1.pan.RH_locus.og -b chr1.RH_locus.bed -E -P

坐标系转换

gfa 有路径信息和Node信息,有时候为了研究需要将路径信息和Node信息相互转换

从y路径到 Node,

odgi position -i k.og -p y,10,+ -v
# 查找 y 路径上第10个方向为+ 的碱基所在Node的位置
output
#source.path.pos  target.graph.pos
y,10,+            6,0,+

从y路径到 转x路径

odgi position -i k.og -p y,10,+ -r x
# 查找 y 路径上第10个方向为+ 的离x路径的位置
output
#source.path.pos  target.path.pos  dist.to.ref  strand.vs.ref
y,10,+            x,10,+           0            +

从Node到路径

odgi position -i k.og -g 6,2
# 查找 Node 6 偏移量为2在路径的位置
output
#target.graph.pos  target.path.pos  dist.to.path  strand.vs.ref
6,2,+              x,12,+           0             +
odgi position -i k.og -g 4 -r x
# 查找 Node 6 偏移量为2在路径x的位置

给gfa文件添加颜色

gffread -T Sr.gff3 -o Sr.gtf
利用grep 提取一个gene保存为Sr.gff3.adj,查看
$ cat Sr.gff3.adj
Sr_t1   GETA    transcript  5000    7561    .   +   .   SrXXXXXXX0
# 根据gff文件注释GFA
odgi position -i  merge.og   -E gene.gtf.adj.exon  > color.csv
odgi view -i  merge.og -g merge.gfa
导入到bandage 中
## odgi 不支持walk 信息,而且sort 会重新命名节点,很讨厌。
上一篇 下一篇

猜你喜欢

热点阅读