2023-02-09我终于认识到了生信多么好玩&刺激

2023-02-08  本文已影响0人  Athena404

短暂的成就感,是建立在别人19年甚至是18年16年写的教程上的。让我觉得真的落后很多很多。

知名教程写作的各位大佬救我狗命。

OK今天开始尝试能不能加一圈重复序列,如果可以的话再加一层共线性。争取这周把圈图画出来

昨天用下图处理得到了GC含量

https://yanzhongsino.github.io/2021/11/16/bioinfo_plot_Circos/

现在想看看怎么提取TE浓度。应该是和基因的操作差不多。

Sequences and Genomic Features 5 Recreating Sequences & Features_哔哩哔哩_bilibili 我忘了之前我自己搬运的这个课 真的很基础 很好懂。

因为取GC含量的时候用到了bedtools,所以想学一下,有好多tools,

比如:samtools的安装和使用 - 简书 (jianshu.com),samtools是一个用于操作sam和bam文件的工具合集。

比如:bedtools的使用 - 简书 (jianshu.com),bedtools可以用来比较、操作、注释bed和gff文件中的genomic features。

bedtools主要功能:bedtools intersect -wao -a a.gtf -b b.bed

基因组数据文件类型:

Genome Browser FAQ (ucsc.edu)

fasta:序列文件。

fastaq:带有测序质量的序列文件。

BED(Browser Extensible Data,字面意思是“(基因组)浏览器可延展数据”):bed文件格式解读-测序原理-数据格式-数据库-生信技能树 (biotrainee.com)。是一种基因组注释文件。

bam:bam文件是由比对软件将质控后的fq格式文件与参考基因组进行比对后的比对信息存储文件。Sam/Bam文件格式详解 - 简书 (jianshu.com)

gff:注释文件,有gff3,gff2类型,gff3用的多一些。

gtf:和gff文件格式相似,只差最后一行。gff和gtf转换可以用gffread,好像cufflinks也可以。

bed文件和gtf文件
上一篇下一篇

猜你喜欢

热点阅读