单细胞

基因组学(课程笔记)-- 泛基因组

2022-09-22  本文已影响0人  iBioinformatics

转自:https://www.jianshu.com/p/686d6c12b991

泛基因组(Pangenome):指的是某一物种全部基因的集合 (A Pangenome refers to a collection of genomic sequences in the entire species or population rather than in a single individual)

Core genome: containing genes present in all strains
Accessory genome: containing "dispensable" genes present in a subset of the strains
Strain-specific genes: present in only one strain

以大肠杆菌泛基因组为例简单说明一下:

image

作者是选择了26个不同的大肠杆菌,发现在所有的大肠杆菌里共有的基因是2000多个,特有的也大概是2000多个。在右边的图里,可以发现随着菌株的数量增加,core gene的数量是逐渐递减,到最后是达到一个平衡,大概是2000多个。同时随着菌株数量的增加,Pan genome是逐渐增大的。

Core gene 一般是一些比较重要的基因,例如管家基因(house keeping gene)、以及维持一些代谢的一些功能基因。Pan genome所包含的内容就比较多,大部分都是横向基因转移而来,里边会导致核苷酸和密码子的使用频率等往往都不一样。

Core vs Dispensable genome

核心基因组:

***** 高度保守,在同一种细菌所有菌株中都存在

*** **保持生命体基本功能,代表物种的基本表型特征

非必须基因组:

***** 在细菌整个进化史上,为适应环境条件而不断发生水平转移与基因缺失

***** 使不同菌株间在表型、生活方式、代谢等方面发生明显的分化,最终表现为丰富的遗传多样性

Pangenomes arise due to gene gain by genomes from other species trough horizontal gene transfer and differential gene loss among genomes.

水平基因转移(Horizontal Gene Transfer , HGT): 遗传物质传递给非其子代

HGT is an important factor in the evolution of many organisms and a widely recognized mechanism for adaptation.

Vertical evolution : 在同物种里发生基因转移

**Horzontal evolution : **传递给非子代,例如从一个细菌传递到另一个细菌,或者是从病毒里到另外一个细菌里,还有一些是从环境里获得的。

完美基因组:refer to has no pseudogenes, introns, transposons,extrachromosomal elements,or inteins.

Pangenome : Open or Close

Open pangenome : Size increases indefinitely with every added individual and cannot be mathematically predicted

***** species with sympatric lifestyles tend to have open pangenomes

***** large accessory genome

***** small core genome

***** Diverse community interactions

***** Large population size

**Closed pangenome : **Contains a finite amount of genes/ sequence and the total pangenome size can be predicted

***** Allopatric bacterial species tend to have closed pangenomes

***** small accessory genome

***** large core genome

***** Limited community interactions

***** Small population size

Core genes VS strain - specific genes

                               --- 在大肠杆菌中

Core genes

功能方面:注释到的大多数都是ribosomal protein (核糖体蛋白),是一类非常重要的蛋白,在生命体的基本功能方面发挥了重要的作用

GC含量:GC含量是最高的,其中密码子第一位的GC含量中Core gene也是最高的,在密码子第二位的GC含量这种特征不是很明显(这个可以理解为因为密码子的第二位往往受到了非常强的自然选择,因此这个位置上的任何一个变化都会导致氨基酸的变化),在密码子第三位中的趋势和第一位的趋势是一样的,因此在实际当中Core gene的GC含量是比较高的一个状态

基因长度:因为Core gene的功能比较保守,在基因组里存在的时间也是比较长,所以它应该是算一个比较古老的基因,古老的基因拥有的序列可能就比较多一些

Strain - specific genes

功能方面:注释到的几乎都是hypothetical protein (没有实质的功能注释,都是预测出来的),因为很多菌株特异的基因都是和环境密切相关的

GC含量:与Core gene是一个相反的趋势

基因长度:相对于core gene来说应该是算一个比较年轻的基因,因此它实际的基因序列长度要比较短一些

Translational selection in pangenome

**Core gene : **受到最强的translation selection

**Strain - specific genes : **受到最弱的translation selection

Mutation & Selection

**Selection in connection with expression level indicated by CAI dominates core genes **(CAI的方法是用的高表达量的数据作为reference,所以假如用CAI来做corelation的话,和它的相关性越高,就代表着表达的这种趋势就越强,结果显示取绝对值后core gene的的系数是最高的) -- Selection很大程度上是作用在core gene里

**Mutation reflected by GC3 dominates strain - specific genes **(考察了在密码子第三位上的GC的变化,可以想象密码子第三位的GC的变化相比第二位和第一位是最自由的,因为第三位的变化在大多数的情况下是补不影响编码的,因此用GC3来表征mutation的作用,发现strain - specific genes的系数是最高的)--Mutation 很大程度上是作用在strain - specific gene里

Evolutionary rates : synonymous (Ks, 同义替换) & nonsynonymous (Ka, 非同义替换)

image

结果显示,core gene的非同义替换率是最低的,符合预期情况,因为实际情况中core gene是非常重要的,它基本上不能也不允许随意发生核苷酸的变化,因此它的同义替换率相比来说是非常低的。而strain-specific gene 恰好是一个相反的趋势

Core gene VS essential gene

Essential genes are those genes of an organism that are thought to be critical for its survival. Essential genes encode proteins to maintain a central metabolism, replicate DNA, translate genes into proteins, maintain a basic cellular structure, and mediate transport processes into and out of the cell.

上一篇下一篇

猜你喜欢

热点阅读