生信必备生物知识生物信息学学习Bioinformatics

生信怎能少的了你?

2018-12-03  本文已影响113人  刘小泽

刘小泽写于18.12.3 喜欢这种带着记录去学习的方法😋
说点杂七杂八~
好多做生信的牛人都是计算机高手,但这个领域不是IT,它需要知识的交叉,不是简单会编程跑代码就可以的【之前听师兄说过,他工作的公司有一个写代码很6的人,不知道PCR用的是单链还是双链】。在我看来,生信不仅仅是计算和统计,它还要讲好一个生物学故事~

因此,我打算回过头来,拾起那本搁置多年的生物化学,第一次不为考试而复习。别说,今天晚上花了一个半小时,真的认认真真看完一章。给我最大的感受不再是“谈生化色变”【还记得当前大学时代说的“生理生化,必有一挂”】,而是“书中的逻辑原来如此清晰!”“这些知识原来书里都有啊!”看来真的随着时间的推移,思维发生了转变,越来越想系统性地学习一套理论了
知识就是慢慢消化的过程🧐

真核基因结构

我们都知道基因组英文名是GENOME(名称来源是:GENe + chromosOME),它是一套完整单倍体遗传物质的总和

基因包括编码序列(外显子)和编码区前后对基因表达有调控作用的序列和单个编码序列的间隔序列(内含子

真核基因功能

编码区(coding region) + 非编码区 【为表达这些基因(即合成RNA)需要的启动子(promoter)、增强子(enhancer)等调控区(regulatory region)序列】

表达调控

调控区:转录区前后并紧接的序列(旁侧序列 flanking seq),又称为顺式作用元件(cis-acting element)包括:启动子、上游调控元件、增强子、加尾信号、细胞信号反应元件

关于基因组

独特结构

大量重复序列

多基因家族

假基因

与正常基因相似但不表达的DNA序列
特点是: 往往缺少正常基因的内含子,两侧有顺向重复序列

线粒体DNA

全长16569 bp,共编码37个基因,13个编码构成呼吸链多酶体系的一些多肽基因、22个编码mt-RNA基因、2个编码mt-rRNA基因(16S、12S)

几种生物的基因组

人体染色体大小

最长Chr1 250kb,3k多基因;最短Chr21 47kb,300-400 genes

一些与遗传病相关基因,如阿尔兹海默症、肌萎缩性侧索硬化症、唐氏综合征,在Chr21

另外,基因在染色体上并非均匀分布密度最大是 Chr19, 23 genes/kb,密度最小是 Chr13 和Chr Y, 5 genes/kb 【另外,即便在密度最大的Chr19, 也存在基因“沙漠区”:500kb区域中,没有任何基因】


欢迎关注我们的公众号~_~  
我们是两个农转生信的小硕,打造生信星球,想让它成为一个不拽术语、通俗易懂的生信知识平台。需要帮助或提出意见请后台留言或发送邮件到Bioplanet520@outlook.com

Welcome to our bioinfoplanet!
上一篇 下一篇

猜你喜欢

热点阅读