RNA 转录组学Transcriptomics1 生物信息学2 生物Biology

pair end mate pair de novo

2018-09-09  本文已影响3人  wangchuang2017

pair end

pair end是直接在DNA两端假设接头进行双向测序,插入片段长度较短
Paired-end方法是指在构建待测DNA文库时在“两端”的接头上都加上测序引物结合位点,在第一轮完成后,去除第一轮测序的模板链,用对读测序模块引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量

mate pair

mate pair测序的DNA文库是将很长的DNA进行环化,环化的接口处连接识别序列,然后打断,富集含有识别序列的DNA,再进行双向测序,那么双向测序的插入片段长度就会很长。
Mate-pair文库制备旨在生成一些短的DNA片段,这些片段包含基因组中较大跨度(2-10 kb)片段两端的序列,更具体地说:首先将基因组DNA随机打断到特定大小(2-10 kb范围可选);然后经末端修复,生物素标记和环化等实验步骤后,再把环化后的DNA分子打断成400-600 bp的片段并通过带有链亲和霉素的磁珠把那些带有生物素标记的片段捕获。这些捕获的片段再经末端修饰和加上特定接头后建成mate-pair文库,然后上机测序(图3)。
一种测序时的大片段Library构建方法。就是先环化,然后再从特定位置切开,再做双端测序。这样可以跨过一些难以拼接的区域,比如重复序列

de novo测序

在不依赖于参考基因组的情况下进行组装,从而绘制该物种的全基因组序列图谱。de novo 是拉丁语从头开始。

DNA mate-pair

(1)定义:首先将基因组DNA随机打断到特定大小(2-20kb);
然后经末端修复,生物素标记和环化等实验步骤后,再把环化后的DNA分子打断成400-600bp的片段并通过带有链亲和霉素的磁珠将带有生物素标记的片段捕获。
这些捕获的片段再经末端修饰和加上特定接头后建成大片段文库,不需要克隆到细菌中,直接在Illumina测序仪上进行测序。
通过大片段文库构建,从而获得基因组中较大跨度(2-20kb)片段两端的序列。
(2)用途:DNA Mate-pair文库制备的整个过程需要5天,这种从较大跨度两端所获得的序列对基因组de novo项目的组装和基因组结构变异发掘具有非常重要的作用。

Q&A

       HTML - http://www.novogene.com/index.php?m=content&c=index&a=lists&catid=46
       Powerpoint - http://wenku.baidu.com/link?url=JaMz6sFYcZCSMv4mRy7pO7WM2_GfoIT3TeRmp9vVgui52zUd_8hY2rzepXw5aLcrYbl_CEGGa7icrgYM9UYqCtkpHU3lYHMOb6duLMgXbNK

Phrap 算法

建立所有overlap的信息,然后组成一个layout重叠片段互相连接,然后对这个图找Hamilton路(有向带权图)。

Euler 算法

构造de brujin图,然后对这个图找Euler路,其中图的路径是

Shotgun

Shotgun得到reads片段,然后组合而成contigs,连起来称为supercontigs,最后得到结果。

基因组大小

查询植物基因组大小的网站:http://data.kew.org/cvalues/CvalServlet?querytype=2
查询动物基因组大小的网站:http://www.genomesize.com/search.php

作者:Waste_Land
链接:https://www.jianshu.com/p/2f10e3c94161
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

上一篇下一篇

猜你喜欢

热点阅读