2020-11-24生物信息学上课笔记
2020-11-24 本文已影响0人
L6511
在序列层次,物种的界限就没有了
数据库搜索,特定序列预测
针对分子的序列的一门课程
高通量二代测序仪跑一个反应产生数据就可以包括很多物种的基因组测很多遍
序列里有编码基因,总体上看是序列,但其中可能包含几个基因信息
我们看到的序列,认识还很有限,是乱码到单词的跨度,当然除了编码基因还有非编码基因
生物信息学方法:序列比对,cluster等
序列的收集和储存
所以数据库就被引用了
EST,rna seq等的测序依赖了高通量
把数据存储在数据库,核苷酸蛋白质,三级结构等数据库
充分利用这些数据,了解来研究目前现状
原始序列是一级数据库,建立了功能数据库就是二级数据库
sanger方法:700—900bp
高通量方法:二代illium三代成熟也就这两年的时间,兼顾通量测序长度和精度
fasta格式
一个大于号下面是注释
国际公共数据库EMBL/GENBANK/DDBJ三个数据库合并每一天互相交换
我国BIDG