利用Bio.SeqIO读取序列文件
2020-06-06 本文已影响0人
天明豆豆
利用Bio.SeqIO读取序列文件
1. fasta文件
from Bio import SeqIO #导入SeqIO模块
record_dict = SeqIO.index("文件路径","fasta") #从路径读取fasta文件
for seq in record_dict: #循环读取fasta文件中的序列
print ("id",seq.id) #输出序列id ">"后面的一串字符,无空格
print ("description",seq.description) #输出 description ">"一行的内容
print ("seq",seq.seq) #输出序列
print ("length",len(seq)) #输出序列长度
2. genbank文件
from Bio import SeqIO #导入SeqIO模块
seq = SeqIO.read("文件路径","genbank") #从路径读取genbank文件
print ("id",seq.id) #输出序列登录号
print ("description",seq.description) #输出 序列描述
print ("seq",seq.seq) #输出序列
print ("length",len(seq)) #输出序列长度
print ("features",len(seq.features)) #序列特征数
print (seq.features[0]) #整个序列的注释