linux

Win/Linux平台批量处理FASTA文件的工具

2020-03-03  本文已影响0人  Mr_我爱读文献

基因组测序技术的发展使得生物序列日益增多,从大量序列数据中挖掘有用的信息成为许多研究领域的重要手段,这就使得我们必须掌握一些序列处理的方法。其中,FASTA文件是基因组最为常见的文件格式之一。然而,庞大的基因组数据让FASTA文件的处理变得非常棘手,如多基因的串联合并、序列的提取或删除、序列ID检索与替换等。因此,开发FASTA文件批量处理软件工具在生物信息研究中显得尤其重要。近些年,经过生信工作者的不懈努力,许多FASTA文件批量处理工具应运而生。熟悉和掌握这些工具的使用,可为广大科研人员提供便捷。

FASTA文件处理工具主要分为两类:Windows系统的界面化版本以及Linux系统的命令行版本。界面化版本的优点就是操作方便,无需任何编程以及Linux系统管理能力,点点鼠标就可以完成分析。而命令行版本的优点则是可以大批量并行计算,缩短分析时间,缺点就是需要编程以及Linux系统管理基础。目前,界面化程序主要有TBtools以及FasParser;命令行版本主要包括seqmagickseqkitseqtkfasta_utilitiesFASTAX-toolkitfastascripts以及Reseqtools等。下面就简单地介绍几款软件,详细使用方法可自行Google。

FasParser

TBtools

命令行工具

Seqkit

01. Sequence and subsequence
02. Format conversion
03. Searching
04. Set operations
05. Edit
06. Ordering
上一篇下一篇

猜你喜欢

热点阅读