生物信息学从零开始学生物信息学与算法生物信息学习

使用linux系统lftp软件,下载EnsemblePlants

2019-08-01  本文已影响3人  BohanL

EnsemblePlants植物基因组数据库有直接的FTP服务器
本教程教你如何使用著名的lftp包下载这一大型数据库
第一步,安装lftp相关包

sudo apt-get install lftp    #安装lftp

第二步,运行lftp

sudo lftp    #运行lftp

第三步,设置本地目录

lcd /home/bohan/ensembleplantsgenome    #设置本地目录

第四步,登录服务器

lftp ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/    #通过匿名方式登录服务器

第五步,将服务器目录镜像下载至本地

mirror -c -e -n --parallel=20 ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ /home/bohan/ensembleplantsgenome     #同时使用20个线程同步下载相应目录至本地

运行成功后,可以通过jobs命令查看当前运行的下载任务

jobs -v    #查看目前进行任务

也可以直接按ctrl+c退出转入nohup模式继续

也可以在退出后当前终端linux控制台
使用jobs和bg命令将当前进程转入后台

jobs         #显示当前终端运行的任务
[1] mirror -c -e -n --parallel=20 ftp://ftp.ensemblgenomes.org/pub/plants/release-44/fasta/ /home/bohan/ensembleplantsgenome
bg %1        #将jobs命令显示出的1号任务转为后台

mirror 命令参数

-c, --continue         支持断点续传if possible
-e, --delete           如果远程目录下已经没有某个文件,而本地有,则删除这个文件。
     --delete-first     在下载新文件之前先删除旧的文件
-s, --allow-suid       保留远程目录中设定的用户及组权限
     --allow-chown      设置下载文件的所有者和所属组
     --ignore-time      屏蔽时间判定,这样mirror只通过大小来判断文件,同步速度可以加快。
-n, --only-newer       只下载新的文件,mirror的判定新文件是通过文件大小和修改时间来判定的(这时候-c不能使用)
-r, --no-recursion     不下载子目录中的文件,即没有递归的功能
-p, --no-perms         不设置下载后文件的访问权限
     --no-umask         don't apply umask to file modes #这个不知道怎么翻译
-R, --reverse          上传到FTP
-L, --dereference      download symbolic links as files #这个不知道怎么翻译
-N, --newer-than=SPEC  只下载某个特定时间以后更新过的文件
-P, --parallel[=N]     同时下载N个文件
-i RX, --include RX    下载时包含的文件名称,RX表示正则表达式
-x RX, --exclude RX    下载时不包含的文件名称,RX表示正则表达式
-v, --verbose[=N]      关于操作的详细输出。
     --log=FILE         将已经执行过的lftp命令写入文件
     --script=FILE      将lftp命令写入文件,但不执行
上一篇下一篇

猜你喜欢

热点阅读