生物信息数据科学

根据PMID号批量下载文献

2022-04-15  本文已影响0人  DataScience
  1. 该方法基于Python3.7实现,需要安装以下包:
pip3 install requests requests3 beautifulsoup4 lxml
  1. 新建文件夹作为工作空间,下载工程(无git的话去官网手动下载工程):
git clone git@github.com:billgreenwald/Pubmed-Batch-Download.git
  1. 工作空间下建立PMF.tsv文件,每行为一个PMID:
27547345
22610656
23858657
24998529
27859194
26991916
26742956
28388874
  1. 工作空间下建立一个后缀为”.bat”的文件,包括以下内容(修改本地路径):

    python.exe 本地路径\Pubmed-Batch-Download\fetch_pdfs.py -pmf PMF.tsv
    pause
    
  2. 点击bat文件,开始下载文献,下载的PDF文件位于fetched_pdfs目录下。

上一篇 下一篇

猜你喜欢

热点阅读