欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

用脚本批量下载论文pdf

程序员文章站 2022-05-26 15:31:26
...

参考

  • bibcure 工具链齐全,号称更新修正bibtext,下载管理pdf,但目前并不好用。
  • scidownl 实用工具,基于doi下载pdf
  • mendeley 文献管理工具,可以导入bib文件,再进行更新修正,从而得到doi。
  • jabref bib文件管理工具,可以检查每条bibtex的完整性,如缺少页码信息等。
  • kbibtex bib文件管理工具,稳定性好,标签与搜索功能强大

步骤

  • 将论文的bib文件导入到mendeley,进行更新修正
  • 通过scidownl 批量下载相应pdf文件
import re
import os
bibfile='mendeley.bib'
downloader='scidownl'
target_dir='pdf'

r=re.compile('doi = \{(.*)\}')
with open(bibfile,'r') as f:
    bibtext=f.readlines()
    for l in bibtext:
        result=r.search(l)
        if result:
            cmd=downloader+' -D '+result.group(1)+' -o '+target_dir
            print(cmd)
            os.system(cmd)