背单词 | 批量统计英文文献PDF的词频

2023-08-07  本文已影响0人  生信石头

Emmm... 今晚想摸鱼。想起来下午看到某个提问,如主题。
这个功能其实很容易实现:

  1. 提取PDF中所有文本
  2. 统计文本中的词频

说干就干,反正简单。我顺手就打了一个 TBtools 插件


Paper PDF Word Frequency

可以直接在 TBtools 插件商店安装。



windows 和 macOS 操作相同。安装结束之后就可以打开界面。

  1. 把一堆文献的 PDF 放进去
  2. 设置必要的参数(或者其实你啥都不用管,默认参数已经够好了)
  3. 点击 Start

于是可以看到统计之后的词频,第一类是出现次数,第二列是单词。
注意到,其中有一个我自己简单内置的过滤单词,这些单词统计也没啥用,比如 the an a is was were
欢迎大伙补充内置过滤的单词表过来,我补充进去

写在最后

顺手谢谢,半个小时搞定。欢迎使用~如果真的有用,记得告诉我。

上一篇 下一篇

猜你喜欢

热点阅读