学习笔记:BiblioShiny使用介绍
本文基于公众号“玉树芝兰”《如何用R快速了解科研领域》撰写,感谢老师的分享。
BiblioShiny官方网址:https://bibliometrix.org/
BiblioShiny
官网说明:
Biblioshiny分为:
三个不同级别指标的分析和图表:
-来源
-作者
-文献
知识的三个结构(K结构):
-概念结构 :主题和趋势
-知识结构 :作者对该领域的影响力
-社会结构:作者、机构、国家如何彼此影响

简单来说,这款工具可以对某一科研领域的作者、期刊、文献计量分析,无需敲打代码,就可以对该科研领域有一个简单的认识。
接下来的篇幅,主要围绕BiblioShiny各个模块介绍,大家可以根据需求进行相应分析。
数据
数据从Web of Science下载,选择数据库“Web of Science核心合集”,检索式主题“information serendipit*”or 主题“information encounter*”,时间跨度“所有年份”。

对结果精炼,文献类型“ARTICLE”。

避免文献相关性过低,通过观察,选择前1000条。
导出格式选择“其他文件格式”,记录来源“1至500”,记录内容“全纪录与引用的参考文献”,文件格式“BibTex”。下一次导出,记录来源改变“501-1000”。将下载的文件保存为Archive.zip。


安装
通过官网安装R与Rstudio,安装后,在Rstudio中执行以下命令。

如果安装包过程中出现问题,有可能是镜像问题。
选择“Tools”中“Global Options”,Packages-CRAN Mirrors-China(Beijing)-enter键。

安装成功,会跳出如下页面。

数据加载与过滤(Data&Filter)
选择Data-Import or Load,Import raw file(s)-Web of Science(WoS/WoK)-BibTex,将下载的wos数据上传,可以选择将bibliometrix文件另存为excel/R Data Format格式。

过滤:可以根据文献类型、出版年份、被引次数、来源

数据集
Main Information(部分)

Annual Scientific Production:每年发文量
Average Citations per Year:每年平均引用次数
Three-Fields Plot:可以更改不同字段、调整数目,绘制可视化图,记得Apply!

Sources(来源)
Most Relevant Sources:与该主题相关的期刊
Most Local Cited Sources:高被引期刊(当前文献集)
Bradford’s law:根据布拉德福定律划分出核心区
Source Impact:期刊影响因子
Source Dynamics:期刊出现次数
Authors(作者)
Most Relevant Authors:最高产作者

其中,Fractionalized Frequency是作者对于论文的贡献率。

Author’s Production over Time:高产作者近期发文
Lotka’s law:洛特卡定律(核心作者)
Author Impact:作者影响因子
Most Relevant Affiliations:最高产机构
Corresponding Author’s Country:合著作者的国籍
其中MCP表示与其他国家作者合著论文的数量;SCP表示同国籍作者合著论文数量。
MCP_Ratio可以看出国际合作的比率高低。

Country Scientific Production:各个国家发文量
Most Cited Countries:高被引国家以及被引次数
Document(文献)
Most Global Cited Documents:在web of science中高被引文献
Most Local Cited Documents:在当前数据集中高被引文献

Most Local Cited References:在当前数据集中高被引的参考文献
Reference Spectroscopy:每年参考文献的数量
Most Frequent Words:高频词
根据需求,更改字段。
Keywords Plus:WoS增加的关键词是和原文章相关的关键词,但是作者本人没有添加,为了增加文章在相关专题下的命中率。

WordCloud:词云

TreeMap:树图

Word Dynamics:词出现次数,展示词变化趋势
Trend Topics:根据今年词出现频次推测热点话题

Conceptual Structure(概念结构)
Co-occurrence Network:共现网络
可以选择对应词,确定与其相关联的其他词

Thematic Map:主题地图
横轴:中心度;纵轴:密度
第一象限(右上角):motor themes,既重要又有良好发展;
第二象限(左上角):highly developed and isolated themes,已有良好发展,但是对于当前领域不重要;
第三象限(左下角):emerging or declining themes,边缘主题,也没有好的发展,可能刚刚涌现,也许即将消失;
第四象限(右下角):basic and transversal themes,对领域很重要,但是未获得良好发展。一般是指基础概念。

Thematic Evolution:主题演化

Factorial Analysis:析因分析
三种方法:
Correspondence Analysis:对应分析
Multiple Correspondence Analysis:多重对应分析
Multidimensional Scaling:多维标度法

word map(词汇地图)将研究领域划分为几个类别

最具贡献论文(Most Contributing Papers)
Contributing:汇总的信息中每篇论文的权重

在wos被引次数最高的文献(Most Cited Papers)

Intellectual Structure(知识结构)
Co-citation Network:同被引网络
Historiograph:了解数据集中重要性较高文献

Table列表中,LCS表示当前数据集中,文献被引次数,也就是文献在该领域的重要程度;GCS表示Web of Science 中,文献被引次数。

Social Structure(社会结构)
Collaboration Network:合作网络(作者、机构、国家)

Collaboration WorldMap

绘制图是第一步,解读图是至关重要,合理应用计量指标以及设置参数,才能快速了解某一科研领域。
以上对biblioshiny中的指标解读可能会存在不足,欢迎大家批评指正!