CiteSpace软件做的关键词共现分析为例,进行关键词共现图谱

2021-01-06  本文已影响0人  文献计量

本文以CiteSpace软件做的关键词共现分析为例,进行关键词共现图谱含义详细解析。

关键词是一篇论文的核心概括,对论文关键词进行分析可对文章主题窥探一二。

而一篇论文给出的几个关键词一定存在着某种关联,而这种关联可以用共现的频次来表示。一般认为,词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。

共词分析法利用文献集中词汇对或名词短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系。

统计一组文献的主题词两两之间在同一篇文献出现的频率,便可形成一个由这些词对关联所组成的共词网络。

如下图所示,此图由CiteSpace生成的关键词共现网络。

【手机点击放大看】

CiteSpace做的图谱并不是用的原共现矩阵,而是在原矩阵的基础上通过COSINE,PMI,DICE和JACCARD标准化后的矩阵,然后利用它们进行网络可视化,至于具体使用哪种标准化,这里就要发挥人的主观能动性啦,即反复比较,观看图谱找出最符合实际情况的标准化方法。

所以,本质上你在做图谱前已经对该领域有所了解了,否则你并不知道那个图更好!

那反过来说,既然你对该研究领域已经有了解了,为什么还要再做图谱呢?

个人认为你的图谱除了能发论文外,还可以利用可视化的方式让那些不了解本领域的人能够花费最少的时间精力入门本领域。

废话多了,看图吧!

首先,我们可以通过左上角的参数看到网络的节点说、边数和网络密度。

其中节点数就是图中的关键词个数,边数就是关键词之间的连线数。只要关键词在同一篇文献中出现过,两者之间就会有一条连线。【PS.当然与你设置的每个时间切片提取的关键词个数有关系。】

图中圆圈大小代表的是关键词频次,频次越大,圆圈越大。并不是中心性大小。

可以通过左侧的表格进行验证。

科学数据频次为34,中心性为0.27,

高校图书馆频次为28,中心性为0.28

科学数据的圆圈明显大于高校图书馆。

线条代表关键词之间的联系,线条颜色与图中上方年份相对应,用于标志每一年有哪些主要关键词。

左侧列表除了关键词频次和中心性外还有关键词初次出现年份,这个时间非常重要,它会在时区图和时间线图密切相关。时区图怎么理解已经详细讲过,看后文链接,其余图谱今后讲解。

从这个图中我们可以获取什么信息呢?

还是回到了共词分析的原理上:共词分析法利用文献集中词汇对或名词短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系。

我们目的是为了获得学科中各主题之间的关系,而主题使用关键词表示的,本质就是关键词之间的联系,所以又返回去了,我们本质就获得了关键词之间的联系。联系紧密的关键词会相对形成一个个小的团体,进而我们可以将这个小团体中的关键词进行归纳总结,总结出一个个主题,然后对主题进行详细论述。其实本质就是聚类分析啦!只是过程是人工的而已!

当然CiteSpace软件自身也具有聚类的功能,下节课再讲。

提醒一下:当你人工已经可以很容易的进行归纳后,就不需要再利用CiteSpace聚类功能啦。

该功能是在你看不清,看不懂共现图谱的时候用的。

上图为老版本做的图,下图为新版本做的图,喜欢哪个自己抉择。

拓展

共现分析的方法论基础是心理学的邻近联系法则和知识结构及映射原则。

心理学的邻近联系法则是指曾经在一起感受过的对象往往在想象中也联系在一起,以致于想起它们中的某一个的时候,其他的对象也会以曾经同时出现时的顺序想起。

我们常说的关键词共现、作者共现、机构共现、国家共现、论文共现、期刊共现都是共现分析的一种。

其中

作者共现又分为作者合作网络分析、作者共被引分析【作者同被引】

机构共现又分为机构合作网络分析

国家共现又分为国家合作网络分析

论文共现又分为文献共被引分析【文献同被引】、文献耦合

一句话,正如我们在课程中所讲的一样,上述所有的分析本质上就是共现分析,今后将慢慢道来。

上一篇下一篇

猜你喜欢

热点阅读