Citespace4:重点来袭!主题和领域共现分析
作者:寒璃
图文编辑:西十二
往期回顾:
前面的推文主要介绍了Citespace在科研合作网络、文献共被引和耦合方面的运用,今天我们来介绍一下Citespace的重点,文献主题和领域共现分析。与操作有关的推文以及资料会在Citespace系列推文的番外篇中分享,敬请期待。
文献的主题和领域共现分析主要包括以下3个方面的内容:词频和共词分析、关键词共现网络、名词性术语共现网络,其中共词分析和关键词共现网络是用得最多的。下面我们具体来看各个部分的内容。
001 词频与共词分析
词频分析:
词频是指所分析的文档中词语出现的次数。在科学计量研究中,可以按照学科领域建立词频词典,从而对科学家的创造活动做出定量分析。词频分析法就是在文献信息中提取能够表达文献核心内容的关键词或主题词频次的高低分布,来研究该领域发展动向和研究热点的方法。
共词分析:
共词分析相比文献的共被引和耦合,得到的结果是非常直观的。即研究者可以通过共词分析的结果,对研究领域的主题进行分析。共词分析的基本原理是对一组词两两统计他们在同一组文献中出现的次数,通过这种共现次数来测度他们之间的亲疏关系。
Tips:Citespace分析共词的方法有两种:一种是直接分析作者的原始关键词和数据库的补充关键词,此时的Node Type(节点类型)需要选择Keyword;另一种是先从数据集的标题、作者关键词、系统补充关键词以及摘要中提取名词性术语,然后选择Node Type(节点类型)为Term,对名词术语进行共词分析。
这两者的区别在于,前者使用的是数据集中的原始的字段;而后者使用自然语言处理过程分析后提取的术语。通常,两者分析的结果应该是相差不大的。两者在分析时即使使用的参数都相同,得到的共词网络在结构上也会存在差异。
002 关键词共现网络
关键词共现:
关键词共现分析就是对数据集中作者提供的关键词分析(包含Web of Science的DE和ID两个知识单元)。以Web of Science数据为例,就是对DE字段进行的共现分析。在Citespace中对关键词进行分析,只要Nodes Type选择为Keyword即可。设置完相关参数之后,点击GO即可得到原始关键词的共词网络。
003 名词性术语共现网络
CiteSpace的名词性术语(Noun Phrase)的共词分析主要是从标题(T1)、关键词(DE)、辅助关键词(ID)以及摘要(AB)中提取。
第一步:在CiteSpace功能参数页面,点击Noun Phrase。此时会跳出Part-of-Speech Tagging Opinions,如果首次运行点击Create POS Tages,若是之前已经提取的名词性术语,会提示Use existing POS Tag和Refresh POS Tag(POS是词类的意思)。
第二步:接下来可以点选“Burst Terms”,并使用“Detect Burst”来提取突发词。点击“plian text”等待探测结束。本数据集探测结果为:Terms to be selected by burstness.Use ‘Detect Bursts’ to find bursty terms.0 burst terms detected.即没有探测到突发性主题。
第三步:点击⊙取消Burst Terms为О,Node type 选择Term点击“GO”运行,得到主题的共现网络。需要注意的是,在初始运行此功能时需要等待的计算时间比较长。最后,得到了大数据研究的主题共现网络。网络分析结果除了可能与参数设置有关外,最重要的是和该领域的成熟程度有关。通常一个新兴领域的研究开始比较分散,比如大数据就是如此。
下面我们以“国外教师权力研究热点与脉络演进——基于Citespace研究方法透视”一文为例,来具体看主题和领域分析是如何运用的。
关键词体现出文章所要表达的核心主题和主要内容,因此对关键词词频变化的分析可以了解教师权力的研究热点。当两个或两个以上的关键词,在同篇文献中出现时被称为关键词共现,而对其中介中心性分析则可揭示研究热点之间的突变或转化关系。通过CiteSpace分析相关文献得到图1,再按年份对出现的高频关键词进行统计,列出教师权力研究高频关键词列表(详见表一,中介中心性和频次都可以从后台看到,为了方便观看总结出表一)。从表一所列的各高频关键词的中介中心性可以看出,具有重要影响的节点出现年份为1996年、1999年、2003年和2010年(图一中圈出部分鼠标放上去会显示年份),而节点与节点之间的转化可以发现教师权力研究热点的演进历程。根据图一中关键词节点转化和表1中各年份高频词的中介中心性,可将1995-2014年教师权力研究分为四个阶段。
图一
表一
通过分析图一和表一可以得到以下结论:
第一阶段(1995-1999):主要探讨教师权力内涵,分析教师权力来源,关注师生关系与教师权力的关联。高频词主要有权力(power)、教师(teachers)和学生(students)等;其中权力(power)中心性值达到0.50,大大高于0.10,表明教师权力概念、地位和特征等是研究热点,学术影响力较高。塞西莉亚(Cecilia,T.)对教师权力地位进行了研究,卡罗尔(Carol,C.)对非洲教师的权力释放进行了分析。同时教师(teachers)和学生(students)的中介中心性值分别为0.20和0.12,也超过了0.10,表明1990年关于“教师、学生、权力”等问题研究同样具有较强影响力。科斯伦和恩尼斯(Cothran,D. & En-nis,C.)探讨了师生冲突与教师权力的关系。权力是教师工作中的重点要素,传统教师权力观念认为教师拥有权力是由于教师拥有比学生更为丰富的专业知识,学生要想获取知识,必须遵守学校规定及要求,尊重教师权力。此外,教师作为知识的拥有者,在教授和传递知识的过程中扮演着权威角色。可见,在传统教师权力观下,教师拥有对学生的绝对控制权。但随着经济社会的迅速发展,传统教师权力观开始转变,不再将教师看作是教师权力的惟一主体,而转向将教师权力视为师生双边权力关系,师生共同享有控制学习环境的权力。
第二阶段(2000-2003):重视教育教学过程中的教师权力问题。高频词主要有教育(education)、教室(classroom)和课程(curriculum)等,其中“教育”中介中心性值为0.18,“教室”和“课程”中介中心性值分别为0.12和0.08,表明这一阶段这三个高频词既是研究热点,又具有重要影响,研究焦点主要关注“教育、课堂、课程”等方面,探讨教育过程与课堂教学方面的教师权力问题。莫斯科维奇(Moscovici,H.)和海伦(Helen,H.)分别探究了课堂实践中的教师权力和教师在课程中的权力被边缘化问题。约翰和玛丽(John & Mary)基于课程实施角度,系统阐述了教师角色及其课程权力,认为教师在课程教学中不仅承担教会学生知识的责任,也应该拥有相应的权力,包括赋予教师课程权力,如参与课程变革权力、课程决策权力和课程开发、设计及实施的权力。
第三阶段(2004-2009):关注教师权力的诸多影响因素,如性别、信仰、文化、身份和种族等。高频词主要有性别(gender)、教学(instruction)、教学法(pedagogy)、改革(reform)、身份(identity)、文化(culture)、多样性(diversity)和信仰(briefs)等,研究内容趋向多样化,关注到教师权力行使的诸多影响因素,如性别、种族、身份、文化和信仰等。雷拉(Leila,H.)从穆斯林儿童视角分析了教师权力特征,费雷德曼(Friedman,I.)对教师身份与权力关系进行了探究。莱米斯(Rymes,B.)、弗朗西斯(Francis,B.)分析了性别与教师权力的关系。里德和芭芭拉(Read & Barbara)对51位教师进行课堂观察,发现性别对教师管理和控制学生的权力具有重要影响,还发现教师自身的教育文化观念,对师生权力关系具有不同影响。此外,伯格勒(Bogler,R.)、贝里和约翰逊(Berry,B. & Johnson,D.)探究了教师教学权力与教师赋权等问题。
第四阶段(2010-2014):研究热点转向教师权力的微观层面。教师权力由硬性控制向软性影响过渡,强调教师权力行使的同时,也关注学生反馈和学生自主权力,更为重视师生关系的和谐。高频关键词主要集中在福柯(Foucault)、影响(impact)、反馈(feedback)、伦理(ethics)、科学(science)和效度(validity)等。贝特尼(Betteney,M.)对文本与教师权力的关系作了相关探究。格拉曼(Graham,J.)分析了教师在课堂实践中的话语权力。乌伊托(Uitto,M.)从伦理公平角度论述了师生之间的权力关系。萝莉和凯瑟琳(Lori,A. & Kathryn,F.)探究了课堂中教师权力策略和学生自主反馈互动等问题。帕尔维兹和尼玛(Parviz,M. & Nima,S.)受福柯微观权力理论影响,认为教师权力与话语密切相关,教师在特定情景下如果无法使用适切的话语,即使拥有权力也会失去权力。此外,“科学”“效度”“多层面”等高频关键词的出现,表明教师权力研究侧重于应用定量方法进行实证研究。对教师权力阶段性热点词频次与中介中心性的分析,可更好地从整体上把握教师权力研究的演化路径:从探讨师生关系与教师权力的关系到注重探讨课堂教学方面的教师权力问题,再到探究教师权力的多元影响因素,最后落脚于教师权力的微观层面。
下面总结一下:
1. 在分析文献的研究主题和领域的时候,往往是词频和关键词共现一起分析,以突出研究热点以图一为例,我们可以从中解读出以下信息:
圈出的部分为重要的节点也就是转折点。可用鼠标右键点击显示年份或其他具体信息,转折点往往代表该研究领域的重要转折时段。
图中圈的大小代表关键词中心中介性的大小,图一中显示前三的分别为权力、教育、教师。
2. 通过图一和后台数据,后台可以看到词频和中心中介性等相关数据。进行排序整理绘制表格(如表一)
3. 结合图一和表一能够从成百上千的文献中找到精准文献,然后我们对精准文献进行分析,着重分析其内在与外在关系。
其实通过这一些列的推文可以得出Citespace只是一个可视化工具,能够把一些规律以可视化的方式呈现在我们面前,但是这个规律具体是什么还是需要通过精准阅读去挖掘。因此,不能过分依赖科研工具而忽略研究内容本身之间的联系。
至此,Citespace系列推文的正文篇到此结束,希望能使大家通过阅读对Citespace有所了解,后续番外篇我们会推出一些基本功能的操作,并附送相关资料大礼包。好了,Citespace的正文系列介绍到这里,希望大家通过阅读能够对Citespace有所了解。
如果这篇文章让你有所收获,请长按文末二维码关注本公号,我们会持续输出高质量的科研成长型干货推文的。如果你愿意把这篇文章分享给你的那些在学术成长道路上孜孜以求的科研小伙伴,我确信,他们会非常感激你。
还是那句话:学术成长之路,你不是一个人在奋战!至少以后不会了。
作者寒璃,资深游戏玩家,打游戏引发“腱鞘炎”。喜爱旅游、美食~~~~