Arxiv网络科学论文摘要24篇(2019-06-12)
- 灭绝过渡时期种群中的利他主义;
- 基于网络的假新闻检测:模式驱动的方法;
- 图神经网络的拓扑攻击与防御:优化视角;
- 审视未受限制的社交媒体:分析极化对话的级联;
- 通过非回溯矩阵分析网络中易感-感染-易感流行病动态;
- 随机空间网络中最短路径的形状;
- 异构网络方法预测个人的心理健康;
- 借助社会网络分析促进学生的表现;
- 具有互动成员的群体中的决策动力学;
- WikiDataSets:来自WikiData的标准化子图;
- 用于链路预测的弹簧电气模型;
- 使用合成网络进行社区检测中的参数调整;
- EdMot:一种用于考虑模体的社区检测的边增强方法;
- 一种用于比较图嵌入的无监督框架;
- 潜在通道网络;
- 学龄前儿童互动网络中的对称核-内聚模块;
- 使用异构图卷积网络进行细粒度事件分类;
- 修正的重叠权重和聚类系数;
- 共享单车网络中的跨期社区检测;
- 对称性诱导群体共识;
- 基于LFSR公钥密码体制的新的动态可验证多密共享方案;
- 通过早期与顶尖科学家的职业合作,在学术界获得竞争优势;
- 控制贡献识别复杂网络中的顶级驱动节点;
- StRE:Wikipedia中的自注意编辑质量预测;
灭绝过渡时期种群中的利他主义
原文标题: Altruism in populations at the extinction transition
地址: http://arxiv.org/abs/1906.04202
作者: Konstantin Klemm, Nagi Khalil
摘要: 我们研究合作在空间扩展种群中作为生灭过程的演变。合作者利他行为的好处是通过降低其直接邻居的死亡率来实现的。合作的代价是合作者死亡率的增加与其邻居的数量成正比。对于任何高于1的效益成本比率,当基线死亡率 p 增加时,稳定的静止浓度的药剂通过四种方案:(i)仅缺陷,(ii)共存,(iii)仅合作,(iv)灭绝。我们研究了这些制度之间的转变。对于方格上的种群和对近似,获得定性相同的相图。因此,与最近邻居的空间相关性足以进行持续合作。
基于网络的假新闻检测:模式驱动的方法
原文标题: Network-based Fake News Detection: A Pattern-driven Approach
地址: http://arxiv.org/abs/1906.04210
作者: Xinyi Zhou, Reza Zafarani
摘要: 假新闻获得了巨大的动力,强烈推动了对假新闻研究的需求。因此提出了许多虚假新闻检测方法,其中大多数都严重依赖于新闻内容。然而,在分析社会网络上的新闻传播时发现的基于网络的线索是一种几乎未被全面探索或用于虚假新闻检测的信息。我们通过提出基于网络的模式驱动的假新闻检测方法来弥补这一差距。我们的目标是研究社会网络中虚假新闻的模式,这些模式涉及新闻传播,新闻传播者和传播者之间的关系。基于社会心理学理论提供了关于这种模式存在的经验证据和解释。然后,这些模式在各种网络级别(即,节点级别,自我级别,三元组级别,社区级别和整个网络)表示,以进一步用于检测虚假新闻。所提出的方法增强了假新闻特征工程的可解释性。对现实世界数据进行的实验表明,所提出的方法可以胜过现有技术。
图神经网络的拓扑攻击与防御:优化视角
原文标题: Topology Attack and Defense for Graph Neural Networks: An Optimization Perspective
地址: http://arxiv.org/abs/1906.04214
作者: Kaidi Xu, Hongge Chen, Sijia Liu, Pin-Yu Chen, Tsui-Wei Weng, Mingyi Hong, Xue Lin
摘要: 将深度神经网络应用于图数据的图神经网络(GNN)已经为半监督节点分类的任务取得了显著的性能。但是,只有少数工作解决了GNN的对抗性。在本文中,我们首先提出一种新的基于梯度的攻击方法,该方法有助于解决离散图数据的难度。与当前对GNN的对抗性攻击相比,结果表明,通过仅扰乱少量边扰动(包括添加和删除),我们的基于优化的攻击可导致分类性能的显著降低。此外,利用我们基于梯度的攻击,我们提出了第一个针对GNN的基于优化的对抗性训练。我们的方法对不同的基于梯度和贪婪的攻击方法产生更高的鲁棒性,而不牺牲原始图上的分类精度。
审视未受限制的社交媒体:分析极化对话的级联
原文标题: Examining Untempered Social Media: Analyzing Cascades of Polarized Conversations
地址: http://arxiv.org/abs/1906.04261
作者: Arunkumar Bagavathi, Pedram Bashiri, Shannon Reid, Matthew Phillips, Siddharth Krishnan
摘要: 在线社交媒体,定期作为级联对话的极化主题的平台。在线社会网络中存在的固有的社区结构(同质性)和像Gab这样的边出口的出现创造了在线“回声室”,放大了极化的影响,这加剧了有害的行为。最近,在2018年10月,当有人透露匹兹堡犹太教堂大屠杀背后的个人罗伯特鲍尔斯是这个社交媒体网站的活跃成员并用它来表达他的反犹太主义观点并讨论阴谋理论时,Gab成为头条新闻。因此,为了解决这种边出口的自动数据驱动分析的需要,该研究提出了发现Gab中普遍存在的主题以及它们如何在网络中级联的新方法。具体来说,使用大约3400万个帖子,370万个级联会话线程,接近30万用户;我们证明了Gab中基本上存在五种级联模式,而大多数“病毒式”模式以回声室模式开始并逐渐扩展到整个网络。此外,我们通过两个模型经验证明。易感染和低音,级联如何从五种模式中的一种发展到另一种模式,基于会话主题,准确率高达84%。
通过非回溯矩阵分析网络中易感-感染-易感流行病动态
原文标题: Analysis of the susceptible-infected-susceptible epidemic dynamics in networks via the non-backtracking matrix
地址: http://arxiv.org/abs/1906.04269
作者: Naoki Masuda, Masaki Ogura, Victor M. Preciado
摘要: 我们研究了具有任意结构的有限网络上的随机易感染感染易感流行病模型。我们提出了指数速率的新下界,在该指数速率下,感染节点的概率会随着时间的推移而衰减。该界限与矩阵的前导特征值直接相关,该特征值取决于网络的非回溯和入射矩阵。该矩阵的维数是N + M,其中N和M分别是节点和边的数量。我们证明了这个新的下界改进了对应于所谓的淬火平均场理论的现有界限。尽管从最近开发的二阶矩闭合技术获得的界限需要计算N ^ 2 x N ^ 2矩阵的前导特征值,但我们在数值模拟中说明新界限更严格,而计算更少稀疏网络昂贵。
随机空间网络中最短路径的形状
原文标题: The shape of shortest paths in random spatial networks
地址: http://arxiv.org/abs/1906.04314
作者: Alexander P. Kartun-Giles, Marc Barthelemy, Carl P. Dettmann
摘要: 在第一次通道渗流的经典模型中,对于由欧几里德距离 L 分隔的顶点对,测地线表现出与它们的平均长度 L 的偏差,即 L ^ chi ,而横向波动,称为徘徊,成长为 L ^ xi 。我们发现在各种空间网络模型中直接用欧几里德跨度加权边时,我们有两个不同的类,由不同的指数定义 xi = 3/5 和 chi = 1/5 ,或 xi = 7 / 10 和 chi = 2/5 ,仅取决于所使用的特定连接法的粗略细节。此外,旅行时间波动是高斯,而不是Tracy-Widom,这在第一段模型中很少见。第一类包含邻近图,如硬随机几何图和 k 最邻近的随机几何图,其中通过蒙特卡罗模拟我们发现 xi = 0.60 pm 0.01 和 chi = 0.20 pm 0.01 ,显示理论上最小的游荡。第二类包含基于排除区域的图,例如 beta -skeletons和Delaunay三角剖分,其特征为值 xi = 0.70 pm 0.01 和 chi = 0.40 pm 0.01 ,近似理论上最大游荡指数。我们还用数字表示所有这些模型都满足KPZ关系 chi = 2 xi -1 。这些结果揭示了欧几里德第一次通过过程,但也提出了关于比例定律和指数值的推导的一些理论问题,以及模型是否可以构造具有最大游荡或非高斯旅行波动,而嵌入太空。
异构网络方法预测个人的心理健康
原文标题: Heterogeneous network approach to predict individuals' mental health
地址: http://arxiv.org/abs/1906.04346
作者: Shikang Liu, Fatemeh Vahedian, David Hachen, Omar Lizardo, Christian Poellabauer, Aaron Striegel, Tijana Milenkovic
摘要: 抑郁和焦虑是影响全世界数百万人的重要公共卫生问题。为了识别易受抑郁和焦虑影响的个体,已经建立了通常利用来自一个来源的数据的预测模型。与这些传统模型不同,在本研究中,我们利用来自圣母大学NetHealth研究的丰富异构数据集,通过智能手机收集个人(学生参与者)的社交互动数据,通过可穿戴设备收集健康相关的行为数据(Fitbit),来自调查的特征数据。为了整合不同类型的信息,我们将NetHealth数据建模为异构信息网络(HIN)。然后,我们重新定义了以一种新颖的方式预测个体心理健康状况(抑郁或焦虑)的问题,将HIN应用于推荐系统(RS)的流行范例,该系统通常用于预测一个人的偏好。会给一件物品(例如电影或书籍)。在我们的例子中,项目是个人的不同心理健康状态。我们评估了三种最先进的RS方法。此外,我们将个体心理健康的预测建模为另一种问题类型 - 我们的HIN中的节点分类(NC),在逻辑回归下评估过程中的四个节点特征作为概念验证分类器。我们发现我们的RS和NC网络方法比使用传统非网络方式的相同NetHealth数据以及随机方法的逻辑回归模型产生更准确的预测。此外,我们发现RS优于NC。这是第一项以HIN方式整合智能手机,可穿戴传感器和调查数据的研究,并在HIN上使用RS或NC来预测个人的心理健康状况。
借助社会网络分析促进学生的表现
原文标题: Boosting Students' Performance With The Aid Of Social Network Analysis
地址: http://arxiv.org/abs/1906.04352
作者: R.U. Gobithaasan, Nurul Syaheera Din, Lingeswaran Ramachandra, Roslan Hasni
摘要: 开发了各种教学方法,以便在没有事先了解班级学生之间的互动的情况下成功地提供科目。社会网络分析可用于识别课堂中的个人,中级和小组互动度量。这个想法是通过基于他们的互动的讲师干预来确定提高学生表现的方法。案例研究涉及第三年批次,包括76名女性和24名男性学生。根据第5学期末获得的信息绘制了友谊网络,并根据两个指标即中心度量和Girvan Newman算法对其进行了调查。在第5学期结束时,成绩被添加为网络的属性。在该批次中发现了12个集群,并且在表演和表现不佳的学生之间发现了明显的模式。在第六学期开始时,学生可以选择在两组之间进行选择。第1组在没有任何讲师干预的情况下没有受到干扰,而第1组中的表演学生群被保留,但表现不佳的群体中的学生被分配到表演群中。然后要求学生在各自的小组中进行作业和测验。最终成绩表明第1组学生的表现要优越得多,并且有明确证据表明第5学期表现不佳的学生在第6学期的表现要好得多。这表明通过了解学生的互动并将教师纳入最小干预通过群组分配聚类创造社会传染效应,可以提高学生的表现。
具有互动成员的群体中的决策动力学
原文标题: Decision Dynamics in Groups with Interacting Members
地址: http://arxiv.org/abs/1906.04377
作者: Reginald J. Caginalp, Brent Doiron
摘要: 小组决策涉及个人成员的证据积累和成员与成员之间的直接互动。我们考虑一个由两个决策者组成的简化框架,每个决策者都有两个替代强制选择任务,早期决策成员的选择偏向于尚未选择的成员。我们将决策动力学建模为漂移 - 扩散过程,并对该组的相关Fokker-Planck方程进行分析。我们通过将一个成员的决策阈值设置为低于其邻居的值来表明协调组决策(两个成员做出相同决策)的概率最大化。该结果类似于速度 - 准确性权衡,其中降低决策阈值的惩罚是选择不准确,而益处是先前的决策具有更高的影响另一成员的概率。我们在数值上将这些结果扩展到大型群体决策,其中显示通过选择适当的参数,群体中的一个小而有声的成分可以对整个系统产生大量影响。
WikiDataSets:来自WikiData的标准化子图
原文标题: WikiDataSets : Standardized sub-graphs from WikiData
地址: http://arxiv.org/abs/1906.04536
作者: Armand Boschin
摘要: 在图处理和关系学习领域开发新思想和算法需要使用数据集,而WikiData是涉及超过五千万个实体的最大的开源知识图。它在许多情况下比需要的大,甚至太大而不易处理,但它仍然是相关事实和子图的金矿。使用此图表非常耗时且易于进行任务特定的调整,这会影响结果的可重复性。提供统一的框架来提取特定于主题的子图解决了这个问题,并允许研究人员评估常见数据集上的算法。本文介绍了WikiData的各种特定于主题的子图以及用于提取它们的通用Python代码。这些数据集可以帮助开发知识图处理和关系学习的新方法。
用于链路预测的弹簧电气模型
原文标题: Spring-Electrical Models For Link Prediction
地址: http://arxiv.org/abs/1906.04548
作者: Yana Kashinskaya, Egor Samosvat, Akmal Artikov
摘要: 我们提出了一种基于弹簧电学模型的链路预测算法。研究这些模型的想法来自弹簧电气模型已成功用于网络可视化的事实。良好的网络可视化通常意味着在网络拓扑方面类似的节点(例如,连接和/或属于一个群集)倾向于彼此接近地可视化。因此,我们假设所获得的网络布局中的节点之间的欧几里德距离与它们之间的链接的概率相关。我们针对几种流行的基线评估所提出的方法,并通过将其应用于无向,有向和二分网络来展示其灵活性。
使用合成网络进行社区检测中的参数调整
原文标题: Using synthetic networks for parameter tuning in community detection
地址: http://arxiv.org/abs/1906.04555
作者: Liudmila Prokhorenkova
摘要: 社区检测是网络分析中最重要和最具挑战性的问题之一。然而,现实世界的网络可能具有非常不同的结构特性和各种性质的社区。因此,很难(甚至不可能)开发出适用于所有数据集的算法。标准机器学习工具是考虑参数算法并基于手头的数据集选择其参数。但是,这种方法不适用于社区检测,因为通常没有标记数据可用于此类参数调整。在本文中,我们提出了一种简单有效的过程,允许调整任何给定社区检测算法的超参数,而无需任何标记数据。核心思想是生成一个合成网络,其属性类似于给定的真实世界,但具有已知社区。事实证明,在这种合成图上调整参数也可以改善给定真实世界网络的质量。为了说明所提算法的有效性,我们展示了对各种合成和真实世界数据集上的几种众所周知的参数社区检测算法的显著改进。
EdMot:一种用于考虑模体的社区检测的边增强方法
原文标题: EdMot: An Edge Enhancement Approach for Motif-aware Community Detection
地址: http://arxiv.org/abs/1906.04560
作者: Pei-Zhen Li, Ling Huang, Chang-Dong Wang, Jian-Huang Lai
摘要: 网络社区检测是网络分析的热门研究课题。尽管已经提出了许多用于社区检测的方法,但是它们中的大多数仅考虑在单个节点和边的级别处的网络的低阶结构。因此,它们无法捕获小密集子图模式(例如模体)水平的高阶特征。最近,已经开发了一些高阶方法,但它们通常关注基于图元的超图,假设它是连通图。但是,在某些现实世界的网络中无法保证这种假设。特别是,超图可能变得支离破碎。也就是说,尽管原始网络是连接图,但它可能包含大量连接组件和隔离节点。因此,现有的高阶方法将受到上述碎片问题的严重影响,因为在这些方法中,即使它们属于同一社区,超图中没有连接的节点也不能组合在一起。为了解决上述碎片问题,我们提出了一种用于Motif感知社区检测的边增强方法(EdMot)。主要思想如下。首先,构造基于图元的超图,并将超图中的前K个最大连通分量划分为模块。然后,通过构造边集来从每个模块导出集团来增强每个模块内的连接结构。基于新的边集,增强了输入网络的原始连接结构以生成重新连接的网络,从而利用基于主题的高阶结构并且很好地解决了超图分段问题。最后,重连的网络被分区以获得更高阶的社区结构。
一种用于比较图嵌入的无监督框架
原文标题: An Unsupervised Framework for Comparing Graph Embeddings
地址: http://arxiv.org/abs/1906.04562
作者: Bogumil Kaminski, Pawel Pralat, Francois Theberge
摘要: 图嵌入是将图的顶点转换为向量集。良好的嵌入应捕获图拓扑,顶点到顶点关系以及有关图,子图和顶点的其他相关信息。如果实现了这些目标,它们就是有意义的,可理解的和压缩的网络表示。它们还为数据科学家提供了更多选项和工具,因为图表上的机器学习仍然非常有限。最后,向量操作比图上的可比操作更简单,更快速。主要的挑战是需要确保嵌入很好地描述图的属性。特别是,必须对嵌入维度做出决定,这会极大地影响嵌入的质量。因此,选择最佳嵌入是一项具有挑战性的任务,并且通常需要领域专家。在本文中,我们提出了一个“分歧得分”,可以分配给各种嵌入以区分好的嵌入和坏的嵌入。该通用框架为无监督图嵌入比较提供了工具。为了实现这一目标,我们需要概括众所周知的中鲁模型,以融入对其自身权利感兴趣的几何。为了测试我们的框架,我们使用合成网络以及真实网络和各种嵌入算法进行了大量实验。
潜在通道网络
原文标题: Latent Channel Networks
地址: http://arxiv.org/abs/1906.04563
作者: Clifford Anderson-Bergman
摘要: 潜在欧几里德嵌入通过表示欧几里德空间中的每个节点来模拟给定网络,其中两个节点共享边的概率是节点之间的距离的函数。这意味着对于两个节点以高概率共享边,它们必须在所有维度上相对接近。该约束对于描述现代网络可能过于严格,其中在至少一个区域中具有相似性可能足以具有高边概率。我们引入了一种新模型,我们称之为潜在渠道网络,它允许网络的这些功能。我们提出了一种用于拟合模型的EM算法,其计算复杂度在边数和通道数上是线性的,并将算法应用于合成和经典网络数据集。
学龄前儿童互动网络中的对称核-内聚模块
原文标题: Symmetric core-cohesive blockmodel in preschool children's interaction networks
地址: http://arxiv.org/abs/1906.04566
作者: Marjan Cugmas, Dawn DeLay, Aleš Žiberna, Anuška Ferligoj
摘要: 研究人员已经广泛研究了促进学龄前儿童观察到的网络形成的社会机制。然而,就块模型而言,全球网络结构的关注较少。块模型是一种网络,其中节点是来自所研究的网络的等效单元组(根据到其他的链路)。 Cugmas等人。 (2019)表明,相互性,流行性,协同性和不同类型的传递机制可以将全局网络结构引导到所提出的不对称核心 - 内聚块模型。然而,他们没有提供任何证据证明这种全球网络结构实际上出现在任何经验数据中。在本文中,提出了核心 - 内聚块模型类型的对称版本。该块模型类型由三组或更多组单元组成。每组中的单元在内部彼此链接良好,而来自不同组的单元彼此不相关。这适用于所有组,除了其中单元具有到网络中所有其他单元的相互链接的组。在这项研究中,显示所提出的块模型类型出现在学龄前儿童中收集的经验交互网络中。蒙特卡罗模拟证实,最常研究的社会网络机制可以将全局网络结构引导到所提出的对称块模型类型。本研究未考虑单位的属性。
使用异构图卷积网络进行细粒度事件分类
原文标题: Fine-grained Event Categorization with Heterogeneous Graph Convolutional Networks
地址: http://arxiv.org/abs/1906.04580
作者: Hao Peng, Jianxin Li, Qiran Gong, Yangqiu Song, Yuanxing Ning, Kunfeng Lai, Philip S. Yu
摘要: 事件在现实世界中实时发生,可以是涉及多个人和物体的计划和组织场合。社交媒体平台发布了大量包含具有全面主题的公共事件的文本消息。然而,由于文本中的异构事件元素以及明确和隐含的社会网络结构,挖掘社交事件具有挑战性。在本文中,我们设计了一个事件元模式来表征社会事件的语义相关性,并构建一个基于事件的异构信息网络(HIN),整合来自外部知识库的信息,并提出一种新的双向流行图卷积网络(基于PP-GCN的细粒度社交事件分类模型。我们提出了一个知识渊博的元路径基于实例的事件之间的社会事件相似性(KIES),并建立一个加权的相邻矩阵作为PP-GCN模型的输入。对真实数据收集进行综合实验以比较各种社交事件检测和聚类任务。实验结果表明,我们提出的框架优于其他替代社会事件分类技术。
修正的重叠权重和聚类系数
原文标题: Corrected overlap weight and clustering coefficient
地址: http://arxiv.org/abs/1906.04581
作者: Vladimir Batagelj
摘要: 我们讨论两个众所周知的网络测量:边的重叠权重和节点的聚类系数。对于它们两者而言,事实证明它们对于识别给定网络的重要元素(节点或链接)的数据分析任务不是非常有用。其原因在于,它们在相对较小尺寸的最大子图上获得其最大值,这些子图更可能出现在网络中而不是较大尺寸的子图上。我们展示了如何以这样一种方式纠正这些措施的定义,从而得出预期的结果。我们通过使用Pajek程序在美国机场网络上应用它们来说明建议的纠正措施。
共享单车网络中的跨期社区检测
原文标题: Intertemporal Community Detection in Bikeshare Networks
地址: http://arxiv.org/abs/1906.04582
作者: Mark He, Joseph Glasser, Shankar Bhamidi, Nikhil Kaza
摘要: 我们调查了2016 - 2018年芝加哥 textit Divvy bikeshare系统中使用模式的变化。我们设计了一种社区检测方法,该方法可以找到跨时间连通性增加,减少或稳定的节点群集。我们使用迭代测试方法,通过趋势测试和新颖的时间错误发现率校正来增强。结果显示,随着时间的推移相对自行车份额的使用增长和下降的集群中的严峻地理模式可能会阐明潜在的经济或人口趋势。
对称性诱导群体共识
原文标题: Symmetry Induced Group Consensus
地址: http://arxiv.org/abs/1906.04605
作者: Isaac Klickstein, Louis Pecora, Francesco Sorrentino
摘要: 虽然有许多现实世界的复杂网络可能不希望达成完全共识,但已经有大量研究共识问题的工作,其中存在单一的共同最终状态。最近,已经开发了群组共识的概念,其中节点子集被选择以达到与其他节点不同的共同最终状态,但是这些方法倾向于独立于底层网络拓扑。这里,实现了一种替代类型的组共识,其中对称的节点实现了共同的最终状态。动态行为在非对称的节点之间可以是不同的。我们展示了如何通过利用网络拓扑的简单耦合协议实现异构线性代理的群体共识。我们看到在稳定和不稳定的轨迹上可以达成小组共识。我们观察并描述了孤立的群体共识现象,其中一个或多个群集可以实现群体共识,而其他群集则不会。
基于LFSR公钥密码体制的新的动态可验证多密共享方案
原文标题: New dynamic and verifiable multi-secret sharing schemes based on LFSR public key cryptosystem
地址: http://arxiv.org/abs/1906.04611
作者: Jing Yang, Fang-Wei Fu
摘要: 可验证的多秘密共享(VMSS)方案使得经销商能够共享多个秘密,并且可以检测到参与者和经销商的欺骗。在分析了Mashhadi和Dehkordi在2015年提出的VMSS方案的安全性之后,我们说明他们无法发现经销商的一些欺骗行为。通过使用非齐次线性递归和LFSR公钥密码系统,我们引入了两种新的VMSS方案。我们的方案不仅可以克服上述缺点,而且在相同的安全级别上具有更短的私钥/公钥长度。此外,我们的计划具有活力。
通过早期与顶尖科学家的职业合作,在学术界获得竞争优势
原文标题: Achieving competitive advantage in academia through early career coauthorship with top scientists
地址: http://arxiv.org/abs/1906.04619
作者: Weihua Li, Tomaso Aste, Fabio Caccioli, Giacomo Livan
摘要: 我们量化了与已有顶级科学家的合作关系对四个不同科学学科的初级研究人员的职业生涯的长期影响。通过匹配对分析,我们发现,与其他顶级科学家合作的初级研究人员在其职业生涯的其他职业中享有持久的竞争优势。这种竞争优势体现为与被引用率最高的科学家重复共同创作工作的概率更高,并且最终成为一个更高概率。值得注意的是,我们发现与顶级科学家的合作关系对与不那么有声望的机构有关的初级研究人员的职业生涯产生了最强烈的影响。因此,我们认为这些机构可能拥有大量尚未开发的潜力,这可以通过改善对顶尖科学家的访问来实现。
控制贡献识别复杂网络中的顶级驱动节点
原文标题: Control contribution identifies top driver nodes in complex networks
地址: http://arxiv.org/abs/1906.04663
作者: Yan Zhang, Antonios Garas, Frank Schweitzer
摘要: 我们提出了一种新的措施来量化节点 i 对控制有向网络的影响。这个称为“控制贡献” mathcal C _ i 的度量结合了节点 i 出现在一组驱动程序节点中的概率以及其他节点由 i 控制的概率。为了计算 mathcal C _ i ,我们提出了一种基于最小驱动程序集的随机样本的优化方法。使用真实世界和合成网络,我们发现了非常广泛的 C_ i 分布。根据 C_ i 值对节点进行排名,使我们能够识别控制大部分网络的顶级驱动程序节点。我们表明,该排名优于基于控制能力或控制范围的排名。我们发现控制贡献确实包含无法追溯到节点的程度,控制能力或控制范围的新信息。
StRE:Wikipedia中的自注意编辑质量预测
原文标题: StRE: Self Attentive Edit Quality Prediction in Wikipedia
地址: http://arxiv.org/abs/1906.04678
作者: Soumya Sarkar, Bhanu Prakash Reddy, Sandipan Sikdar, Animesh Mukherjee
摘要: 考虑到每分钟为其多个项目添加或删除的大量内容,维基百科很容易被证明是一个庞然大物。这在自然语言处理领域创造了巨大的范围,以开发用于内容审核和审查的自动化工具。在本文中,我们提出了自我注意修正编码器(StRE),它利用词汇单元的正交相似性来预测新编辑的质量。与主要使用页面声誉,编辑器活动或基于规则的启发式等功能的现有命题相比,我们利用编辑的文本内容,我们认为这些内容包含其质量的优秀签名。更具体地说,我们部署深度编码器以从其文本内容生成编辑的表示,然后我们利用它来推断质量。我们进一步提供了一个新的数据集,其中包含32K维基百科页面的21M修订版,并证明StRE的表现优于现有方法,至少为17%,最多为103%。我们的预训练模型在重新训练后只需20%的wikipage编辑就能达到这样的效果。据我们所知,这也是首次尝试将深度语言模型应用于维基百科中自动化内容审核和审阅的巨大领域。
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.me (提供RSS订阅)进行同步更新。