网络科学研究速递

Arxiv网络科学论文摘要10篇(2020-01-25)

2020-01-25  本文已影响0人  ComplexLY

未知社会网络的影响力最大化:有效图取样学习策略

原文标题: Influence maximization in unknown social networks: Learning Policies for Effective Graph Sampling

地址: http://arxiv.org/abs/1907.11625

作者: Harshavardhan Kamarthi, Priyesh Vijayan, Bryan Wilder, Balaraman Ravindran, Milind Tambe

摘要: 在现实世界的社会网络寻找有影响力的演员,当一个严重的挑战是缺乏对底层网络的知识结构。当前状态的最先进的方法依赖于手工制作采样算法;从这个网络发现这些方法样品节点和他们在精心构造的顺序邻居,并选择意见领袖最大化(未知)完整的网络影响力蔓延。在这项工作中,我们提出了网络发现一个强化学习框架,自动学习有用的节点和图表示,该网络的编码重要的结构特性。在训练时间,使得从该子图取样选择的网络的方法识别部的节点的完整的网络中可以有效地影响节点。这样转移的网络结构基于适应策略的实现归因于编码相关节点和图由签名适当的奖励方案驱动框架的精心设计。我们与真实世界的社会网络从四个不同领域的尝试,表明我们的RL剂学到的政策提供了对当前国家的最先进方法的10-36%的改善。

带互惠偏好邻居的关系主题聚类

原文标题: Relational Thematic Clustering with Mutually Preferred Neighbors

地址: http://arxiv.org/abs/2001.08412

作者: Tiantian He, Lu Bai, Yew-Soon Ong

摘要: 自动学习网络数据专题组一直是机器学习领域一个具有挑战性的任务。许多方法被提出来完成它,利用边,顶点的特征,或上述两种。然而,很少有人考虑如何二元倾斜w.r.t.的量化网络拓扑结构和顶点的特征可以影响顶点群集偏好,这阻止从网络数据揭示更可解释潜组以前的方法。为了填补这一空白,我们提出了一个新颖的概率模型,被称为关系专题聚类互惠首选邻居(RTCMPN)。从该预先确定的边结构和顶点的特征的学习意义,RTCMPN可以进一步了解潜偏好指示哪些相邻顶点是更可能的是相同的簇中,将二分倾斜描述如何相对重要性w.r.t.流行的方法不同边结构和顶点的特征可以影响成对顶点之间的关联。因此,簇结构植入的边结构,顶点的特征,邻近的偏好和顶点顶点的二分倾向可以通过RTCMPN而获知。我们还得到一个有效的最大期望算法的RTCMPN推断出最优模型参数。 RTCMPN一直与各种网络数据几个强势的基准进行比较。显著的结果验证RTCMPN的有效性。

Pushshift的Reddit数据集

原文标题: The Pushshift Reddit Dataset

地址: http://arxiv.org/abs/2001.08435

作者: Jason Baumgartner, Savvas Zannettou, Brian Keegan, Megan Squire, Jeremy Blackburn

摘要: 社交媒体数据,已成为科学认识的发展是至关重要的。然而,即使它已经变得无处不在,只是收集大型社交媒体数据涉及高度的工程技术优势和计算资源。事实上,研究往往是必须克服的分析才能继续数据的工程问题门倍。这导致识别数据集作为自己的和有意义的研究贡献。 reddit的,所谓的“互联网的头版,”特别是一直是许多科学研究的主题。虽然reddit的是相比于Facebook和Twitter等社交媒体平台的数据采集相对开放,以获取技术壁垒仍然存在。因此,reddit的数以百万计的subreddits,数以亿计的用户,以及数千亿的评论是在同一时间比较接近,但耗费时间来收集和系统分析。在本文中,我们提出了Pushshift reddit的数据集。 Pushshift是一个社交媒体数据的收集,分析和归档平台,自2015年收集的数据书签交易,并使其提供给研究人员。 Pushshift的reddit的数据集进行实时更新,包括历史数据返回到Reddit讨论社区的成立。除了每月的垃圾场,Pushshift提供的计算工具,搜索,聚合和数据集的整体上进行探索性分析,以帮助。该Pushshift reddit的数据集能够对社会化媒体的研究人员,以减少数据收集中度过的,清洗时间,和他们的项目的储存阶段。

联合推断真相/谣言及其社会网络源

原文标题: Joint Inference on Truth/Rumor and Their Sources in Social Networks

地址: http://arxiv.org/abs/2001.08472

作者: Shan Qu, Ziqi Zhao, Luoyi Fu, XInbing Wang, Jun Xu

摘要: 在信息爆炸的当今时代,我们经常会面临海量 EMPH真相(真实信息)和 EMPH传闻(假信息)的混合物涌了过来社会网络。在这种情况下,它推断每个权利要求(例如,新闻,消息)是否是一个真实或传言,并确定其 EMPH 来源,即,用户谁最初传播的那些权利要求是十分必要的。虽然大多数现有技术已经分别负责两个任务,本文旨在提供关于真理/谣言及其来源的联合推理。我们的观点是,一个共同的推论可以增强双方的相互表现。为此,我们提出了一种命名为SourceCR框架,两个模块之间的该交替,即 EMPH 信誉可靠性训练真理/传闻推理和 EMPH师查询为源检测,以迭代的方式。为了详细阐述,前模块执行借助期望最大化算法,这需要从后者模块作为初始输入输出的源可靠性的要求可信性和可靠性的用户的同时估计。同时,后者模块将所述网络划分成经由所述权利要求的可信度标记两个不同的子网,并且在通过应用理论预算保证通过从前者模块估计的可靠性选择的用户的查询每个子网络发射源检测。所提出的SourceCR可证明是收敛的,和算法可实现以合理的计算复杂度。我们凭经验证实在合成的和真实数据集所提出的框架,其中,所述关节推论导致了高达信誉增益的35 %的准确度和29 %源检测率增益与单独的同行相比的有效性。

ExEm:使用深度学习方法的支配集理论专家嵌入

原文标题: ExEm: Expert Embedding using dominating set theory with deep learning approaches

地址: http://arxiv.org/abs/2001.08503

作者: N. Nikzad-Khasmakhi, M. A. Balafar, M.Reza Feizi-Derakhshi, Cina Motamed

摘要: 协作网络是由谁相互配合完成一个特殊的目标专家社会网络。分析该网络的图产生这些专家和他们的学科领域的专长有意义的信息。为了进行分析,图表嵌入技术已经成为一个行之有效的手段。图嵌入的尝试来表示图中的节点作为低维向量。在本文中,我们提出了一个图嵌入方法,叫做ExEm,其使用支配集理论和深厚的学习方法。在所提出的方法中,控制集理论应用到协作网络和该网络的支配节点发现。在此之后,一组随机游动的创建,从主导节点(专家)开始。对于这些收缩随机游动的主要条件是另一主导节点的存在。使满足规定条件的散步之后,它们被存储作为在语料库中的序列。在下一步骤中,胼被馈送到SKIP-GRAM神经网络模型。 Word2vec,fastText和它们结合采用的是训练SKIP-gram模型的神经网络。最后,结果是专家们的低维向量,被称为专家的嵌入。专家的嵌入,可用于各种用途,包括准确地模拟专家的专业知识或计算专家的分数专家推荐系统。因此,我们还利用提取的专家嵌入矢量引入新的策略来计算专家的分数。 ExEm的效果是通过在多标签分类,链接的预测和推荐任务评估其性能验证。我们进行了共同的数据集广泛的实验。此外,在这项研究中,我们相关的合着者网络目前的数据由SCOPUS爬行广大作者型材构成。

将机理网络模型转化为概率模型的框架

原文标题: Framework for Converting Mechanistic Network Models to Probabilistic Models

地址: http://arxiv.org/abs/2001.08521

作者: Ravi Goyal, JP Onnela

摘要: 有两个突出的范式到网络的建模:在第一,被称为机理方法,一个指定的一组被用于生长或发展的网络随时间域特定的机械规则;在第二,被称为概率方法,一个描述了一种模型,指定观察给定网络的可能性。机械模型和可扩展性,在特定情况下,允许为他们的一些性能分析解决方案,而概率模型有可用的推理工具。机械模型吸引力,因为它们捕获的假设是负责网络一代科学的作业流程。我们引入了对机械网模型转换成概率网络模型的通用框架。拟议的框架能够识别基本的网络特性和机理网络模型的联合概率分布,这使得解决问题,比如两个机理模型是否产生与感兴趣的属性相同的分布,还是网络属性,如网络聚类,相比于参考模型高估或在生成的网络表示不足。拟议的框架旨在弥补一些目前机械和概率网络模型之间存在的差距。

集成基于主体的微观模拟框架检查面向移动性政策的影响

原文标题: Integrated Agent-based Microsimulation Framework for Examining Impacts of Mobility-oriented Policies

地址: http://arxiv.org/abs/2001.08535

作者: Muhammad Adnan, Fatma Outay, Shiraz Ahmed, Erika Brattich, Silvana di Sabatino, Davy Janssens

摘要: 交通需求管理措施/政策是非常重要的维持中个人出行行为的积极变化。集成的基于主体的微观平台为研究这种干预措施,以评估使用约指标要求,以及供应方面的影响了丰富的框架。本文提出一种方法,即个人的时间表,从基于活动的模型的轻型版本衍生,被送入MATSIM仿真框架。模拟对于两个欧洲城市哈瑟尔特即(比利时),博洛尼亚(意大利)进行。校准对基础方案总流量计数建模框架后,一些交通管理政策的影响(限制汽车进入,增加了总线频率)进行检查。结果表明,限制汽车访问是从网络减少交通也移车司机/乘客其他出行方式方面更有效。相对于在频率增加公交基础设施的提高造成骑自行车者对公共交通,这是政策的不希望的结果,如果目标是提高可持续发展和环境的转变。在未来的研究中,框架将得到加强,对空气质量的排放和大气扩散模型集成,以确定效果,这种干预的结果。

表征复杂网络中的循环结构

原文标题: Characterizing cycle structure in complex networks

地址: http://arxiv.org/abs/2001.08541

作者: Tianlong Fan, Linyuan Lü, Dinghua Shi, Tao Zhou

摘要: 周期的无处不在的存在是的网络复杂性重要始发之一,因为周期是导致在动力学连接和反馈效应的冗余路径的最简单的结构。因此在循环结构的深入分析可能会产生新的见解,度量模型和网络科学算法。通过测量到其上的节点参与其他节点的最小的周期的范围内,提出了一种索引,命名为周期比,量化各个节点的重要性。在真实的网络实验测试表明,周期比含有丰富的,除了众所周知的基准指数信息,即,由周期比节点的排名是由度,H指数及核数排名有很大的不同,而排名由三基准是非常相似对方。进一步的实验表明,周期比进行总体优于查明在保持网络连接性和促进网络同步关键节点的三个基准。

考虑线路依赖的输电线失效率的贝叶斯估计

原文标题: Bayesian estimates of transmission line outage rates that consider line dependencies

地址: http://arxiv.org/abs/2001.08681

作者: Kai Zhou, James R. Cruise, Chris J. Dent, Ian Dobson, Louis Wehenkel, Zhaoyu Wang, Amy L. Wilson

摘要: 输电线路停运率对电力系统可靠性分析的基础。线路停电并不多见,只出现约一年一次,所以停运的数据是有限的。我们提出了一个贝叶斯层次模型,充分利用线路的依赖,从有限的数据停运各个传输线的更好的估计停运率。贝叶斯估计有一个较低的标准偏差比将停运次数由年的数据的数量,特别是当故障的数量少只是估计停运率。贝叶斯模型产生更精确的单个线路停运率,以及这些利率的不确定性的估计。线路停运率更好的估计可以提高系统的风险评估,预测断电和维护计划。

研究机构的异构尺度率

原文标题: Heterogeneous Scaling of Research Institutions

地址: http://arxiv.org/abs/2001.08734

作者: Keith A. Burghardt, Zihao He, Allon G. Percus, Kristina Lerman

摘要: 研究机构提供了科学发现的基础设施,但他们在知识生产中的作用还不是很清楚。为了解决这个差距,我们分析从数以百万计的科学论文的研究人员及其机构的活动。我们的分析揭示了机构的发展统计规律,与合作,研究成果以及与机构规模的影响规模如何。我们发现,尺度都是异构的,与时间无关。显著,这个结果是通过横截面分析,其在一个时间点测量的复杂系统错过。为了帮助解释这些发现,我们创建了一个简单的统计模型,并表明它再现协作和机构发展的尺度模式,包括协调网络内的异构致密化。我们的工作提供了政策的见解,促进创新和方法的复杂系统的推断统计模式。

声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

上一篇下一篇

猜你喜欢

热点阅读