网络科学研究速递

Arxiv网络科学论文摘要15篇(2020-08-31)

2020-08-31  本文已影响0人  ComplexLY

数据驱动的计算社会科学:综述

原文标题: Data-driven Computational Social Science: A Survey

地址: http://arxiv.org/abs/2008.12372

作者: Jun Zhang, Wei Wang, Feng Xia, Yu-Ru Lin, Hanghang Tong

摘要: 社会科学关注与个人,人际关系和整个社会有关的问题。社会科学中研究主题的复杂性使其成为经济学,政治学和社会学等多个学科的融合。几个世纪以来,科学家们进行了许多研究来理解社会机制。但是,由于传统研究方法的局限性,存在许多关键的社会问题需要探索。为了解决这些问题,由于计算技术的飞速发展和对社会科学的深入研究,计算社会科学应运而生。借助先进的研究技术,如今可以获取来自不同领域的各种数据,它们可以帮助我们以新的眼光看待社会问题。结果,利用各种数据揭示来自计算社会科学领域的问题已引起越来越多的关注。在本文中,就我们所知,我们首次进行了一项关于数据驱动的计算社会科学的调查,该调查主要侧重于审查涉及人类动力学的应用领域。从三个方面回顾了人类动力学的最新研究:个人,关系和集体。具体而言,总结了用于解决上述应用领域中的研究挑战的研究方法。此外,还讨论了有关新兴研究主题和研究方法的一些重要的公开挑战。

调查纽约市的出租车和Uber竞争:通过强化学习进行多主体建模

原文标题: Investigating Taxi and Uber competition in New York City: Multi-agent modeling by reinforcement-learning

地址: http://arxiv.org/abs/2008.12530

作者: Saeed Vasebi, Yeganeh M. Hayeri

摘要: 出租车行业已经受到过度监管。法规应该在受控的竞争环境中确保安全和公平。通过影响驾驶员和乘客的选择和行为,新兴的电子叫车服务(例如Uber和Lyft)在过去几年中已经改变了现有的竞争方式。这项研究调查了纽约市主流叫车服务(即黄色和绿色出租车)与电子叫车服务(即Uber)之间的现有竞争。根据市场细分,新兴需求和法规对他们的竞争进行了调查。数据可视化技术被用于寻找出行行为的现有模式和新模式。对于本研究,我们开发了一种多主体模型并应用了强化学习技术来模仿驾驶员行为。该模型已通过我们数据可视化结果中识别的模式进行了验证。然后,该模型用于评估多个新法规和竞争方案。我们的研究结果表明,电子出纳员在低旅行密度地区(例如居民区)中占主导地位,并且电子出纳员可以快速识别出差旅需求并做出响应。这导致叫车者的市场规模减小。此外,我们的结果证实了绿色出租车法规对现有竞争的间接影响。这项调查以及我们提出的方案可以帮助决策者和当局设计能够有效满足需求的政策,同时确保在冰雹和电子冰雹领域的健康竞争。关键词:出租车;优步,政策;电子称呼;多主体仿真;强化学习;

符号有向网络的解耦变分嵌入

原文标题: Decoupled Variational Embedding for Signed Directed Networks

地址: http://arxiv.org/abs/2008.12450

作者: Xu Chen, Jiangchao Yao, Maosen Li, Ya zhang, Yanfeng Wang

摘要: 在许多实际应用中,例如链接符号预测,节点分类和节点推荐,用于符号有向网络的节点表示学习已受到相当大的关注。挑战在于如何充分编码网络的复杂拓扑信息。最近的研究主要集中在保留指示节点的紧密关系的一阶网络拓扑上。但是,这些方法通常无法刻画指示节点的本地结构并充当网络拓扑的基本特征的高阶拓扑。另外,对于一阶拓扑,不存在的链接的附加值在很大程度上被忽略。在本文中,我们建议通过同时刻画有向有向网络中的一阶和高阶拓扑来学习更多有代表性的节点嵌入。特别是,我们从变分自动编码的角度重新定义了有向有向网络上的表示学习问题,并进一步开发了解耦变分嵌入(DVE)方法。 DVE利用特殊设计的自动编码器结构来刻画有向有向网络的一阶和高阶拓扑,从而学习更具代表性的节点嵌入。在三个广泛使用的现实世界数据集上进行了广泛的实验。链接标志预测和节点推荐任务的综合结果证明了DVE的有效性。还给出定性结果和分析,以更好地理解DVE。

追踪SARS-CoV-2流行病期间的再生数和锁定效应的时间过程:非参数估计

原文标题: Tracking the time course of reproduction number and lockdown's effect during SARS-CoV-2 epidemic: nonparametric estimation

地址: http://arxiv.org/abs/2008.12337

作者: Gianluigi Pillonetto, Mauro Bisiacco, Giorgio Palù, Claudio Cobelli

摘要: 锁定对SARS-CoV-2流行演变的影响的准确建模是关键问题,例如告知有关紧急情况管理的卫生保健决定。迄今为止,提出的隔室和空间模型使用接触率的参数描述,通常假设锁定具有时间不变性。在本文中,我们证明了这些假设可能导致对正在进行的大流行的错误评估。因此,我们开发了一类新的非参数隔室模型,该模型可以描述锁定的影响如何随时间变化。利用正则化理论,将住院数据映射到一个无限维空间中,从而获得一种功能,该功能还考虑了随着时间的流逝,社会疏远措施和人们对感染风险的日益增长的意识如何发展。这允许以前所未有的分辨率重建SARS-CoV-2再现数量的连续时间轮廓。当将其应用于在意大利受影响最严重的伦巴第大区收集的数据时,我们的模型说明了人们在限制期间的行为发生了怎样的变化及其对控制流行病的重要性。结果还表明,在封锁结束时,伦巴第大区约有12%的人受到感染,SARS-CoV-2影响了意大利的5%。然后,我们讨论锁定结束后的情况如何演变,显示出由于假期放宽,最后几周的繁殖数量正在危险地增加,尤其是在年轻人口和移民移民增加的情况下,到2020年8月1日达到大于1的值由于包括意大利在内的几个国家仍在流行,并且在夏季之后所有国家都可能遭受第二波流行,因此拟议的繁殖数量追踪方法对卫生保健机构防止再次发生SARS-CoV-2传播有很大帮助。或评估锁定限制对控制价差的影响。

主题、情感和影响分析:COVID19在社交媒体上的信息搜索

原文标题: Topic, Sentiment and Impact Analysis: COVID19 Information Seeking on Social Media

地址: http://arxiv.org/abs/2008.12435

作者: Md Abul Bashar, Richi Nayak, Thirunavukarasu Balasubramaniam

摘要: 当人们发现不寻常的事物时,他们会在社交媒体上进行讨论。他们通过文本表达留下自己的情感痕迹。对跨时空的社交媒体数据进行系统的收集,分析和解释,可以洞悉当地的疫情,心理健康和社会问题。如此及时的见解可有助于以适当而有效的响应来制定策略和资源。这项研究分析了与COVID19相关的澳大利亚范围的时空大推文数据集。该方法包括数量分析,动态主题建模,情感检测和语义品牌评分,以了解澳大利亚一段时间内在澳大利亚不同州和城市发生的COVID19大流行和公众讨论。将获得的见解与独立观察到的现象(例如政府报告的实例)进行比较。

用于经济犯罪的复杂性科学方法

原文标题: Complexity science approach to economic crime

地址: http://arxiv.org/abs/2008.12364

作者: János Kertész, Johannes Wachs

摘要: 在这篇评论中,我们讨论了复杂性科学和网络科学如何在识别和描述诸如欺诈和腐败之类的经济不良行为的隐秘痕迹方面特别有用。

错误推文检测:使用小数据集的CNN建模

原文标题: Misogynistic Tweet Detection: Modelling CNN with Small Datasets

地址: http://arxiv.org/abs/2008.12452

作者: Md Abul Bashar, Richi Nayak, Nicolas Suzor, Bridget Weir

摘要: 近年来,在社交媒体平台Twitter上针对女性的在线虐待已引起相当大的关注。一种有效地识别滥用女性行为的自动化方法可以增进我们对持续时间内滥用推文相关模式,驱动因素和响应有效性的理解。但是,用少量标记数据训练神经网络(NN)模型以检测错误的推文是困难的。部分原因是推文的复杂性(其中包含错误的内容),以及需要在NN模型中学习的大量参数。我们进行了一系列实验,以研究如何训练神经网络模型以有效检测错误的推文。特别是,我们已经定制和规范化了卷积神经网络(CNN)体系结构,并显示了在少量标记数据可用时,在特定于任务的域上预训练的单词向量可用于有效地训练CNN模型。与最新模型相比,以这种方式训练的CNN模型可提高准确性。

使用机器学习技术在基于区块链的社交媒体平台上发布机器人检测

原文标题: Posting Bot Detection on Blockchain-based Social Media Platform using Machine Learning Techniques

地址: http://arxiv.org/abs/2008.12471

作者: Taehyun Kim, Hyomin Shin, Hyung Ju Hwang, Seungwon Jeong

摘要: Steemit是一个基于区块链的社交媒体平台,如果作者的帖子被推荐,作者可以以称为STEEM和SBD(Steem区块链美元)的加密货币的形式获得作者奖励。有趣的是,策展人(或选民)也可以通过投票他人的帖子来获得奖励,这称为策展奖励。奖励与策展人的STEEM股份成正比。在整个过程中,Steemit希望用户能够以分散的方式自动发现“好的”内容,这就是所谓的脑力证明(PoB)。但是,有许多机器人程序被编程为自动发布并获得奖励,这会阻止真正的人类用户创建良好的内容。我们称这种类型的机器人为发布机器人。尽管有许多论文研究了Facebook和Twitter等传统的集中式社交媒体平台上的机器人,但我们是第一个研究基于区块链的社交媒体平台上的发布机器人的论文。与常规社交媒体平台上的漫游器检测相比,我们创建的功能具有一个优点,即可以在不限制发布次数或长度的情况下检测到发布的漫游器。我们可以通过对博客数据或回复之间的距离进行聚类来提取帖子的特征。这些功能是从“常用词与文章之间的聚类距离的最小平均聚类”(MAC-CDFA)中获得的,该方法在以前的任何社交媒体研究中都没有使用。基于丰富的功能,我们提高了分类任务的质量。与F1分数相比,我们创建的功能优于Facebook和Twitter上用于机器人检测的功能。

从优化参与度到衡量价值

原文标题: From Optimizing Engagement to Measuring Value

地址: http://arxiv.org/abs/2008.12623

作者: Smitha Milli, Luca Belli, Moritz Hardt

摘要: 如今,大多数推荐引擎都基于预测用户参与度,例如预测用户是否会点击某个项目。但是,在接合信号和值得优化的“价值”概念之间可能存在很大的差距。我们使用测量理论的框架来(a)使设计师面对一个关于设计师重视什么的规范性问题,(b)提供一种通用的潜在变量模型方法,该方法可用于对目标结构进行操作并对其进行直接优化,以及(c)指导设计人员评估和修订其操作性。我们在数百万用户的Twitter平台上实施了我们的方法。与评估测量有效性的既定方法相一致,我们对模型如何很好地刻画所需的“价值”概念进行了定性评估。

使用防火墙遏制COVID-19爆发

原文标题: Containing COVID-19 outbreaks using a Firewall

地址: http://arxiv.org/abs/2008.12636

作者: Ezequiel Alvarez, Leandro Da Rold, Federico Lamagna, Manuel Szewc

摘要: 事实证明,在传播之前,很难隔离和扑灭COVID-19爆发。其背后的一个重要原因可能是,由于发病前的传染时间,轻度病例和/或无症状携带者,导致停止有症状人员的流行病学障碍可能会失败。基于这些特殊的COVID-19功能,我们研究了一种在城市中控制爆发的方案,该方案包括在爆发与城市的其余部分之间添加一个额外的防火墙块。我们实现了带有随机噪声的耦合隔室模型,以模拟局部隔离的局部爆发,并针对有可能存在的不同模型参数,在有无防火墙的情况下分析其演变。我们探讨了如果流行病的演变将触发针对不同区域的流量变化和/或锁定的政策变化,如何实现进一步的改进。我们的结果表明,仅在疫情爆发与城市整体之间增加一个额外的障碍即可获得实质性的改善。

自组织映射辅助的深度自动编码高斯混合模型用于入侵检测

原文标题: Self-Organizing Map assisted Deep Autoencoding Gaussian Mixture Model for Intrusion Detection

地址: http://arxiv.org/abs/2008.12686

作者: Yang Chen, Nami Ashizawa, Seanglidet Yean, Chai Kiat Yeo, Naoto Yanai

摘要: 在信息时代,安全稳定的网络环境必不可少,因此入侵检测对于任何网络都是至关重要的。在本文中,我们提出了一种自组织地图辅助的深度自动编码高斯混合模型(SOMDAGMM),并补充了保存完好的输入空间拓扑,以实现更准确的网络入侵检测。深度自动编码高斯混合模型包括一个压缩网络和一个能够执行无监督联合训练的估计网络。但是,由自动编码器生成的代码在保留输入空间的拓扑方面无能为力,而这种拓扑植根于所采用的深层结构的瓶颈。已引入自组织图来构造SOMDAGMM以解决此问题。提出的SOM-DAGMM的优越性在两个数据集上进行了广泛的实验,从经验上证明了这一点。实验结果表明,SOM-DAGMM在所有测试中均优于最新的DAGMM,并且F1得分提高了15.58%,并且稳定性更高。

COVID-19锁定后墨西哥城的模块化重新激活

原文标题: Modular Reactivation of Mexico City After COVID-19 Lockdown

地址: http://arxiv.org/abs/2008.12688

作者: Guillermo de Anda-Jáuregui, Enrique Hernández-Lemus

摘要: 在COVID-19大流行期间,墨西哥城的流行曲线斜率非常不稳定。我们已经预测,如果超过一定阈值的一部分人口返回公共空间,那么流行曲线的负面趋势将会恢复。这样的预测是基于通过移动设备协同定位在墨西哥城的联系网络上建立的流行病学模型,对锁定后经济​​活动的恢复进行建模。我们考虑了墨西哥政府开放数据库中记录的活跃和已恢复病例的总数,评估了疫情动态。对场景进行了建模,其中通过扫描从5%到50%的值,将不同百分比的人口重新融入公共空间。通过使用来自Jornada Nacional de Sana Distancia(墨西哥的选择性锁定模型)的数据构建了空模型,其中移动性降低了75%,并且没有强制性的移动限制。我们发现,在超过5%的人口重新进入公共场所的情况下,流行曲线上的病例极有可能达到新的高峰。超过50%的人口同时返回,将释放出一个峰值,该峰值与没有缓解策略时所预测的峰值相似。通过评估流行趋势,登记的新病例数,住院的新病例数和新的死亡人数的趋势,我们认为在这种情况下,仅采用选择性措施进行复活可能不是最佳的方法。鉴于需要重新启动经济活动,我们建议考虑采取替代措施,以减少返回公共场所的人们之间的接触。我们评估说,通过“封装”重新激活的工作人员,可以在不损害流行曲线中所需趋势的情况下重新激活更大比例的人口。

CD-SEIZ:Twitter上信息级联预测的认知驱动SEIZ区间模型

原文标题: CD-SEIZ: Cognition-Driven SEIZ Compartmental Model for the Prediction of Information Cascades on Twitter

地址: http://arxiv.org/abs/2008.12723

作者: Ece Çiğdem Mutlu, Amirarsalan Rajabi, Ivan Garibay

摘要: 由于病毒信息传播的准确性,传播信息的社交媒体平台已在我们的生活中无处不在。由于它们在Internet上迅速传播,因此某些信息级联最终成为病毒。操纵或迷失了真实信息(虚假新闻)的不可控制的病毒传播可能非常有害,而真实新闻的传播是有利的,尤其是在紧急情况下。我们通过提出一种新的SEIZ(易感性/暴露性/感染性/怀疑论者)模型来解决信息级联预测的问题,该模型通过考虑用户的认知处理深度来胜过原始版本。我们将信息级联定义为社交媒体用户对原始内容的反应集,这至少需要最少的体力和认知努力;因此,我们考虑了转推/回复/引用(提及)活动,并在2018年4月1日至2019年4月30日的叙利亚白盔Twitter数据集上测试了我们的框架。在通过传统间隔模型预测级联模式时,所有活动分组,并考虑它们的总和;但是,隔间之间的转换率应根据活动类型而有所不同,因为它们对身体和认知努力的要求并不相同。基于此假设,我们设计了一个认知驱动的SEIZ(CD-SEIZ)模型来预测Twitter上的信息级联。我们在1000个Twitter级联上测试了SIS,SEIZ和CD-SEIZ模型,发现CD-SEIZ的拟合误差非常低,并且提供了统计上更准确的估计。

现实世界超图的演变:没有Oracle的模式和模型

原文标题: Evolution of Real-world Hypergraphs: Patterns and Models without Oracles

地址: http://arxiv.org/abs/2008.12729

作者: Yunbum Kook, Jihoon Ko, Kijung Shin

摘要: 我们可以在现实世界的超图中观察到什么样的宏观结构和动力学模式?除了明显的随机演化之外,个体上潜在的局部动力学又是什么,最终导致观察到的模式?图提供了表示实体之间成对交互的有效方式的图,但不能表示组交互(例如,三个或更多研究人员的协作等)。作为图的一般化,允许各种尺寸的边的超图在解决该限制方面证明是卓有成效的。然而,复杂性的增加使得难以理解与图一样透彻的超图。在这项工作中,我们仔细检查了来自六个域的实际超图的七个结构和动力学特性。为此,我们定义了新的度量,将常见图属性的概念扩展到超图,并通过与空模型和统计检验进行比较来评估观察到的模式的重要性。我们还提出了 textsc HyperFF,这是一种用于生成逼真的超图的随机模型。它的优点是三方面的:(a) underline Realistic:除了先前研究中建立的五种模式外,它还可以成功重现所有七个模式;(b) underline Self-contained:与先前提出的模型不同,它完全不依赖oracle(即无法解释的外部信息),并且仅通过两个标量对其进行参数化,并且(c) underline Emergent:它依赖于单个实体上的简单且可解释的机制,该机制不会轻易执行但令人惊讶地导致宏观特性。

交互式可视化技术在大型显示器上动态图的时间导航中的有效性

原文标题: The Effectiveness of Interactive Visualization Techniques for Time Navigation of Dynamic Graphs on Large Displays

地址: http://arxiv.org/abs/2008.12747

作者: Alexandra Lee, Daniel Archambault, Miguel A. Nacenta

摘要: 动态网络在视觉上进行分析可能具有挑战性,尤其是当它们跨越较大的时间范围时,新的节点和边会出现和消失。尽管直接提供可视化界面以同时(例如,通过较小的倍数)或交互地(例如,通过交互动画)提供表示网络的多个状态(即,多个时间片)的界面,但是这些界面可能不支持不相交的任务时间片需要进行比较。由于这些任务是理解网络动态方面的关键,因此了解哪种交互式可视化最能支持这些任务非常重要。我们介绍了一系列实验室实验的结果,这些实验比较了两种传统方法(小倍数和交互式动画),以及一种基于交互式时间切片的最新方法。这些任务是通过触摸屏在大型显示器上执行的。参与者使用所有技术完成了三个任务的24个试验。结果表明,交互式时间分片在比较远处的时间点时会带来好处,但在分析连续的时间间隔时会带来好处。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

上一篇下一篇

猜你喜欢

热点阅读