Arxiv网络科学论文摘要11篇(2020-08-07)
- 复杂网络中的临界现象:从无标度网络到随机网络;
- COVID-19对公共交通可达性和乘车人的影响;
- 网络比较和集合内图距离;
- 使用英语Twitter和中文微博研究跨文化的礼貌;
- COVID-19流行曲线的简约描述和跨国分析;
- 允许波动和量子化的流行SIS模型的几何与解;
- 单纯复形中的社区结构:印度中部野生动物走廊设计的应用-印度东高止山脉景观;
- 通过时间通知的高斯混合模型进行无监督的网络欺凌检测;
- 社交媒体预警欧洲COVID-19爆发?;
- 基于在线社交媒体中的活动行为影响传播来推荐可影响目标;
- 在Reddit中发现和分类语言偏向;
复杂网络中的临界现象:从无标度网络到随机网络
原文标题: Critical Phenomena in Complex Networks: from Scale-free to Random Networks
地址: http://arxiv.org/abs/2008.02319
作者: Alexander I. Nesterov, Pablo Héctor Mata Villafuerte
摘要: 在常规的统计物理学框架内,我们研究了一类网络模型中的关键现象,这些网络模型的隐变量控制着节点对之间的链接。我们找到了平均节点度,期望的边数以及Landau和Helmholtz自由能随温度和节点数的函数的解析表达式。我们显示网络的温度是控制从未连接图到功率度(无标度)图和随机图的过渡的参数。随着温度的升高,度数分布从功率度(对于较低的温度)变为类似泊松的分布(对于高温)。我们还表明,稀疏网络中的相变会导致网络拓扑结构发生根本性的结构变化。在临界温度以下,该图完全断开。在临界温度以上,图将连接起来,并出现一个巨大的分量。
COVID-19对公共交通可达性和乘车人的影响
原文标题: Impact of COVID-19 on Public Transit Accessibility and Ridership
地址: http://arxiv.org/abs/2008.02413
作者: Michael Wilbur, Afiya Ayman, Anna Ouyang, Vincent Poon, Riyan Kabir, Abhiram Vadali, Philip Pugliese, Daniel Freudberg, Aron Laszka, Abhishek Dubey
摘要: 公共交通对于建设公平社区至关重要。同时,新型冠状病毒疾病COVID-19和相关的社会限制已从根本上改变了城市地区的乘车行为。 COVID-19大流行中最令人担忧的方面可能是,低收入和历史上处于边地位的群体不仅最容易受到经济变化的影响,而且也最依赖公共交通。随着收入的减少,公交机构的任务是在日益敌对的经济环境中提供充足的公共交通服务。因此,运输机构有两个主要问题。首先,COVID-19对乘车率有何影响?COVID后的新常态是什么?第二,乘客数量在时空和社会经济群体之间如何变化?在这项工作中,我们对COVID-19对公共交通运营的影响进行了数据驱动的分析,并确定了乘车率变化的时间变化。然后,我们将乘客量下降的空间分布与当地经济数据结合起来,以确定社会经济群体之间的差异。我们发现,在田纳西州的纳什维尔和查塔努加,固定巴士的乘车人数比2019年的基准下降了66.9%和65.1%,然后分别稳定在下降了48.4%和42.8%。降幅最大的是早上和晚上的通勤时间。此外,纳什维尔最高收入地区和最低收入地区之间的出行率下降存在显著差异(分别为77%和58%)。
网络比较和集合内图距离
原文标题: Network comparison and the within-ensemble graph distance
地址: http://arxiv.org/abs/2008.02415
作者: Harrison Hartle, Brennan Klein, Stefan McCabe, Alexander Daniels, Guillaume St-Onge, Charles Murphy, Laurent Hébert-Dufresne
摘要: 量化网络之间的差异是网络科学中一个具有挑战性且始终存在的问题。近年来,已针对该问题引入了多种多样的临时解决方案。在这里,我们提出随机网络(例如Erd H o sR 'e nyi图,随机几何图,Watts-Strogatz图,配置模型和优先连接网络)的简单且易于理解的集合是网络比较方法的自然基准。此外,我们表明,从生成模型中独立采样的两个网络之间的预期距离是一个有用的属性,它封装了该模型的许多关键特征。为了说明我们的结果,我们使用20个通常用于比较图的距离度量来计算经典网络模型(及其几个参数化)的集合内图距离和相关量。集合内图距离为图距离的开发人员提供了一个新的框架,以更好地了解他们的创作,并为从业人员更好地为他们的特定任务选择合适的工具。
使用英语Twitter和中文微博研究跨文化的礼貌
原文标题: Studying Politeness across Cultures Using English Twitter and Mandarin Weibo
地址: http://arxiv.org/abs/2008.02449
作者: Mingyang Li, Louis Hickman, Louis Tay, Lyle Ungar, Sharath Chandra Guntuku
摘要: 对跨文化礼貌进行建模有助于发现适当和礼貌的内容,从而有助于改善跨文化交流。我们研究了美国英语和普通话中与礼貌相关的语言特征。首先,我们对来自美国的5300条Twitter帖子和来自中国的5300条新浪微博帖子进行注释,以表示礼貌分数。接下来,我们开发英语和汉语礼貌功能集“ PoliteLex”。将其与经过验证的心理语言词典相结合,然后研究跨文化的语言特征与感知的礼貌之间的相关性。我们发现,在普通话微博上,与面向英语的Twitter相比,以面向未来的对话,与群体的归属感和感恩感更礼貌。与死亡相关的禁忌话题,代词的缺乏或选择不当以及非正式语言与普通中文微博的不礼貌程度相比,比英语Twitter高。最后,我们建立了基于语言的机器学习模型来预测礼貌,普通话微博的F1评分为0.886,英语Twitter的F1评分为0.774。
COVID-19流行曲线的简约描述和跨国分析
原文标题: A parsimonious description and cross-country analysis of COVID-19 epidemic curve
地址: http://arxiv.org/abs/2008.02475
作者: Kristoffer Rypdal, Martin Rypdal
摘要: 在给定的国家/地区,COVID-19流行病第一波的累积死亡人数呈S型曲线随时间变化。在大多数情况下,曲线由Gompertz函数很好地描述,该函数的特征在于两个基本参数,即初始增长率和衰减率,因为第一流行病消退了。这些参数取决于社会经济因素和制止该流行病的对策。 Gompertz模型暗示总死亡人数成倍地取决于这些比率之间的比率,因此非常敏感。在此框架内对瑞典,挪威和其他许多国家的第一波流行病的明显不同的流行曲线进行了分类和讨论,并讨论了它们对规划缓解策略的有用性。
允许波动和量子化的流行SIS模型的几何与解
原文标题: Geometry and solutions of an epidemic SIS model permitting fluctuations and quantization
地址: http://arxiv.org/abs/2008.02484
作者: Oğul Esen, Eduardo Fernández-Saiz, Cristina Sardón, Marcin Zając
摘要: 最近的一些工作表明,存在被感染个体的均值和方差的微分方程模型,这些模型在某些时候重现了SIS流行病模型。这种随机的SIS流行病模型可以解释为哈密顿系统,因此我们想知道它是否可以通过李-哈密顿系统的理论进行几何处理,而事实恰恰是这样。原始结果是,我们能够以非线性叠加规则的形式获得随机/ SIS流行病模型(具有波动)的一般解,其中包括特定的随机解和与传染过程的初始条件相关的某些常数。这些初始条件的选择对于显示流行期间感染曲线的预期行为至关重要。我们将这些常数限制为非奇异状态,并显示解决方案行为的图。如人们所料,感染者的数量呈S形曲线。李-哈密顿系统允许量子变形,随机SIS流行模型也允许。我们也介绍了这种概括。如果要研究在恒定热源(如集中供热的建筑物)的影响下SIS流行病的演变,则可以利用来自所谓的量子变形的量子随机微分方程。
单纯复形中的社区结构:印度中部野生动物走廊设计的应用-印度东高止山脉景观
原文标题: Community structures in simplicial complexes: an application to wildlife corridor designing in Central India -- Eastern Ghats landscape complex, India
地址: http://arxiv.org/abs/2008.02537
作者: Saurabh Shanu, Shashankaditya Upadhyay, Arijit Roy, Raghunandan Chundawat, Sudeepto Bhattacharya
摘要: 应用代数拓扑中的简单复杂概念来理解和建模无障碍栖息地区域之间的遗传信息,过程和有机体的流动,从而为印度中部东部高德山脉景观复杂的老虎(Panthera Tigris Tigris)设计野生动物走廊网络。该工作在先前的工作的基础上进行了扩展和改进,该工作利用了从重点景观中的加权图获得的最小生成树的概念,这为景观中的保护区老虎种群提供了可行的走廊网络复杂。网络的中心位置确定了栖息地斑块和关键参数,这些参数是老虎在网络中移动过程的关键。我们将顶点中心性的概念扩展到产生顶点间邻接和连接的简单中心性的概念。结果,生态信息在这些网络中迅速传播,甚至在局部范围内传播,这代表了作为社区结构的完整集成且自我解释的模型。基于在景观矩阵中计算的网络中心性的简单复杂网络在景观复杂环境中提供了一个老虎走廊网络,该网络比先前提出的模型更符合现实。由于网络的上述功能和结构特性,该工作提出了一条生态走廊走廊网络,以便在自然保护区和自然保护区的保护区外的老虎种群最容易使用。
通过时间通知的高斯混合模型进行无监督的网络欺凌检测
原文标题: Unsupervised Cyberbullying Detection via Time-Informed Gaussian Mixture Model
地址: http://arxiv.org/abs/2008.02642
作者: Lu Cheng, Kai Shu, Siqi Wu, Yasin N. Silva, Deborah L. Hall, Huan Liu
摘要: 社交媒体由于其易于访问,低成本和快速传播的特性,因此是共享信息的重要手段。但是,社交媒体使用量的增加与网络欺凌的发生率增加相对应。现有的大多数网络欺凌检测方法都受到监督,因此有两个主要缺陷:(1)数据标记过程通常很耗时且劳动密集; (2)由于不同的语言用法和不断发展的社会网络,当前的标签指南可能不会推广到将来的情况。为了解决这些限制,这项工作引入了一种无监督的网络欺凌检测的原则方法。所提出的模型由两个主要部分组成:(1)表示学习网络,该学习网络通过利用文本,网络和时间等多模式特征对社交媒体会话进行编码。 (2)一个多任务学习网络,该网络同时适合注释到达时间,并基于高斯混合模型来估计欺凌可能性。所提出的模型共同优化了两个组件的参数,以克服解耦训练的缺点。我们的核心贡献是一种无监督的网络欺凌检测模型,该模型不仅在实验上超越了最新的无监督模型,而且与有监督的模型相比,还具有竞争优势。
社交媒体预警欧洲COVID-19爆发?
原文标题: Early warnings of COVID-19 outbreaks across Europe from social media?
地址: http://arxiv.org/abs/2008.02649
作者: Milena Lopreite, Pietro Panzarasa, Michelangelo Puliga, Massimo Riccaboni
摘要: 在首次公开宣布本地感染源之前,我们分析了Twitter上的社会网络数据,以发现2020年冬季欧洲COVID-19疫情的预警信号。我们显示的证据表明,在许多欧洲国家,人们对肺炎病例的担忧程度出乎意料。举报主要来自地理区域,这些地区最终成为感染的主要繁殖地。这些发现表明建立一个集成的数字监视系统的紧迫性,在该系统中,社交媒体可以帮助对传染链进行地理定位,否则这些传播链几乎完全无法被发现。
基于在线社交媒体中的活动行为影响传播来推荐可影响目标
原文标题: Recommending Influenceable Targets based on Influence Propagation through Activity Behaviors in Online Social Media
地址: http://arxiv.org/abs/2008.02736
作者: Dhrubasish Sarkar
摘要: 在线社交媒体(OSM)是一个平台,通过该平台,用户可以通过消息传递,发布,做出反应,添加标签以及与其他社交活动共享不同内容来向互联世界展示自己。如今,它对行业,商业和社会的各个方面以及用户的生活都产生了巨大的影响。在OSN平台中,达到目标用户是大多数企业和其他组织的主要重点之一。确定和推荐有影响力的目标有助于有效地吸引适当的受众。在本文中,以自我为中心的OSN讨论了一种有效的模型,该模型通过合并有效的影响力测量推荐系统,以便针对任何特定的社会网络用户生成所有已连接网络成员中影响最大的目标用户列表。首先,已根据所有活动更新了交互网络成员的列表。根据具有情感类型的特定影响类别,推荐了具有最相似活动的交互网络成员。此后,通过分析其活动内容相对于主要用户活动内容的相似性和频率,已根据交互网络的那些更新列表中的所需数量确定了影响力最大的网络成员。 。通过这两个连续的阶段,已经从任何社会网络的以自我为中心的视图中区分了主要用户的主要可影响目标的有效列表。
在Reddit中发现和分类语言偏向
原文标题: Discovering and Categorising Language Biases in Reddit
地址: http://arxiv.org/abs/2008.02754
作者: Xavier Ferrer, Tom van Nuenen, Jose M. Such, Natalia Criado
摘要: 我们提出了一种使用数据嵌入的数据驱动方法,以在讨论平台Reddit上发现和分类语言偏见。作为隔离用户社区的空间,Reddit之类的平台越来越与种族主义,性别歧视和其他形式的歧视问题联系在一起。因此,需要监视这些组的语言。跟踪大型文本数据集中的语言偏见的最有前途的AI方法之一是单词嵌入,它可以将文本转换为高维密集向量并刻画单词之间的语义关系。然而,先前的研究需要预定义的潜在偏倚集来进行研究,例如性别是否与特定类型的工作或多或少相关。这使得这些方法不适合处理较小的且以社区为中心的数据集,例如Reddit上的数据集,其中包含较小的词汇和语,以及该社区可能特有的偏见。本文提出了一种数据驱动的方法来自动发现Reddit上在线话语社区词汇中编码的语言偏见。在我们的方法中,受保护的属性与数据中找到的评估词相关联,然后通过语义分析系统对其进行分类。通过将我们在Google新闻数据集中发现的偏见与以前文献中发现的偏见进行比较,我们验证了我们方法的有效性。然后,我们成功地发现了Reddit社区中的性别偏见,宗教偏见和种族偏见。我们通过讨论潜在的应用场景和这种数据驱动的偏差发现方法的局限性来得出结论。
声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。