网络科学研究速递

Arxiv网络科学论文摘要11篇(2020-10-12)

2020-10-12  本文已影响0人  ComplexLY

GitEvolve:预测GitHub存储库的演化

原文标题: GitEvolve: Predicting the Evolution of GitHub Repositories

地址: http://arxiv.org/abs/2010.04366

作者: Honglu Zhou, Hareesh Ravi, Carlos M. Muniz, Vahid Azizi, Linda Ness, Gerard de Melo, Mubbasir Kapadia

摘要: 随着GitHub等平台的出现,软件开发正变得越来越开放和相互协作。鉴于其至关重要的作用,有必要更好地理解和建模GitHub作为社交平台的动态。以前的工作主要考虑了Twitter和Facebook等传统社交网站的动态。我们建议使用GitEvolve,该系统可预测GitHub信息库的发展以及用户与其交互的不同方式。为此,我们开发了端到端的多任务顺序深度神经网络,该网络提供了一些种子事件,同时预测了下一步要与给定存储库进行交互的用户组,交互的类型以及当它发生的时候。为了促进学习,我们使用基于图的表示学习来编码存储库之间的关系。我们通过对共同兴趣建模来将用户映射到组,以更好地预测受欢迎程度并在推理过程中将其推广到看不见的用户。我们引入一种人工事件类型,以更好地建模数据集中存储库活动的变化水平。所提出的多任务体系结构是通用的,可以扩展以建模其他社会网络中的信息传播。在一系列实验中,我们使用多个指标和基线证明了所提出模型的有效性。对模型预测流行度和预测趋势的能力的定性分析证明了其适用性。

大规模随机实验揭示了机器学习可以帮助人们更有效地学习和记忆

原文标题: Large-scale randomized experiment reveals machine learning helps people learn and remember more effectively

地址: http://arxiv.org/abs/2010.04430

作者: Utkarsh Upadhyay, Graham Lancashire, Christoph Moser, Manuel Gomez-Rodriguez

摘要: 机器学习通常专注于开发模型和算法,这些模型和算法最终将在需要智能的任务上取代人类。在这项工作中,我们专注于揭示机器学习的潜力,而不是取代人类,以改善人们学习和记住事实材料的方式。为此,我们对出行领域流行的学习应用程序中的数千名学习者进行了大规模的随机对照试验。在控制了学习的时间和频率之后,我们发现,使用机器学习优化学习课程的学习者所记住的内容要比使用两种替代试探法生成学习课程的学习者长67%。我们的随机对照试验还显示,使用机器学习优化了学习课程的学习者在4-7天内返回应用的可能性提高了 sim 50%。

动态模式分解用于电网负荷数据的预测和分析

原文标题: Dynamic mode decomposition for forecasting and analysis of power grid load data

地址: http://arxiv.org/abs/2010.04248

作者: Daniel Dylewsky, David Barajas-Solano, Tong Ma, Alexandre M. Tartakovsky, J. Nathan Kutz

摘要: 在几乎所有科学领域,包括电力系统工程中的负载建模,时间序列预测仍然是一个主要的挑战性问题。产生准确的预测的能力对实时控制,定价,维护和安全决策具有重要意义。我们介绍了一种新颖的负荷预测方法,其中,在时延坐标中使用动态模式分解(DMD)将观察到的动力学建模为强制线性系统。这种方法的核心是洞察力,即网格负荷与复杂的现实世界系统上的许多可观测值一样,具有“几乎是周期性”的特征,即连续的傅立叶谱被主要峰值打断,刻画了规则的(例如,每天或每周) )的动态重复。提出的预测方法通过(i)回归到本征谱映射到这些峰的确定性线性模型,并(ii)同时学习随机高斯过程回归(GPR)过程来启动该系统,从而利用了此属性。我们的预测算法与不使用其他解释变量的最新预测技术进行了比较,并显示出出色的性能。此外,就解释性和简约性而言,其线性内在动力学的使用提供了许多理想的特性。

comp-syn:带有颜色的可感知接地词嵌入

原文标题: comp-syn: Perceptually Grounded Word Embeddings with Color

地址: http://arxiv.org/abs/2010.04292

作者: Bhargav Srinivasa Desikan, Tasker Hull, Ethan O. Nadler, Douglas Guilbeault, Aabir Abubaker Kar, Mark Chu, Donald Ruggiero Lo Sardo

摘要: 流行的自然语言处理方法基于文本共现模式创建单词嵌入,但通常会忽略语言的具体感官方面。在这里,我们介绍了Python软件包comp-syn,该软件包根据Google Image搜索结果在感知上均匀的颜色分布来提供扎根的单词嵌入。我们证明了comp-syn大大丰富了分布语义的模型。特别是,我们证明(1)comp-syn比使用低维单词颜色嵌入的word2vec更准确,更可解释地预测人类对单词具体性的判断,并且(2)comp-syn在隐喻与文字对的分类任务。 comp-syn在PyPi上是开源的,并且与主流的机器学习Python软件包兼容。我们的软件包发布包括针对40,000多个英语单词的单词颜色嵌入,每个单词与人群来源的单词具体性判断相关。

仇恨是新的信息流行病:Twitter上仇恨言论扩散的主题感知建模

原文标题: Hate is the New Infodemic: A Topic-aware Modeling of Hate Speech Diffusion on Twitter

地址: http://arxiv.org/abs/2010.04377

作者: Sarah Masud, Subhabrata Dutta, Sakshi Makkar, Chhavi Jain, Vikram Goyal, Amitava Das, Tanmoy Chakraborty

摘要: 在线仇恨言论,尤其是在Twitter之类的微博平台上,已经成为过去十年中最严重的问题。一些国家报告说,恶意仇恨运动激怒了仇恨犯罪。尽管仇恨语音的检测是新兴的研究领域之一,但信息网络中与主题相关的仇恨的产生和传播仍未得到充分研究。在这项工作中,我们专注于探索用户行为,这触发了Twitter上仇恨言论的产生以及它如何通过转推传播。我们抓取了大规模的推文,转发,用户活动历史记录和关注者网络数据集,其中包括来自超过 41亿的唯一用户的超过1.61亿条推文。我们还收集了在线发布的超过60万篇当代新闻文章。我们描述了控制这些动态的不同信息信号。我们的分析将有仇恨存在时的扩散动力学与通常的信息扩散区分开。这促使我们在具有现实世界知识的主题感知环境中制定建模问题。为了预测任何给定标签的仇恨语音的启动,我们提出了多个功能丰富的模型,其中表现最好的模型可实现0.65的宏F1得分。同时,为了预测Twitter上的转推动态,我们提出了RETINA,这是一种新颖的神经体系结构,它利用成比例的点积注意力结合了外源性影响。 RETINA的F1宏得分为0.85,优于多个最新模型。我们的分析表明,与现有扩散模型相比,RETINA可以预测可恨内容的转发动态。

可持续发展的社会提示过程:分析框架

原文标题: Social tipping processes for sustainability: An analytical framework

地址: http://arxiv.org/abs/2010.04488

作者: Ricarda Winkelmann, Jonathan F. Donges, E. Keith Smith, Manjana Milkoreit, Christina Eder, Jobst Heitzig, Alexia Katsanidou, Marc Wiedermann, Nico Wunderling, Timothy M. Lenton

摘要: 必须进行社会转型,以应对关键的全球挑战,例如减轻人为气候变化和实现联合国可持续发展目标。近年来,社会小费过程受到了越来越多的关注,因为它们呈现了一种社会变革形式,由于强大的自我放大(数学上积极的)反馈机制,微小的变革可以将敏感的社会系统转变为质的不同状态。有人建议社会小费程序是在技术和能源系统,政治动员,金融市场以及社会文化规范和行为等领域出现的可持续性转变的主要驱动力。借助专家的启发和全面的文献综述,我们开发了一个框架来识别和表征对促进快速社会转型至关重要的社会小费流程。我们发现,社会小费过程与已经更广泛研究的气候和生态小费动态是有区别的。特别是,我们将人类主体,社会制度网络结构,不同的时空尺度和日益增加的复杂性确定为社会小费流程背后的关键鲜明特征。在这些特征的基础上,我们提出了社会小费程序的正式定义,并为那些可能决定人类世全球可持续性发展轨迹的程序筛选了标准。我们以欧洲政治体系为例,说明了这个定义,作为潜在的社会引爆程序的一个例子,强调了星期五未来运动的潜在作用。因此,这种用于社会小费过程的分析框架可用于阐明必要的缓解气候变化的政策和行动的机制。

有效电阻不止是距离:拉普拉斯矩阵、单纯形和舒尔补

原文标题: Effective resistance is more than distance: Laplacians, Simplices and the Schur complement

地址: http://arxiv.org/abs/2010.04521

作者: Karel Devriendt

摘要: 本文讨论了图论中众所周知的事实的几何观点,即有效电阻是图节点上的度量。关于这一事实的经典证据利用了电路或随机游走的思想。在这里,我们描述了一种替代方法,该方法结合了几何(使用单纯形)和代数(使用Schur补)思想。这些观点在米洛斯拉夫·费德勒的矩阵身份中得到统一,该矩阵在图,拉普拉斯矩阵和单纯形的交集处总结了许多相关的观点,其中有效电阻的度量属性是一个突出的结果。

巴西葡萄牙语社交媒体中的有毒语言检测:新数据集和多语言分析

原文标题: Toxic Language Detection in Social Media for Brazilian Portuguese: New Dataset and Multilingual Analysis

地址: http://arxiv.org/abs/2010.04543

作者: João A. Leite, Diego F. Silva, Kalina Bontcheva, Carolina Scarton

摘要: 仇恨言论和有毒评论是社交媒体平台用户普遍关注的问题。幸运的是,尽管这些评论仅是这些平台中的少数,但它们仍然能够造成伤害。因此,识别这些评论是研究和防止社交媒体中毒性扩散的重要任务。以前自动检测有毒评论的工作主要集中在英语,很少有诸如巴西葡萄牙语的语言工作。在本文中,我们为巴西葡萄牙语提出了一个新的大规模数据集,其推文被标注为有毒或无毒或具有不同类型的毒性。我们介绍了我们的数据集收集和注释过程,旨在选择覆盖多个人口统计群体的候选人。在二进制情况下,使用单语数据,最新的BERT模型能够获得76%的宏F1分数。我们还表明,尽管最近在多语言方法方面取得了进步,但仍需要大规模的单语言数据来创建更准确的模型。带有多标签分类的错误分析和实验表明,很难对某些类型的有毒注释进行分类,而这些注释在我们的数据中很少出现,并且突显了开发了解不同毒性类别的模型的必要性。

带节点边协同演化的异构图上的元图注意力

原文标题: Meta Graph Attention on Heterogeneous Graph with Node-Edge Co-evolution

地址: http://arxiv.org/abs/2010.04554

作者: Yucheng Lin, Huiting Hong, Xiaoqing Yang, Xiaodi Yang, Pinghua Gong, Jieping Ye

摘要: 图神经网络已成为建模结构化数据的重要工具。在许多现实世界的系统中,可能存在复杂的隐藏信息,例如,节点/边的异质性,静态节点/边属性以及时空节点/边特征。但是,大多数现有方法仅考虑部分信息。在本文中,我们提出了协同演化的元图神经网络(CoMGNN),该算法将元图的注意力应用到节点和边状态共同演化的异构图上。我们还提出了CoMGNN(ST-CoMGNN)的时空适应模型,用于对节点和边上的时空模式进行建模。我们在两个大规模的真实世界数据集上进行实验。实验结果表明,我们的模型明显优于最新技术,证明了从不同方面对各种信息进行编码的有效性。

新的COVID-19波动的风险-以及它如何取决于R0 ,当前的免疫度和当前的限制

原文标题: The risk for a new COVID-19 wave -- and how it depends on R_0, the current immunity level and current restrictions

地址: http://arxiv.org/abs/2010.04574

作者: Tom Britton, Pieter Trapman, Frank Ball

摘要: COVID-19大流行对世界各地的影响程度不同:一些地区仍在第一波浪潮中崛起,其他地区在第一波浪潮后现在正面临下降,而其他地区则开始出现第二波浪潮。一个区域中当前的免疫水平 hat i 与感染的累积分数密切相关,这主要取决于两个因素:a)该区域中COVID-19的初始潜力(通常由基本繁殖数 R_0量化) ),以及b)采取预防措施的时间,数量和有效性。通过一个数学模型,该模型包括由于年龄,社会活动和易感性导致的异质性,并允许随时间变化的预防措施,新的流行病风险及其加倍时间,以及它们如何依赖 R_0 , hat调查了i 和当前预防措施的总体效果。重点在于量化预防未来爆发所需的预防措施 p_ Min 的最小总体影响。第一个结果表明,与从疫苗获得免疫力相比,当前的免疫力水平 hat i 具有更大的影响力。其次,通过比较 R_0 和 hat i 不同的区域,表明与其他地区相比, R_0 和 hat i 较低的区域现在可能需要更高的预防措施( p_ Min ) R_0 较高但 hat i 较高的区域,即使这种免疫水平远非群体免疫。

HENIN:学习异构神经交互网络以解释社交媒体上的网络欺凌

原文标题: HENIN: Learning Heterogeneous Neural Interaction Networks for Explainable Cyberbullying Detection on Social Media

地址: http://arxiv.org/abs/2010.04576

作者: Hsin-Yu Chen, Cheng-Te Li

摘要: 在网络欺凌的计算检测中,现有工作主要集中在构建仅基于社交媒体会话的文本分析的通用分类器上。尽管他们取得了经验上的成功,但我们认为,关键的缺失部分是模型的可解释性,即,为什么特定媒体会话被检测为网络欺凌。因此,在本文中,我们提出了一种新颖的深度模型,即异构神经交互网络(HENIN),用于可解释的网络欺凌检测。 HENIN包含以下组件:注释编码器,注释后共同注意子网络以及会话会话和交互后提取器。在真实数据集上进行的广泛实验不仅展示了HENIN的有希望的性能,而且还突出了证据评论,因此人们可以理解为什么媒体会议被认为是网络欺凌。

声明:Arxiv文章摘要版权归论文原作者所有,机器翻译后由本人进行校正整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。

上一篇 下一篇

猜你喜欢

热点阅读