Arxiv网络科学论文摘要12篇(2019-11-21)
- 通过众包的用户报告更新邻居基站列表:一个测量时间性能框架;
- git2net——挖掘大型git仓库共同编辑的含时间戳网络;
- 异构深度图Infomax;
- 国际贸易网多标准社区发现;
- 保证网络特征的可靠蒙特卡洛估计;
- 干扰指数的指标是否度量了他们提出要度量的内容?几个指标变体与人工评判的比较;
- 基于场测量和机器学习新加坡校园空气温度和城市形态参数的经验模型;
- 通用和非通用文本统计:语言识别的聚类系数;
- 作为一种语言现象理解巨魔的写作;
- 社交和公路网络的社区检测算法实证研究;
- 基于最短路径算法的分层优化的推荐系统;
- 自旋玻璃的方法应用于有向2距离最小支配集问题;
通过众包的用户报告更新邻居基站列表:一个测量时间性能框架
原文标题: Updating Neighbour Cell List via Crowdsourced User Reports: a Framework for Measuring Time Performance
地址: http://arxiv.org/abs/1401.1551
作者: Alessandro Checco, Carlo Lancia, Douglas J. Leith
摘要: 在本文中,我们介绍了由众包的用户报告的手段估计在无线网络局部拓扑的想法。在该方法中的每个用户周期性地报告至约该组由使用者观察到相邻基站的服务基站的信息。我们表明,由网络的本地拓扑结构映射到知识增加状态,一个清晰的数学框架可以得到,它允许依次为利用各种用户移动性模型。使用我们展示了如何获得预期的时间有用的上限为基站,以获得其当地居委会的全部知识,回答基本问题有关的网络部署的类可以有效地从一个众包的方式中获益的简化移动性模型。
git2net——挖掘大型git仓库共同编辑的含时间戳网络
原文标题: git2net - Mining Time-Stamped Co-Editing Networks from Large git Repositories
地址: http://arxiv.org/abs/1903.10180
作者: Christoph Gote, Ingo Scholtes, Frank Schweitzer
摘要: 从软件库数据已成为软件工程过程的实证研究的重要基础。存储库中的挖掘文献反复出现的主题是显影剂网络例如捕获推理协作,协调,或通信从提交项目的历史。大多数研究网络是基于在文件,模块或包级别定义的软件文物的合着者。虽然这种方法已经导致见解软件发展的社会方面,它忽视了代码更改和代码所有权,例如详细信息其中代码的确切行已经由开发人员,包含在撰写提交的软件项目的日志。解决这个问题,我们引入git2net,有利于细粒度共同编辑网络在大git仓库提取一个可扩展的Python软件。它使用文本挖掘技术来分析文件中的文本修改的详细询问病史。该信息允许我们构建有向,加权和时间标记的网络,其中一个链接意味着一个显影剂已经编辑的源代码块最初由另一个开发者编写。我们的工具是在开源和商业软件项目的案例研究应用。我们认为,它开辟了人类合作模式高分辨率数据的一个巨大的新来源。
异构深度图Infomax
原文标题: Heterogeneous Deep Graph Infomax
地址: http://arxiv.org/abs/1911.08538
作者: Yuxiang Ren, Bo Liu, Chao Huang, Peng Dai, Liefeng Bo, Jiawei Zhang
摘要: 图表示学习是学习统一节点表示,用于保存两个节点的属性和结构信息。派生节点表示可被用来服务于各种下游的任务,如节点分类和节点聚类。当一个图是异质的,问题就变得比齐图节点学习问题更具挑战性。通过新兴的基于信息论学习算法的启发,在本文中,我们提出了异构图表示学习无监督图表神经网络的异构深图的Infomax(HDGI)。我们使用元路结构分析涉及异构图语义的连接,并利用图卷积模块和语义的高度重视机制,以便获取局部表示。通过最大限度地利用当地的全球互信息,HDGI有效地学习,可以在下游的图相关任务中使用的高级别节点表示。实验结果表明,显著HDGI优于状态的最先进的无监督图表示学习关于分类和聚类任务的方法。通过喂食了解到表示分为参数模型,如逻辑回归,我们甚至与国家的最先进的监管比较端至端GNN模型时实现节点分类任务相当的性能。
国际贸易网多标准社区发现
原文标题: Multi-criteria community detection in International Trade Network
地址: http://arxiv.org/abs/1911.08593
作者: Paolo Bartesaghi, Stefano Benati, Gian Paolo Clemente, Rosanna Grassi
摘要: 了解社会结构对经济分析非常重要。社区的特征在于从那些个体节点和整个网络两者的不同性质和它们会影响网络上的各种处理。我们结合社区发现的具体拓扑指标。其结果是,新的加权网络是由原始一方法,其中权重被确定考虑到所有在一个多标准拓扑指标接近构成。我们推出了新的算法通过求解NP难CP-问题检测社区。
保证网络特征的可靠蒙特卡洛估计
原文标题: Ensuring Reliable Monte Carlo Estimates of Network Properties
地址: http://arxiv.org/abs/1911.08682
作者: Haema Nilakanta, Zack W. Almquist, Galin L. Jones
摘要: 在社会网络分析的文献主要集中在方法和需要完整的网络数据模型;然而,存在许多网络只能通过因网络访问限制,或感兴趣的人口规模或复杂性的抽样方法进行研究是难以达到的。在这种情况下,随机的基于步行式马尔可夫链蒙特卡洛(MCMC)方法来估计多个网络功能的应用是常见的。然而,这些估计的可靠性在很大程度上被忽略。我们考虑和进一步发展以网络抽样直接解决多元估计的可靠性的背景下多元MCMC产出分析方法。这种方法产生原则性强,计算效率,并评估蒙特卡罗估算程序广泛适用的方法。特别是,对于两个随机行走算法,一个简单的随机游走和大都市黑斯廷斯随机游走,我们构建和比较网络参数估计值,有效样本量,覆盖概率,并停止规则,所有这些说话的估计可靠性。
干扰指数的指标是否度量了他们提出要度量的内容?几个指标变体与人工评判的比较
原文标题: Do disruption index indicators measure what they propose to measure? The comparison of several indicator variants with assessments by peers
地址: http://arxiv.org/abs/1911.08775
作者: Lutz Bornmann, Sitaram Devarakonda, Alexander Tekles, George Chacko
摘要: 最近,吴,王,和Evans(2019)和卜,沃尔特曼,和黄(2019)提出的指标,一个新的家庭,其措施是否科学的出版物是破坏性的字段或研究的传统。这样的破坏性影响的特点是引文的焦点纸,而不是其引用的参考文献。在这项研究中,我们感兴趣的是收敛效度,即问题,破坏这些指标是否能够测量他们提出来衡量(“破裂性”)的内容。我们用新颖的外部条件来检查收敛效度:在F1000Prime的后出版的同行评审系统,专家评估论文的研究报道是否符合这些标准(例如,报告的新发现)。这项研究是基于F1000Prime 120179纸2000至2016年间出版的研究中,我们讨论了指标的第一部分。基于从讨论的见解,我们提出的破坏指标替代变种。在第二部分中,我们研究的指标和(可能)改良变收敛有效性。虽然因子分析表明,不同的变形测量尺寸相似的结果,回归分析的结果表明,一个变体(DI5)执行略好于其他人。
基于场测量和机器学习新加坡校园空气温度和城市形态参数的经验模型
原文标题: Empirical model of campus air temperature and urban morphology parameters based on field measurement and machine learning in Singapore
地址: http://arxiv.org/abs/1911.08822
作者: Zhongqi Yu, Shisheng Chen, Nyuk Hien Wong, Marcel Ignatius, Jiyu Deng, Yueer He, Daniel Jun Chung Hii
摘要: 造成城市热岛(UHI)效应上升的气温已经成为一个问题,新加坡,它不仅影响的室外气候环境的热舒适性,但同时也增加建筑物的制冷能耗。作为一个多尺度的一部分,多物理场城市小气候模型,气象站被安装在新加坡国立大学(NUS)的肯特岗校园内15分,不断地从2019年2月的气候数据记录到2019年五月地理信息系统( GIS)地图和三维模型被构建用于提取城市形态参数,例如BDG,PAVE,墙壁和HBDG。通过现场调查,SVF和GnPR计算。通过使用多标准线性回归和机器学习,本研究调查了5个回归模型室外空气温度包括线性回归(LR),k-最近邻(KNN),支持向量回归(SVR)的预测,决策树(DT)和随机森林(RF)。通过最佳子集变量的分析,回归分析显示绿色植物白天和夜间城市热岛的缓解起到至关重要的作用。行人水平风场是在白天放热帮助。提供高层建筑自阴影,以减少环境空气温度高,但SVF是有害于夜间散热。对于回归模型,RF具有最好的预测性能。 RF的平均RMSE减少了4%至29%相比,线性回归。学习曲线表明,LR的预测能力也不会被其他数据提供得到改善。相反,在偏差和方差的下降趋势表明RF可以从大数据的培训中获益。学习算法在部署期间,RF表现继续优于其他学习算法。
通用和非通用文本统计:语言识别的聚类系数
原文标题: Universal and non-universal text statistics: Clustering coefficient for language identification
地址: http://arxiv.org/abs/1911.08915
作者: Diego Espitia, Hernán Larralde
摘要: 在这项工作中,我们分析了7周不同的语言(西班牙语,英语,法语,德语,土耳其语,俄语,冰岛),以及与随机插入空格文本91个相对较小的文本统计特性。尽管尺寸(约11260不同的字),著名的通用统计规律 - 即齐普夫和Herdan堆的法律 - 被确认,并与其他地方得到的结果吻合。我们还建立每个文本的字共现网络。虽然度分布又是普遍的,我们注意到,集聚系数,这在网络上的局部结构很大程度上取决于分布,可以使用的语言来区分,以及从随机文本区分自然语言。
作为一种语言现象理解巨魔的写作
原文标题: Understanding Troll Writing as a Linguistic Phenomenon
地址: http://arxiv.org/abs/1911.08946
作者: Sergei Monakhov
摘要: 目前的研究取得了许多重要成果。我们设法建立在巨魔和真正的鸣叫分类达到91%的准确度得分神经网络。通过回归分析的方法,我们确定了一些功能,使鸣叫以正确的标签更容易发现,他们在巨魔微博作为一种特殊类型的话语中固有地存在。我们假设,这些功能在巨魔写作,可以最好地描述为两个因素的结合的社会语言学限制接地:有目的的讲话,并试图掩盖说话的目的。接下来,我们主张,这些因素的正交性质必然导致巨魔消息的许多不同的语言参数的偏态分布。既然选择作为与这些主题相关的主题和词汇为例分布,我们发现了一些非常明显的分布异常,从而证实了我们的预测。
社交和公路网络的社区检测算法实证研究
原文标题: An Empirical Study of Community Detection Algorithms on Social and Road Networks
地址: http://arxiv.org/abs/1911.08992
作者: Waqas Nawaz
摘要: 在社会网络社区发现是相当大的兴趣的一个问题,因为发现社区揭示隐藏的有关网络的信息。存在很多算法来检测固有的社会结构和最近几个人在社会网络上进行调查。然而,这是不平凡的决定,最好的办法以图表的不同性质的存在,密度和稀疏性,结果的分析不足的方面。因此,在本研究中,我们分析和比较各种算法在两个网络,即社会和公路网检测的社区,具有不同的结构特性。所考虑的算法与用于包括内部密度,平均程度,切割比,电导,归一化剪切和平均的Jaccard指数社区的内部和外部连接的独特的指标进行评价。评估结果显示有关所选算法和基本社会结构的重要见解。
基于最短路径算法的分层优化的推荐系统
原文标题: A Hierarchical Optimizer for Recommendation System Based on Shortest Path Algorithm
地址: http://arxiv.org/abs/1911.08994
作者: Jiacheng Dai, Zhifeng Jia, Xiaofeng Gao, Guihai Chen
摘要: 地理社会网络上的top-k最近地理社交关键字(T-kNGK)的查询被定义为用户提供基于一些关键字和指定空间范围ķ建议,并且可以通过最短路径算法来实现。然而,最短路径算法不能提供令人信服的建议,所以我们设计了分层优化,包括分类器和一个常量优化由服务提供商的一些功能来优化结果。
自旋玻璃的方法应用于有向2距离最小支配集问题
原文标题: Spin Glass approach to the Directed 2-distance Minimal Dominating Set problem
地址: http://arxiv.org/abs/1911.09085
作者: Yusupjan Habibulla
摘要: 有向L-距离最小支配集问题有计算机科学与通信网络中广泛的实际应用。在这里,我们从纯粹的理论兴趣的角度研究这个问题。我们只给出了随机图,并定期随机图的结果,但这项工作可以扩展到任何类型的网络。我们开发自旋玻璃理论来研究针对2-距离MDS问题。首先,我们发现,当温度相反低于两ER随机网络和定期随机网络上的阈值更大的置信度传播算法不收敛。其次副本对称理论的熵密度具有对定期随机图有限逆温度转变点时,节点度大于4,并且当节点度大于6.6大ER随机图,没有熵过渡在其他情况点(或 的β= infty )。第三的BP的结果算法同样与副本对称性理论和BPD算法比贪婪启发式算法更好的结果。关键词:针对2-距离最小支配集,置信传播,ER随机图,定期随机图,置信传播抽取
声明:Arxiv文章摘要版权归论文原作者所有,由本人进行翻译整理,未经同意请勿随意转载。本系列在微信公众号“网络科学研究速递”(微信号netsci)和个人博客 https://www.complexly.cn (提供RSS订阅)进行同步更新。个性化论文阅读与推荐请访问 https://arxiv.complexly.cn 平台。