社交机器人检测

检测推特上的社交机器人(Detecting Social Bot

2020-12-11  本文已影响0人  杨_光

摘要

社交网络(OSN)中模仿人类的机器人账户有所增加,本文回顾了最近识别人类和机器人账户的相关检测技术。晋限于分析推特社交平台的检测,调研了各种当前在用的检测方案,分类器,数据集和使用的特征。

数据集和预处理

各种检测机器人的方法主要被分为三种技术:基于图的,基于众包,和机器学习的。一旦手机好了数据,下一步就是为选择的分类器准备数据,或者手动标注数据。不同的检测方法所使用的数据如下表:


image.png

社交机器人检测方法

数据集使用的特征

社交机器人检测基于分类选择的特征来判断是真实账号还是社交机器人账号,使用的特征好汉来文本分析,情感,单机的流行为等等,20个通用特征如下表:


image.png

总结

很多研究者更喜欢运用机器学习的方法,这些论文主要用了基于树的方法和基于贝叶斯的方法,随机森林的方法最常被运用,这个分类器的好处就是低复杂性,高精度。然而树的复杂性会造成过拟合。本耶斯方法和随机森里方法广泛用于学术中,贝叶斯方法作为一个统计方法在训练和预测时间上较快。在特征较少时,该方法有更好的性能。支持向量机依赖于核函数的选择和参数。另外这个方法依赖于大量的数据集。神经网络也依赖于数据集的大小。

翻译自--Alothali等, 《Detecting Social Bots on Twitter》.

上一篇下一篇

猜你喜欢

热点阅读