人工智能微刊人工智能大数据,机器学习,人工智能

基于图像特征的事件级谣言检测

2018-10-17  本文已影响0人  lileicv

文章标题:Novel Visual and Statistical Image Features for Microblogs News Verification
作者:计算所,金志威
期刊:IEEE Transaction on Multimedia

本文基于新闻事件中的图像分布模式检测谣言。先直观感受一下真实事件和虚假事件的图像分布,关于真实事件的相关报道配图一般会从各个角度去描述图像,而虚假事件的相关报道中图像比较单一。

真实事件(左)虚假事件(右).png

本文提出了5种图像视觉特征和7种图像统计特征。

1. 五种图像视觉特征

1.1 Visual Clarity Score

评价某新闻事件相关的图像分布和所有事件图像分布的差异。

设某一个新闻事件为事件K,新闻事件集合为c ,提取图像集所有的SIFT特征点,聚类得到visual word,每个visual word用w表示。

Visual Clarity Score用下式度量:
VCS=KL(P(w|k),P(w|c))

在假新闻事件中,图像的VCS得分要相对高一些,即假新闻的图像分布和事件集合的图像分布距离更大。

图片.png

1.2 Visual Coherence Score

测试一个事件中图像的一致性程度

假设某个事件R,包含N张图片, Visual Coherence Score用下式计算,两张图片之间的相似度用两张图片的GIST特征的COS距离表示。

VCoS=\frac{1}{N(N-1)}\sum_{i,j=1,...,N;i\not=j}sim(x_i,x_j)

直观上看,真新闻事件图片的视觉一致性应该比较大(关于真事件的报道可能是从各个角度进行的),假新闻事件图片的视觉一致性比较小(假事件的新闻配图大家可能都是从一个源复制的),但是箱图上看不出这个结论,可能是因为相似性的描述方式不合适。

图片.png

1.3 Visual Similarity Distribution Histogram

给定一个图片集R包含N张图片,对所有图片按转发和评论的次数排序,然后计算视觉相似性矩阵M\in R^{N\times N},其中m_{i,j}\in M表示第i张图片和第j张图片的相似度得分(1.2中计算的相似度得分)。最后统计M矩阵中所有元素的直方图。

1.4 Visual Diversity Score

视觉差异度得分,把所有图片按流行度(转发+评论)排序,假设流行度较大的图片可以更好表示图片,流行度较小的图片包含较大噪声。这个评价优先考虑排名靠前的图片。

VDS=\sum_{i=1}^N\frac{1}{i}\sum_{j=1}^i dis(x_i,x_j)

dis(x_i,x_j)=1-sim(x_i,x_j)

1.5 Visual Cluster Score

对某事件相关图片集进行分层聚类,以聚类的类别个数作为得分。真实事件的聚类个数一般大于虚假事件的聚类个数。

图片.png

2 图片统计特征

本文计算了7种图片统计特征:

图片.png 图片.png

在文章的实验中,直接使用图像的特征结果不好使用内容、传播、用户特征好;但是在文本特征的基础上引入图像特征之后,会普遍提升算法的性能。

上一篇下一篇

猜你喜欢

热点阅读