Python 可视化文本的情绪库:PyPlutchik

2022-04-08  本文已影响0人  程序员小西

越来越多的社交网络学者, 为测量情绪, 基于心理学家 Robert Plutchik 提出的模型(通常简称为“Plutchik轮”,人类的情绪一共有8大类)制作了大量的情绪可视化作品。在某种程度上,Plutchik轮可以看做情绪指纹,例如不同的电影题材在8类情绪的分布是不一样的。


图片.png

今天介绍 PyPlutchik,这是一个 Python 库,专门用于在文本或语料库中可视化 Plutchik 的情绪。PyPlutchik 绘制 Plutchik 的花朵,每个情感花瓣的大小取决于语料库中检测到或注释了多少情感,也代表每个情感花瓣的三个强度程度。

安装

pip3 install pyplutchik

Usage

from pyplutchik import plutchik

emotions = {'joy': 0.6,
            'trust': 0.4,
            'fear': 0.1,
            'surprise': 0.7,
            'sadness': 0.1,
            'disgust': 0.5,
            'anger': 0.4,
            'anticipation': 0.6}
            
plutchik(emotions)

功能特性

PyPlutchik 提供了一个即插即用的工具,用于在文本或语料库中定量表示 Plutchik 的情绪。它尊重 Plutchik 轮中每个花瓣的原始颜色和空间位移。

在 Pyplutchik 中,用户可以只传递一个字典作为唯一参数,其中字典的键必须是 8 种基本情绪。每个值必须是 ∈ [0, 1]。

图片.png

每类情绪存在三种强度,下表是Pyplutchik的8大类情绪三种强度汇总。

用户还可以给每个情绪传入一个长度是3的列表,依次表示情绪在低、中、高三种强度的程度,数值0 和 1 之间。

图片.png 图片.png

PyPlutchik 也可表征用户数据中的主要二元、次要二元、二元和相反的情绪。它会自动从字典的关键字中了解用户想要显示什么样的二元组。

图片.png

绘图技巧

可以专注于情绪子集,不会忽视其他情绪,将情绪列表作为参数

“highlight_emotions”的值传递:


图片.png

我们可以比较同一亚马逊语料库的不同子组,将我们的可视化并排放置,并仅突出显示愤怒、厌恶和恐惧的花瓣,以轻松发现这些负面情绪在 5 星评论中的表现如何低于 1 星评论 .

[图片上传失败...(image-162e9e-1649406772464)]

或者可以隐藏坐标、刻度和标签,只绘制花瓣,使用参数 show_coordinates = False 和 show_ticklabels = False。下图是imdb不同电影的情绪轮

图片.png

说明

如果使用PyPlutchik,请在文献中说明,格式如下

Semeraro A, Vilella S, Ruffo G (2021) 
PyPlutchik: Visualising and comparing emotion-annotated corpora 
PLOS ONE 16(9): e0256503.https://doi.org/10.1371/journal.pone.0256503
上一篇下一篇

猜你喜欢

热点阅读