基于Aspect情绪分析个人见解
在刚开始接触情绪分析时,经常看到基于Aspect级的情感分析,以及ABSA任务,可是Aspect是什么?好像是物体特征,好像是物体属性,这些又是怎么定义的呢?
这里主要参考《情感分析: 挖掘观点、情感和情绪》这本书。
来源:刘兵, 刘康 and 赵军, 情感分析: 挖掘观点、情感和情绪 Mining Opinions, Sentiments, and Emotions. 北京: 机械工业出版社, 2017.
书中主要说明了基于文档级、句子级以及属性级(Aspect)的情感分析。评论的一段话往往对应一个实体,而对于实体的意见不是完全积极的或消极的,因为往往涉及到实体的多个属性。因此需要识别意见目标(这里就是Aspect)和对应的情绪。
而这种情绪分析方法的类别就是基于aspect的情绪分析。
观点
一个评论观点往往由五部分组成(e,a,s,h,t):
e:实体
a: 实体的属性(在这本书中,把Aspect翻译为属性)
s :评论的情感倾向。
h: 评论的持有者(可以表示评论的可信度)
t:评论的发表时间
关于aspect
狭义上讲,Aspect是基于实体而言的,对于一条评论,如某手机的评论,它的实体是手机,而这条评论中一定包括手机的多个方面(aspect),比如手机的电池容量、屏幕大小、系统性能。也就是说,实体是我们针对评论的某一物品,如某一款冰箱、某个电影、某家餐厅,而aspect则是用户评价时讨论的关于这个物品的方方面面。
广义上说,Aspect与我们研究的问题有关,研究问题的主体可以认为是实体,研究问题的属性是Aspect。比如《情感分析: 挖掘观点、情感和情绪》中举了社会和政治议题,:
I hate property tax increase.
可以把property tax increase当做一个有general属性的实体。
也可以把property tax当做一个实体,increase当做一个属性。
如果这是对地方政府的评论,就可以把地方政府当做实体,property tax increase当做它的属性。
Aspect有显性和隐性的。
显性Aspect:
名词和名词短语表示:The picture quality of this camera is great.
实体:camera
aspect:picture quality
隐性Aspect
非名词和名词短语,但也指明了物品的某方面。
The vacuum cleaner does not get the crumbs out of thick carpets.( 吸尘器吸不走厚地毯上的面包屑)
这就是物品的一个隐性方面。它可以分为两部分:1)get the crumbs:吸面包屑(的吸力) 2)out of thick carpets(对于)厚地毯(的吸力)
以下是举例(举例中罗列的aspect为个人理解):
亚马逊评价:
商品:Bright Orange Countertop Mini Compact Portable Ice Maker Machine(明橙色台面迷你便携式制冰机)
评论:This makes the fun ice that looks like a tube. It makes ice quickly and it's easy to clean. I wish it had a bigger ice basket so you didn't have to empty it out as fast as you do.. but then it would be bigger then th-is. This is super cute and works just fine
实体:Ice Maker Machine 制冰机
Aspect:make ice, clean , ice basket, size(big), appearance(cute),work
这里Aspect是制冰情况、清洁、冰篮、大小、工作情况
京东评价:
商品:海尔(Haier) 滚筒洗衣机全自动 10公斤变频 99%防霉抗菌窗垫EG10014B39GU1
评论:对于海尔的产品,我一直是不冷不热的态度,前段时间入手这款全自动变频洗衣机,使用后才明白为什么很多人都选择了海尔的产品,主要是因为它用起来真的不错,人性化设计,美观无噪音。10公斤容量洗四件套没压力,夏凉被都能轻松搞定,就连衬衣都洗得非常干净。新款功能很齐全,食用级巴氏温护除菌,提供更好衣物护理,冷水洗涤,省时省力,AMT抗菌防霉,真的不错。而且它还可以中途添衣,实用又省心。好东西值得分享,推荐给大家
实体:海尔(Haier) 滚筒洗衣机
Aspect:设计 噪音 容量 洗四件套 洗夏凉被 洗衬衣 功能 除菌防霉 中途添衣
这里的Aspect就是用户在谈论海尔洗衣机时,提到的各个方面。
理想情况下,我们应该能够提取出评论中显性和隐性方面,以及用户对这些方面的态度。但是从评论可以看到,显性方面可以直接提取名词短语,相似的名词短语映射到一起。隐性方面比较难以界定,有时就需要先给定Aspect类别,再提取隐性方面。
这也是Aspect有提取任务和分类任务的原因吧。