情感分析入门笔记[1]传统方法Asurveyofopinionminingandsentimentanalysispara10969

原文:MiningTextDataChapter13:AsurveyofopinionminingandsentimentanalysisBingLiu,LeiZhang[2012]

摘要:情感分析/意见挖掘可以自动从大量数据中得到人们的看法,同时消解个体的偏向(bias),所以很必要。

第一,什么是opinion

一个entity(e),例如手机,或者某个牌子的手机,有许多component(摄像头,屏幕),和一些sub-component(感光元件等)。我们把这个entity看作一个树,每个node就是一个细节。对每一个(sub)component,可能会有几个attribute,比如摄像头清晰度,摄像头大小等等。这样一棵枝枝桠桠的树,就是opiniontarget,供人评价的对象。

[zm666,想问题就是要全面,我认为这个defination是整篇最重要的部分了,研究一个sentiment,要考虑到发起人和评价对象,才算一个完整的研究。因为平时做起来粗糙,场景单一,忽视了这个全面的定义。]

两个其他的问题:主观性(subjectivity)与情感(emotion)。

一个橘子很大,是个客观评价。

一个橘子很漂亮,是主观感受。

subjectivityclassification就是用来区分一个句子是主观还是客观的。主观句子中一般有评价,但是客观句比如:这手机不耐摔,也暗含了评价。评价句不一定是主观句,但是有很大交集。

emotion:joy,anger,fear等等。这些emotion也有时表达了人们对事情的评价:买了这个手机真开心。这种句子被叫做rationalevaluationsentences.就是感性评价句。

第二,aspect-basedopinionsummary

从每个方面来评价一个entity,最后给个总结。这部分不感兴趣。大概就是综合大家的评价生成一个评价,文本的评价可能会失去一些数量信息,不利于分析,扇形图之类的可以给读者一个比较便于analyse的结果。

把整个文本看作一个整体,以获得对整个entity的评价。

监督学习:可以看作一个三分类(pos,neg,neutral)问题,一般review一般都会有用户自己的评分,一到五星,可以用这个做label来训练。目前的许多方法都可以直接用在这里:unigram的朴素贝叶斯和SVM都能表现不错。

除了用词的occurence,也可用其他特征,例如词频/词性[形容词更重要]/意见词或短语/否定词/句法依赖。基于这些特征,可以改进监督学习模型。

无监督学习:无监督学习一般就用意见词来判断

1.抽取形容词短语

2.计算在所有文档内这样的短语与excellent/poor的PMI,也就是共同出现的频率

3.统计这个文档内所有短语的平均SO(情感倾向)

三:句子主观性判断和情感分析

两个任务:

1.判断句子主观性,从而过滤掉不表达观点的句子

2.抽取句子中的aspect并分析so

一般认为一个句子来自同一个opinionholder

[zm这部分主要在讲一些细节的问题,比如有多个从句的句子处理起来如何如何难,需要做短语级的分析]

根据上面的一些研究,我们发现关键词是情感分类中最重要的任务,扩展关键词是一项很重要的任务,有以下几种方法。

1.根据词典扩充。种子+用wordnet/hownet之类的词典寻找同义词和反义词

缺点:太general,可能不适应具体文本。

2.根据文本库扩充。在文本库中通过AND/OR/BUT等一些连接词来扩充辞典。(CRF可以用在这里)

缺点:效率低

两个分解任务:

1.抽取Aspect

2.情感分类

5.1首先,情感分类:

用lexicon-based方法来解决这个问题

1.用pos/neg标记opinion词

2.解决shifter(not/no)

3.解决but从句

4.计算一个句子中每个aspect的oo(opinionorientation)

5.2OpinionRule()

opinionrule就是表示一个opinion是正还是负

1.opinionword可以直接确定是正还是负

2.这个结果是不是用户预期的结果同样可以表示正负的评价

3.数量的高低多少同样可以表达看法的正负,例:电视太小了

4.数量的增加减少也可以,例:吃了这个我头疼减轻了

5.与正常/期待的不太一样,例:这个药让我血压变低了

6.产生/消耗资源,例:这个太费水了

5.3Aspect抽取

这个章节介绍了一些无监督的特征抽取方式。第一种方法:

2.通过分析aspect和opinion的关系找到不常见的aspect:通过人们的评价,来找到aspect

CRF,HMM也可以被用在这里。LDA等TOPICmodeling的方法也可以用在这里[zm在中文短文本上做了实验,效果不怎么样]

5.4同时做意见词扩充与aspect抽取

通过探索句法特征来同时处理以上两项任务,主要分为以下四个分任务

1.用opinionword抽取aspect

2.用已得aspect抽取更多aspect

3.用额外获得的aspect抽取opinionword

4.用已有的所有opinionword重新扩展opinionword

好玩,主要是用dependencygrammar来解决问题

[zm以下不太感兴趣,今天不看了]

6.挖掘比较观点

7.其他问题(entity/holder/extraction抽取/grouping)

8.垃圾观点检测

GoodRepresentationforAcademicWriting:

Thetaskistechnicallychallengingandpracticallyveryuseful.

Proliferation[增殖]ofdiversesites.

Deciphertheopinionatedtext

Researchhasbeendoneinacademia[学术界]

Aunifiedframework

Twotermsareusedinterchangeably.

Quintuple[五部分的]

Opinion,Alligation[陈述],Desire,Belief,Suspicious,Speculation[推断]

Opinionquintuplesdefinedaboveprovideanexcellentsourceofinformationforgeneratingbothqualitativeandquantitativesummaries.

THE END
1.有一种感情叫做姑嫂情,一份值得永远珍藏的情感有一种感情叫做姑嫂情,一份值得永远珍藏的情感 ?。 昨天躺在床上一天,嫂子在家里大扫除,把家里打扫干净利落,我看不下去,过了一会我起来帮忙洗洗,她立马推开我,别动。快吃药去睡觉。 这时我手上的拖把被侄子抢去拖地了,地上的拖鞋也被侄女收来一起洗了。我没工具了,就继续躺着。 https://www.jianshu.com/p/4ef83d564793
2.关于情感的文案(精选195句)情感的文案1 1、谁都不需要解释什么,情话太多会让人更难过。 2、真爱萦绕银屏上,一片痴情用心赏,几分温柔看衷肠,明月风清爱吟唱,牵挂之情刻心房,祝福片片请珍藏;祝你笑容时刻飞扬,爱情紧握在手掌! 3、开始就是错的,何必要让它一错再错下去。 4、最后我们变成爱了很久的朋友,可笑在爱到血肉模糊时候,泪水能https://www.ruiwen.com/wenan/5897265.html
3.情一情感树立行业标杆率先引进国际最新情感挽回理论据悉,情一情感在创立初期便树立行业标杆,率先引进国际上最新的婚姻家庭治疗理论,结合中国特有的文化,如家庭子女教育问题等进行本土化升级,形成了独创的“情一”情感挽回体系,通过魅力提升、两性沟通、化解危机、维系感情等四个阶段去帮助客户走出情感婚姻的沼泽地。这一体系的成功创立,体现了邓家玉女士耕耘婚恋行业20多年https://news.sina.cn/2020-10-29/detail-iiznctkc8304288.d.html
4.情感情爱网易女人情感频道探讨男女情爱、性爱、情感问题,倡导性别平等与女性主义,王牌栏目女人帮、连岳信箱,解决您的情感烦恼。https://lady.163.com/sense
5.《梧桐树》歌曲演唱中的情感表达尾句结束在9拍的do上,在保持好时值的同时,还需要表现出渐慢的力度,凸显出一种久久难以忘怀之情,因此要想达到以上情感表达的效果,需要依赖于气息的支持,对于这个长时值音的表现要有预见性,提前做好气息上的准备,尤其是在演唱力度上,要体现出由强到弱的“微变化”,不能造成明显的强弱变化棱角感,通过慢慢地收腹和https://www.fx361.com/page/2022/1124/11570773.shtml
6.地方性文本现代性与“情”:近五年海外现代中国都市文学与文化本部分将两本关于情绪与情感的都市研究著作放置在同一框架下。迄今为止,海外学界在中国现代文学与文化领域尚没有一部将情感研究(emotional studies)、情动研究(affect studies)或者情感史(History of Emotions)作为主要框架的著作。但是,这并不代表现代中国文学与文化研究领域没有出现过此类讨论。相反,历来许多著作都讨论https://www.douban.com/note/803511413/
7.离歌情深纸短情长——毕业离歌亦深情(一)言浅意深,纸短情长。只言片语自然无法描述毕业生们的各种精彩。来自母校的深情观望也无法一一倾诉。惟愿这字里行间的青春身影,在毕业季里的离歌留下深情的回望。青春不散场,梦想在路上。祝愿即将毕业,各奔锦绣前程的莘莘学子,历尽千帆,归来仍是少年。http://www.qlshx.sdnu.edu.cn/info/10445/109212.htm
8.详细解释多情又滥情什么意思泛情的女人特性泛情,它指在情感上非常容易给一个人,没什么真心实意,另外也会有别的的贬义词实际意义。滥”也者,消耗滥用也。专一也罢,痴情也好,实际上,大家心里追求完美的是“真心”。下边我给大家表述痴情又泛情啥意思。 一、多情又泛情是什么意思 1、会随便的把情感给一个人(贬词)。 https://mingjun2008.com/article/12071.html
9.情商的研究自励意味“求实坚毅”, 对一个情商高的人来说,面对困难能够一点一滴地从事自己的工作,坚强自己的信念,而不是抱着“干得了就干,干不了就算了”的心态。 通情达理 通情达理(Empathy)就是能设身处地考虑他人的情绪感受和行为原因,具备换位思考的能力和习惯,理解和认可情绪差别,能与自己的观念不一致的人和平相https://blog.csdn.net/qq877507054/article/details/88659895
10.管理情绪情感,先从认识它开始同一种情感在不同情况下会有不同的情绪表现。如爱的情感,在处理亲情、友情和爱情时,会有不同的情绪表达;在爱情关系中,也会有愉快、痛苦、悲伤等多种情感交织的情绪表现形式。因此,情感离开了情绪就难以存在,而情绪的变化也往往反映了情感的深度,饱含着情感。http://www.jy318.com/news/1774