舆情的“质变”——突发事件演化中变换阶段的意见领袖推演分析

由中国新闻史学会计算传播学研究委员会与微热点大数据研究院联合举办的第二届传播数据挖掘竞赛已圆满落幕,15支战队尽显风采。以下为“突发事件发展推演模型”选题优秀作品《舆情的“质变”突发事件演化中变换阶段的意见领袖推演分析》,由来自厦门大学的“咬文嚼数队”精彩呈现。

1.1突发事件舆情演变的阶段模型

关于突发事件网络舆情演变的议题,许多学者从不同的角度进行了划分,包括三阶段、四阶段以及多阶段等演变模型。典型的三阶段模型为“发生、变化、结束”(王来华,2005;陈月生,2005),还有“产生、传播、聚合”(徐敬宏等,2010)。这些三阶段模型较为简洁、抽象,但创新性和解释力不足,于是四阶段模型应运而生。有学者提出“涨落、序变、冲突和衰变”的四阶段划分模型(刘毅,2007),还有“起始、持续高涨、波动变化、淡化或消落”(姜胜洪,2010)。以上四阶段模型解决了部分三阶段模型的问题,但仍在逻辑性、接续性、描绘准确度等方面存在不足。另外还有学者提供了内涵更多环节的多阶段模型。“潜伏期、萌动期、加速期、成熟期和衰退期”五阶段模型(谢科范等,2010)重点反映由网络舆情引起的突发事件变化,因此在反映网络舆情演变方面不具有较好解释力。

该模型的特征对比如下表所示:

1.2舆情阶段划分依据:转换阶段的质变特征

如今的网络舆情发展迅速,变换复杂,且突发事件经常出现多次的舆情反转,导致事件的真相模糊,引起网民的骂战。舆情变换期则定义为扩散阶段后出现的一系列明显转折、大角度转变,该阶段正对应了舆情的反转阶段。通过对舆情变化阶段的预判与控制,才能更好地将突发事件舆论往可控的方向引导。

1.3舆情演变中的意见领袖的界定与测量指标

“意见领袖”这一概念最早由拉扎斯菲尔德在《人民的选择》中提出,指那些在人际传播中经常为他人提供信息或意见,并对他人施加影响的“活跃分子”,并据此提出了“两级传播”理论,即“观点经常从广播和印刷媒体流向意见领袖,然后再从她们流向不太活跃的人群。”(Lazarsfeld,1948)随后,大量研究证明“意见领袖”在创新扩散、市场营销、流行时尚、公共事件、舆情控制等方面发挥着重要作用(Katzetal,1955;Rogers,1983;Bondetal,2012)。

2.1研究问题

RQ1:舆情在何时进入变换阶段?

a:具体何时进入变换期?

b:和前期相比,变换期的舆情有哪些特征?(各阶段传播内容及特征部分:

变换前&变换期)

RQ2:舆情变换阶段,哪些人能成为意见领袖?

a:哪些微博用户成为该舆论事件变换阶段的意见领袖?

b:各个舆论事件变换阶段的意见领袖具有哪些个人特征?

(用户认证类型+社会属性)

c:各个舆论事件变换阶段的意见领袖具有哪些网络特征?

d:各个舆论事件变换阶段的意见领袖具有哪些行为特征?

RQ3:舆情变换阶段,意见领袖是如何在情感层面影响舆情发展的?

(微博内容情感倾向)

2.2研究意义

本研究补充已有研究的不足,着眼于舆情演变中“变换阶段”的意见领袖,在综合分析突发舆情事件特征的基础上,构建舆情变换阶段意见领袖的识别指标体系,并总结舆情演变过程特别是变换阶段的发展规律,为舆情监控部门识别变换阶段的意见领袖提供参考,以便其在复杂的舆情环境下及时进行引控工作并遏制舆情进一步蔓延。

3.1数据清洗

1.选择微博数据的原因

微博作为一种新兴的信息传播渠道,因为其特有的实时性特征,已经成为突发事件网络舆情形成的重要平台,而在微博中如何定义以及发现网络舆情意见领袖是一个有待研究的问题。(刘志明,2011)

2.已有数据舆情事件分类

1)标准类(“倒V”型):母亲踹踢三岁女童模事件、仁济医院赵晓菁事件、四川凉山火灾事件和西安奔驰漏油事件均体现出事件发生后舆论经过孕育进入小高潮期,经过信息扩散形成舆论高峰,随后逐步衰减的特征。

3)“二次爆发类(M型)”:北京世界园艺博览会和上海特斯拉自燃事件均体现出舆论进入衰退期后出现二次爆发的特点。

3.事件的选取

3.3粒子扩散模型与舆情阶段划分依据

3.3.2空间

1.关键词分析:本研究使用了词频统计,统计各阶段微博内容词频,并使用TF-IDF模型进行关键词识别,根据词频绘制词云图;

2.LDA主题分析:首先利用TF-IDF模型将词向量化,而后训练LDA模型,计算困惑度选择合适主题个数,并对各阶段主题词进行主题概括。(蒋明敏,王雪芬,2020)

3.4变换阶段的意见领袖识别体系

3.4.1个人属性

2.通过原微博溯及原博主,根据该博主的微博认证信息、简介和过往发博记录,综合评判该用户的社会属性,包括文体明星、各行各业专家学者、公共知识分子、媒体微博、政府官方微博、草根(罗宜虹,2014),具体定义见附录四。

3.4.2行为特征

3.4.3网络特征

1.核心—边缘

采用Rombach等人基于核心-外围结构模型提出的计算方法(P.Rombach,2017),使用python的核心边缘结构分析的算法包cpalgorithm对清洗后的数据集二进行处理,基于微博转发关系进行核心边缘分析。

2.中介中心性

3.转发关系可视化

采用pyecharts,地理可视化库AntV-L7和网络结构可视化工具Gephi,将转发的层级关系可视化,见附录五。

3.4.4文本特征

1.情感分析

为了提升识别的准确率,研究者采用了深度学习中的Bi-LSTM模型(XuG,MengY,2019)来对清洗过后的微博进行情感分类分析,在本次的处理中,Bi-LSTM模型会处理输入语句并把它们划分为积极、负面、中立三种情感,以作为语句的特征信息供后续的分析处理使用。

4.1RQ1:舆情在何时进入变换阶段?

b:和前期相比,变换期的舆情有哪些特征?

以下,根据关键词分析和LDA主题分析,总结归纳变换前后阶段舆情主题及该阶段的特征,另外,由于在判断过程中“母亲踹踢三岁女童”事件不存在变换期,在本研究中不做展开。

4.1.1上海特斯拉自燃事件变换阶段前后事件特征

4.1.3西安奔驰漏油事件变换阶段前后事件特征

4.2RQ2:舆情变换阶段,哪些人能成为意见领袖?

4.2.1标准类(“倒V”型)意见领袖特征

根据转发量、中间中心度、核心边缘分析以及传播网络图,变换阶段前后的头部意见领袖按照转发量降序排列如表格中所示,研究者在两个阶段分别选取意见领袖共计10位,其中重复的头部意见领袖只计数为1。

4.2.2迅速进入高潮类(“h”型)意见领袖特征

总的来说,变换前阶段的意见领袖整体上呈现出:在个人特征上,以金V用户、媒体微博账号为主的特点,意见领袖所属行业、专业与该事件本身涉及的行业、专业无关,地域分布杂乱;在行为特征上,微博转发量自25至135不等;在网络特征上,核心度较高;在文本特征上,更多倾向于表现负面情感。

总的来说,变换期意见领袖整体上:在个人特征方面以蓝V、媒体微博为主,同时,草根用户占比30%。意见领袖所属行业、专业与该事件本身涉及的行业、专业无关,地域分布杂乱;在行为特征上,微博转发量自36至1525不等且转发量最高的用户为草根用户;在网络特征上,核心度、中介中心性较高;在文本特征上,更多倾向于表现负面情感。

4.2.3“二次爆发类(M型)”意见领袖特征

1.标准类(“倒V”型)——西安奔驰漏油事件

西安奔驰漏油事件变换阶段前意见领袖各指标下的特征如下:

西安奔驰漏油事件变换期意见领袖各指标下的特征如下:

综合比较变换阶段前后各指标的特征变化,研究者总结三类舆情事件变换阶段的显著变化指标,详见如下表格:

3.“二次爆发类(M型)”——上海特斯拉自燃事件

上海特斯拉自燃事件变换阶段前意见领袖各指标下的特征如下:

上海特斯拉自燃事件变换期意见领袖各指标下的特征如下:

因此,用户认证类型、用户社会户属性可作为识别M型事件变换期意见领袖的指标。

4.三类舆情事件变换阶段意见领袖特质及识别指标如下所示:

参考文献

[1]陈福集,陈婷,(2015).舆情突发事件演化探析——基于意见领袖引导作用视角.情报资料工作,2,23-28.

[2]陈一新,陈馨悦,吕妍,韩铁奎,徐扬.(2020).基于改进Hegselmann-Krause模型的微博舆论反转研究.情报理论与实践,43(01),82-89.

[3]陈远,刘欣宇.(2015).基于社会网络分析的意见领袖识别研究.情报科学,33(04),13-19+92.

[4]陈月生.群体性突发事件与舆情[M].天津:天津社会科学院出版社,2005:10.

[5]方付建.突发事件网络舆情演变研究[D].华中科技大学,2011.

[6]姜珊珊,李欲晓,徐敬宏.(2010).非常规突发事件网络舆情中的意见领袖分析.情报理论与实践,33(12),101-104.

[7]姜胜洪.网络舆情形成与发展规律研究[J].兰州学刊,2010(05):77-79.

[8]蒋明敏,王雪芬,刘玥.基于LDA模型的网络舆情研究进展与演化分析[J].泰山学院学报,2020,42(02):116-124.

[9]金真婷.(2019).互联网时代下舆情反转现象的成因——以“河南高考调包案”为例.新闻研究导刊.10(24),60-61.

[10]刘毅.网络舆情研究概论[M].天津:天津人民出版社,2007:292-326.

[11]刘志明,刘鲁.微博网络舆情中的意见领袖识别及分析[J].系统工程,2011,29(06):8-16.

[13]宋海龙,巨乃岐,张备,濮小金.(2010).突发事件网络舆情的形成、演化与控制.河南工程学院学报(社会科学版),25(04),12-16.

[14]谭旭,庄穆妮,毛太田,张倩(2020).基于LDA-ARMA混合模型的大规模网络舆情情感演化分析.情报杂志.1-10.

[15]王迪,何跃.(2013).基于社会网络分析的意见领袖网结构.统计与信息论坛,28(10):84-89.

[16]王国华,张剑,毕帅辉.(2011).突发事件网络舆情演变中意见领袖研究——以药家鑫事件为例.情报杂志,30(12),1-5.

[17]王来华.舆情变动规律初论[J].学术交流,2005(12):155-159.

[18]王旭,孙瑞英.(2017).基于SNA的突发事件网络舆情传播研究——以“魏则西事件”为例.情报科学,35(03),87-92.

[19]吴江,赵颖慧,高嘉慧.(2019).医疗舆情事件的微博意见领袖识别与分析研究.数据分析与知识发现,3(04),53-62.

[20]谢科范,赵湜,陈刚,蔡文静.网络舆情突发事件的生命周期原理及集群决策研究[J].武汉理工大学学报(社会科学版),2010,23(04):482-486.

[21]徐敬宏,李欲晓,方滨兴,刘颖.非常规突发事件中网络舆情的生成及管理[J].当代传播,2010(04):41-43.

[22]晏敬东,杨彩霞,张炜南.(2017).基于生命周期理论的微博舆情引控研究.情报杂志,36(08),88-93+75.

[23]BondRM,FarissCJ,JonesJJ,etal.(2012),A61-Million-PersonExperimentinSocialInfluenceandPoliticalMobilization.Nature,489,295-298

[24]Haewoon,Kwak,ChanghyunLee,HosungPark,Sue,Moon.(2010),WhatisTwitter,asocialnetworkoraNewsMedia.//Proceedingsofthe19thInternationalConferenceonWorldWideWeb.

[25]JieZhang,Xiao-KeXu,PingLi,KaiZhang,MichaelSmall,Nodeimportancefordynamicalprocessonnetworks:Amultiscalecharacterization,Chaos:AnInterdisciplinaryJournalofNonlinearScience,21(1),016107.

[26]KatzElihu,LazarsfeldPF.(1955),PersonalInfluence;thePartPlayedbyPeopleintheFlowofMassCommunications.Glencoe,Ill:FreePress.

[27]LazarsfeldPF,BerelsonB,GaudetH.(1948),ThePeople’sChoice.NewYork:ColumbiaUniversityPress

[28]ManuelGomez-Rodriguez,JureLeskovec,AndreasKrause.(2010),InferringNetworksofDiffusionandInfluence.ACMTransactiononKnowledgediscoveryfromData,5(4)

[29]MeeyoungCha,HamedHaddadiy,Fabr′cioBenevenutoz,KrishnaP.Gummadi.(2010),MeasuringUserInfluenceinTwitter:TheMillionFollowerFallacy.//ProceedingsofInternationalConferenceonWeblogsandSocialMedia.

[30]P.Rombach,M.A.P.,J.H.Fowler,andP.J.Mucha.:‘Core-PeripheryStructureinNetworks(Revisited).SIAMReview,59(3):619–646,2017.

[31]RogersEM,CartanoDG.(1962),MethodsofMeasuringOpinionLeadership.PublicOpinionQuarterly,26(3),435-441.

[32]Rogers,E.M.(1983).Diffusionofinnovations(3rded).NewYork:TheFreePress.

[33]WangS,PaulMJ,DredzeM,etal.ExploringHealthTopicsinChineseSocialMedia:AnAnalysisofSinaWeibo[C].nationalconferenceonartificialintelligence,2014.

[34]XuG,MengY,QiuX,etal.SentimentAnalysisofCommentTextsBasedonBiLSTM[J].IEEEAccess,2019:51522-51532.

以下为所选取四个事件的LDA主题分析表格汇总,用于事件阶段划分以及选取最优核心传播者的判断。

1.上海特斯拉事件主题分析

2.母亲踢3岁女童模事件主题分析

4.西安奔驰漏油事件主题分析

1.文体明星

2.各行各业的专家学者

3.公共知识分子

主要是指那些“利用自己的专业知识,在关系到人民群众利益的问题上,积极表达自己的言论观点,引导社会舆论,推动公共舆论事件的解决"的专业人士。如韩寒、李承鹏等,他们的观点常常犀利而尖锐,对推动公共事件的发展起着关键性的作用。

THE END
1.数据清洗的重要性与技巧:提升大数据分析的准确性和效率提升模型性能:在机器学习和数据分析领域,模型的性能在很大程度上依赖于输入数据的质量。数据清洗包括特征选择和特征工程,这些步骤可以帮助模型更好地识别数据中的模式,从而提高模型的预测能力。 节省时间和资源:在数据分析的早期阶段进行数据清洗可以避免在后续阶段进行昂贵的修正。自动化数据清洗流程可以进一步节省时间和资https://blog.csdn.net/Shaidou_Data/article/details/144110971
2.数据清洗在数据分析中的作用是什么?数据清洗在数据分析中的作用是什么? 收藏 数据清洗在数据分析中扮演着至关重要的角色。数据分析是指从大量数据中提取有价值的信息和洞察力,以支持决策和推动业务发展。然而,在进行数据分析之前,对原始数据进行清洗是必不可少的步骤。 数据清洗是指检查、处理和修复数据中的错误、不一致性和不完整性,以确保数据质量https://www.cda.cn/view/204242.html
3.大数据应用导论Chapter02大数据的采集与清洗网络爬虫(Web Crawler / Web Spider)是实现互联网数据采集的主要方式,是自动下载网页并提取所需信息的程序。其运行的主要对象是网站(website)。 3.1、爬虫的作用 作为搜索引擎的网页搜集器,抓取整个互联网,比如百度等 作为垂直搜索引擎,抓取特定主题信息,如视频网站等 https://blog.51cto.com/14683590/5236225
4.批处理交换任务组件介绍亿信华辰文档中心表交换输入组件用于选择指定系统,从该系统数据库连接池中选择源表进行数据的抽取,从不同系统选择数据源以达到数据交换的目的,作为后续组件的数据来源。其他功能同表输入4.2 表交换输出 作用:表交换输出组件用于将前置组件获取到的结果集,加载到目的系统的连接池的数据库表中。https://help.esensoft.com/edition-view-1239-1.html
5.什么是数据清洗?面对常见的数据清洗问题,有哪些解决方法?(2)在机器学习和人工智能领域,数据清洗的作用主要体现在数据收集、清洗、预处理、存储和分析等方面。通过数据清洗处理不完整、错误或重复的数据,为模型训练提供高质量的数据。 二、常见的数据清洗问题及处理方法 其实,数据清洗作为数据处理的一部分,不是简单的过程,而是会面临各种各样的问题,这里给大家列举几个常见的https://www.fanruan.com/bw/article/180930
6.www.ptzfcg.gov.cn/upload/document/20180724/0279275ee54644f69.2投标人应在投标截止时间前按照福建省政府采购网上公开信息系统设定的操作流程将电子投标文件上传至福建省政府采购网上公开信息系统,同时将投标人的CA证书连同密封的纸质投标文件送达招标文件第一章第10条载明的地点,否则投标将被拒绝。 10、开标时间及地点:详见招标公告或更正公告(若有),若不一致,以更正公告(若有)http://www.ptzfcg.gov.cn/upload/document/20180724/0279275ee54644f6adb79e806e1b3734.html
7.engineering):利用领域知识和现有数据,创造出新的特征,用于文章主要介绍了特征工程的相关内容,包括特征工程的定义、重要性,以及特征理解、清洗、构造、选择、变换和降维等方面。具体涵盖了结构化与非结构化、定量与定性数据的区分,数据清洗中的数据对齐、缺失值处理、异常值处理等方法,特征构造中的统计量构造、周期值、数据分桶、特征组合,特征选择的三种形式及多种具体方法,特https://juejin.cn/post/6874516288149028872
8.数据清洗的主要手段有哪些?数据清洗是数据治理过程中非常重要的一环,它指的是对数据进行清理、筛选、去重、格式化等操作,以确保https://www.zhihu.com/question/428793497/answer/2967637109