摘要:尽管学界对信息茧房的危害有所共识,但对于“算法导致信息茧房”一直存有争议,也缺乏实证研究的结论佐证。桑斯坦所述的信息茧房更像是半预言式的隐喻,使之至今没有一个清晰和准确的量化研究框架,极大影响了算法与信息茧房的关系探讨。本文剖析了信息茧房的公认特征,从渠道和内容两个方面,分析当前算法型媒介的使用对用户媒介多样性和信源信任的影响。研究发现,用户的信息接收渠道不仅未窄化,对传统媒体等非算法型信源的信任程度还有所提升,反倒是收入和学历等社会性差异导致的信息鸿沟值得警惕。事实证明,算法并没有导致信息茧房,而是在主流价值观的引导上发挥了积极作用,为个体提供了更多元和理性的信息世界。
关键词:算法;信息茧房;媒介多样性;信源信任
喻国明:教育部长江学者特聘教授、北京师范大学新闻传播学院执行院长、中国新闻史学会传媒经济与管理专业委员会会长;方可人:北京师范大学新闻传播学院博士后。
一、研究背景
信息茧房(InformationCocoons)是美国学者凯斯·桑斯坦(CassR.Sunstein)在《信息乌托邦——众人如何生产知识》中提出的概念,即用户在海量信息中只选择感兴趣和悦已的主题,从而构成一套“个人日报”式的信息系统,进而排斥或无视其他观点与内容。[[1]]长期以往,这将阻碍个体信息的全面发展,阻断观点的自由交流,形成所谓“回声室”(EchoChamber)效应,并导致群体极化(GroupPolarization),威胁社会民主的基石(Sunstein,2002)。[[2]]
信息茧房被视为数字时代高度个性化信息服务不可避免的“副作用”。随着算法推荐成为信息分发的重要途径与方式,有一种说法甚嚣尘上,即算法加剧了信息茧房的产生与泛化。人民日报曾经三评算法推荐,指出算法自动过滤“不感兴趣”“不认同”的异质信息,久而久之,信息接收维度变窄,资讯获取渠道单一。[[3]]如今,算法几乎根植于所有主流移动应用中,社交媒体推荐着趣味相投的朋友,音乐APP自动播放喜爱的音乐,电商网站提示着昨晚电影中的“明星同款”,用户似乎在毫无觉察下已被包裹进个体与机器共筑的温柔却严丝合缝的茧蛹。
然而,需要注意的是,桑斯坦所述信息茧房更像是半预言式的隐喻,并未做更深入的研究和系统性论述。因此,尽管学界对信息茧房的危害有所共识,但是信息茧房存在条件是什么?算法是否必然导致信息茧房?却难有实证研究作为佐证。这使得信息茧房至今没有一个清晰和准确的研究框架,极大影响了“信息茧房”的观测与认知,也不利于客观审视算法与“茧房”的关系。基于此疑问,本文对算法是否导致信息茧房进行了实证探索。
二、研究假设的提出
由于缺少直接观测信息茧房的量表,所以需对信息茧房的公认特征进行剖析。回顾既有研究,通常认为,陷入“信息茧房”的用户会有如下状态:
一是信息接收渠道的收窄和固化。
互联网尤其是移动互联网的发展,为公众提供了高度自由的媒介环境,使得个体在媒介使用上享有空前的自治(UweHasebrink等,2012)[[4]]。用户根据特定场景的特定需求,可自由选择媒介,并组成个体独有的媒介生态系统。
在信息供给端,当前,传统媒介、社交型媒介、算法型媒介等不同模式的传播渠道并存。不同媒介的信息分发各有侧重,满足着用户不同维度的信息需求。例如倚重人工的传统媒介,强调社会共性信息解决,通常扮演了“压舱石”的角色。而社交媒介则成为各类偶发性信息与意见交换的重要场所。因此,媒介使用的多样性意味着用户有机会接触到不同的信息与观点,为了解和评估事实提供了多维度的参照。而政治传播的研究也证实,媒介多样性会提升用户的政治素养(DamHeeKim,NojinKwak,2017)[[5]],并消除党派偏见(ElizabethDubois,GrantBlank,2018)[[6]]。有调查结论则反映,2019年,仅有2%的美国人是靠单一渠道获取资讯,大多数用户会倾向于采用多种媒介来获取新闻内容(RasmusKleisNielsen,Newman等,2019)[[7]]。
基于此,本文提出假设:
H1算法型媒介的使用频率负向影响媒介多样性
二是对特定信息偏听偏信。
在信息茧房中,“每个人的世界图景都只是他们所希望看到的,而不是世界本来应该拥有的样子”。基本上人们提到信息茧房时,都会涉及到信息偏食导致的视野局限,以及由此对观念、态度与决定等的影响(彭兰,2020)。[[10]]
霍夫兰很早就在个体差异论中指出,由于个体在需求、信念、价值观、态度上的认知结构差异,相同的大众传播内容在受众之间会产生不同的效果,受众倾向于接触与原有态度较为一致的信息,而尽量回避那些与己见不合的信息,即所谓信息的选择性注意和理解。而认知均衡理论认为,网络带来了信息大爆炸,面对复杂纷乱的信息,人们容易感到无所是从,为缓解心理焦虑,往往根据个人喜好或既有经验进行筛选和过滤,以保持认知的平衡。技术忧虑者担心算法推荐加剧了上述心理认知,用户将信息选择的权力交给算法,算法根据用户惯习投其所好,形成所谓“过滤气泡”(filterbubble)”。
但一些观点认为,用户对于不同信源的信任程度并不一致,用户未必就相信自己日常接触的媒体。例如,一项跨国研究证明,在所有媒介类型中,用户对社交媒体的信任程度却是最低的(Dutton,2017)。[[11]]在面对重要的社会议题时,用户还是更依赖主流媒体和人际传播(Dubois,2015)。[[12]]因此,有必要考察算法媒介是否真对其他信源尤其是传统媒介的信任造成影响。
本文提出假设:
H2算法型媒介的使用频率会正向影响算法型信源的信任
H3算法型媒介的使用频率会负向影响非算法型信源的信任
H3a算法型媒介的使用频率会负向影响传统媒介的信任
本研究样本全部来自于研究组专项课题《2019年全民媒介接触与使用暨媒介价值观调查》数据。项目主要采用问卷调查法,意图调查不同类型的用户在使用媒介上的差异和原因。参照国家统计局标准对全国实际人口情况划分抽样比例,参考CNNIC最新的第43次《中国互联网络发展状况统计报告》对样本的人口统计学特征做了配额设计,制定从一线城市到五线城市的社区入户分层抽样方案,共访问包含北京、上海、重庆、合肥、昆明、周口、长治等45个城市,共回收有效样本为4631份。
从大样本中提取使用典型算法类资讯APP——今日头条的用户作为最终研究样本(注:对象在问卷题项‘您在过去一周内打开过哪些APP’中勾选了‘今日头条’选项),研究样本数为926份。
在本研究中,选择性别、年龄、婚姻、教育程度、收入水平以及所在城市6个指标作为控制变量。样本中使用今日头条的用户基本情况如表1所示。
表1控制变量的基本构成
变量/%
构成
性别
男(56.1%)
女(43.9%)
年龄
00后(6.3%)
90后
(23.3%)
80后(28.3%)
70后
(24%)
70前
(18.1%)
婚姻
未婚(23.3%)
已婚(76.79%)
教育程度
本科以下(89.6%)
本科及以上(10.4%)
收入水平
<2万(5.5%)
2万-5万(16.6%)
5万-10万(36.8%)
10万-30万(33%)
30万以上(8.2%)
所在城市
三线及以下(22.14%)
二线城市
(27.65%)
新一线城市(36.07%)
一线城市(14.15%)
注:n=926,各定类变量赋值从左至右为1和2,各定序变量赋值从左至右为1、2、3…升序
(二)操作方案
表2因变量与关健自变量的描述性统计
均值
标准差
媒介多样性
5.710
2.558
信源信任程度
传统纸媒
3.796
0.724
传统电子媒体
3.760
0.752
微博
3.354
0.725
3.343
0.769
社区论坛
3.340
0.778
算法型新闻APP
3.734
0.685
今日头条的使用频率
3.871
1.008
四、数据分析
研究采用多元层次回归分析,首先对因变量做正态分布检验,采用K-S检验,各变量峰度的绝对值小于10且偏度的绝对值小于3,因此样本基本符合正态分布,各因变量可纳入回归分析环节。
(一)控制变量对因变量的影响
而在信源信任程度上,女性对社区论坛和算法型新闻APP的信任程度更高;用户年龄越小,对微博的信任程度越高;收入水平则对传统纸媒和传统电子媒体的信任程度影响显著。其他控制变量对信源信任影响均不显著,这使得该部分的调整R2值较低。
表3各控制变量对媒介多样性和信源信任程度的影响
-0.104
0.032
-0.004
0.027
0.006
0.134*
0.133***
-0.217***
-0.014
0.003
-0.064***
-0.016
0.025
-0.598***
-0.023
0.076
-0.064
-0.026
0.047
-0.071
0.565**
-0.091
-0.082
-0.031
-0.052
-0.021
0.457***
0.086***
0.055*
0.029
0.012
0.007
0.020
0.035
-0.015
0.008
0.016
0.024
0.010
0.023
调整R2
0.071
0.009
0.002
0.014
-0.002
0.004
备注:*p<0.05,**<0.01,***<0.001
(二)关健自变量对因变量的影响
将今日头条的使用频率纳入第二层回归。结果发现,其使用频率并未对各控制变量的显著性造成太大影响,并对个体媒介多样性的影响不显著。这证明假设H1不成立,用户频繁使用算法型媒介并不会降低用户的媒介总体接触数量。可见媒体型分发模式和关系型分发模式在算法面前并未失效,三者共同匹配了用户多层次、宽领域的资讯使用需求。而在信源信任程度上,今日头条使用频率对算法型新闻APP信任程度产生显著影响,R2值有所提升,这证明假设H2成立。但其使用频率并未对其他类型信源信任程度造成负影响,假设H3并不成立,用户并未对非算法型信源存在态度偏见。
实际上,今日头条的使用频率还提升了传统电子媒体和社区论坛的信任程度,因此H3a不成立。随着媒介的深度融合,有相当多的传统媒体以PGC(ProfessionalGeneratedContent)内容提供者的身份入驻新闻聚合平台,在涉及重要社会内容的报道与处理上引导公众价值。尽管没有了过去的渠道垄断优势,但通过算法推荐,传统媒体可以更精准地匹配用户,并凭借新闻专业主义赢得了公众尊重。有研究亦指出,在谷歌新闻算法推荐最多的内容中,有69%是来自于5家专业新闻机构,谷歌新闻的议程设置更像是对传统媒体的复制而非颠覆(EfratNechushtai等,2019)。[[13]]
而百度贴吧、豆瓣等社区论坛则是用户话题深挖的端口。以信息流为主的算法型媒介侧重于话题的密集触达,通常信息面广但深度不足。当前算法技术也无法有效判断同类型资讯对于用户是否重复或互为补充。因此,用户通过算法获得信息要点后,社区论坛则满足了用户寻找“新闻背后的新闻”,以获取更详尽的信息文本。由此可见,人们对高质量的内容的追求在任何时代都是亘古不变的真理。
表4今日头条使用频率纳入回归后的影响结果
-0.103
0.033
-0.000
0.048
0.139**
0.137***
-0.219***
-0.066***
-0.022
0.019
-0.597***
0.077
-0.079
-0.048
-0.017
0.458***
0.087***
0.059*
0.030
0.017
0.011
今日头条使用频率
0.018
0.052*
0.021
0.064*
0.059***
0.070
0.005
0.013
0.000
(三)复核校验
考虑到不同APP所采用的算法类型和推送系统都不一致,为确保结论的稳定性,本研究从原始大样本中提取腾讯新闻APP的用户(n=719)做复合校验,腾讯新闻在图文、视频、音频、话题、问答等内容模块均涉及算法推送。结果显示,腾讯新闻使用频率同样不影响媒介的多样性。且在信源信任程度上,其使用频率对传统纸媒(β=0.072*)和传统电子媒体(β=0.096**)的信任均有正向影响。
五、研究结论与探讨
综上,假设的论证结果如表5所示。
表5各假设结论
假设
内容
结果
H1
算法型媒介的使用频率负向影响媒介多样性
不成立
H2
算法型媒介的使用频率会正向影响算法型信源的信任
成立
H3
算法型媒介的使用频率会负向影响非算法型信源的信任
H3a
算法型媒介的使用频率会负向影响传统媒介的信任
上述研究证明,算法的技术忧思被人为夸大,算法并没有导致“信息茧房”,反而在主流价值观的引导上发挥了积极作用,并为个体提供了更多元和理性的信息世界。与所有新技术一样,算法推荐并不是一成不变的。以今日头条为例,从2012年9月第1版开发运行,已经经过四次大的调整和修改。算法型信息分发在不断迭代中提升着“有边界的调适”,并增强了其社会的适应度与合法性(喻国明,杜楠楠,2019)。[[14]]在人工智能主导信息分发的时代,所谓把关的权力并未轻易让渡给智能算法,而是通过开放算法原理、加强人工审核、优化推荐系统、引入专业内容生产团队,为算法持续注入了人本与理性的价值。
参考文献
[[1]]凯斯·桑斯坦.信息乌托邦——众人如何生产知识[J],毕竞悦译,北京:法律出版社,2008年版
[[2]]Sunstein,C.TheLawofGroupPolarization[J].JournalofPoliticalPhilosophy.2002,10(2):175-195.
[[3]]乙智.“尖叫效应”与“信息茧房”[N/OL].人民网.[2018-5-2][2018-5-3].
[[4]]HasebrinkU,DomeyerH.MediaRepertoiresasPatternsofBehaviorandasMeaningfulPractices:AMultimethodApproachtoMediaUseinConvergingMediaEnvironments[J].JournalofAudience&ReceptionStudies,2012,9(01):757-783.
[[5]]Kim,DamHee,Kwak,Nojin.MediaDiversityPoliciesforthePublic:EmpiricalEvidenceExaminingExposureDiversityandDemocraticCitizenship[J].JournalofBroadcasting&ElectronicMedia,2017,61(4):687-702.
[[6]]Dubois,Elizabeth,Blank,Grant.Theechochamberisoverstated:themoderatingeffectofpoliticalinterestanddiversemedia[J].2018,21(5):729-745.
[[7]]KleisNielsen,R,NicNewman,N.,Fletcher,R.,Kalogeropoulos,A.ReutersDigitalNewsReport[R].Oxford:ReutersInstitutefortheStudyofJournalism,2019.
[[8]]果壳网.被算法量产的“沉迷”[EB/OL].[2018-4-17][2020-1-12].
[[9]]Sukhodolov,AlexanderP.,Bychkova,AnnaM.etc.JournalismFeaturingArtificialIntelligence[J].TheoreticalandPracticalIssuesofJournalism,2019.8(4):647-667.
[[10]]彭兰.导致信息茧房的多重因素及“破茧”路径[J].国际新闻界,2020(1):270-278.
[[11]]Dutton,W.,Reisdorf,B.,Dubois,E.,Blank,G.SearchandPolitics:TheUsesandImpactsofSearchinBritain,France,Germany,Italy,Poland,Spain,andtheUnitedStates[R].NewYork:SocialScienceElectronicPublishing,2017.
[[12]]ElizabethDubois.Thestrategicopinionleader:Personalinfluenceandpoliticalnetworksinahybridmediasystem[D].Oxford:UniversityofOxford,2015.
[[13]]EfratNechushtai,SethC.Lewis.WhatkindofnewsgatekeepersdowewantmachinestobeFilterbubbles,fragmentation,andthenormativedimensionsofalgorithmicrecommendations[J].ComputersinHumanBehavior,2019(90):298-307
[[14]]喻国明,杜楠楠.智能型算法分发的价值迭代:“边界调适”与合法性的提升——以“今日头条”的四次升级迭代为例[J].新闻记者,2019(11):15-20.
[[15]]喻国明,陈艳明,普文越.智能算法与公共性:问题的误读与解题的关键[J].中国编辑,2020(05):10-17.
[[16]]祝建华.数码沟指数之操作定义和初步检验[M].汕头大学出版社,2002:203-211.
[[18]]喻国明,韩婷.算法型信息分发:技术原理、机制创新与未来发展[J].新闻与传播研究,2018(04):8-12.
[[19]]喻国明,杨莹莹,闫巧妹.算法即权力:算法范式在新闻传播中的权力革命[J].编辑之友,2018(05):5-12.