理性看待大数据预测

浏览百度预测平台(trends.baidu.com),百度票房预测的图标是灰色的,并没有正式上线,相反,经济指数、疾病、景点和赛事预测倒已全面上线投入使用。百度票房预测模型还需进一步完善,更多参数需要加入模型,比如影片属性、片长、排片量、场均票价等全方位维度都纳入考虑。

不过,从另一个角度来看,我认为,就算是百度票房预测正式上线之后出现预测失误,也非常正常,没有谁真正拥有水晶球,大数据预测无法确定某件事情必然会发生,它更多是给出一个概率,人类只有不断地去接近这一个概率。预测的前提就是要承认不确定性的存在。在不同领域不确定性大有不同。票房、股市恰恰就是更容易受人为影响的存在大力不确定性的领域,预测的难度会大过天气、旅游、交通、物价等。

因为一部《黄金时代》预测失利便质疑大数据预测本身,或者票房预测本身,是不合理的。百度此前在世界杯期间、在黄金周期间相对漂亮的预测结果,已经证明了大数据预测的价值,只不过面对票预测房这一全新的领域,需要更耐心地优化而已。那么,票房预测在中国真的没效吗?

二、预测的精髓在于沉淀和纠偏

在《大数据预测将会改变哪些行业?》一文中,笔者总结大数据预测的逻辑基础是,每一种非常规的变化事前一定有征兆,每一件事情都有迹可循,如果找到了征兆与变化之间的规律,就可以进行预测。对于预测来说至关重要的两点是:从过往数据和经验中得到的规律,这映射到预测模型;可以实时监控的变化,映射到变量或者说实时数据。大数据预测与传统预测的不同就在于:更具时效性、新型数据源、动态性预测以及规律性依赖。

对票房预测持消极态度的首先将问题归结为数据:电影数据沉淀太少、各家网络数据不通以及脏数据问题。

1、沉淀太少是杞人忧天。

中国票房数据沉淀太少可能是客观事实。但预测需要海量历史数据的原因在于从中发现规律。但倘若只有100年的票房数据,却并没有与影响这些票房数据的变量数据,对于挖掘规律其实并无帮助。

一个例子是百度在做世界杯预测时便与第三方数据公司合作得到大量历史数据进行挖掘,将球队、队员、场地等静态因素考虑在内同时引入舆情、欧赔指数等动态变量,最终实现接近准确的预测。

大数据预测的数据源优势正是在于它可以更全面及时地记录数据,并且收集到过往完全无法收集的数据比如用户的需求、舆情、情绪变化,或者说出行规律、电影票价、影院排期数据。因此与其去担忧传统数据沉淀不足还不如思考票房预测究竟需要哪些数据,究竟如何才能提升规律?

2、数据不通和脏数据是永恒问题。

网络数据不通是整个互联网都要面临的数据鸿沟问题,没有哪一家拥有全网的数据,聚合全网数据进行预测几乎是不可能完成的任务,况且这根本没任何必要。如果说社交网络数据对预测很重要,那么中国只有腾讯才可能做好预测实际并没有做。阿里淘宝指数已成为电商销量风向标、百度搜索指数对于各行各业同样具有重要的参考意义,因为它表征兴趣。每家掌握数据的性质不同,但确实可通过合作去得到更多维度的数据,最终提升预测可靠性,但要各家直接打通数据壁垒是不现实的。

同理,脏数据以及噪音是整个互联网永远存在的现象,就算是传统的采样调研难免也会遇到噪声样本进而被干扰。应对这个问题只有尽量过滤噪音数据,同时考虑到噪音对模型进行不断地纠正,并且增大预测结果的误差范围。还有一个假设是,如果有脏数据对结果起到积极作用(比如让票房成绩更好),同样会有脏数据对结果起到消极影响。

3、影院经理不是预测而是影响票房。

影院经理确实可预测对应影院某部电影的票房结果。如果他们掌握拍期权甚至还可以直接影响、决定对应电影的局部票房。所有影院经理最终会对整体票房造成莫大的影响。这并不是一个因果关系,而是环环相扣:影院经理在预测票房的同时也影响着票房。

这里想说明的是,将参与者与预测者放在一起本身就不合适,参与者是十分重要的动态变量。《黄金时代》出现如此惨淡的票房很大程度便是票房经理不断降低预期进而减少排片所致。不过,百度未来与影院或者票房经理合作倒确实可以提升预测准确率,一方面在线下升级模型,另一方面将票房经理的排期计划纳入监控范围,把百度数据+工程师的大数据预测升级为众包式的票房预测,倒有可能。

最后我想说的是,因为一部电影的预测失利否定大数据票房预测确实有待商榷,天气预报不断地沉淀不断地升级才能做到今天的准确率以及精细化,但仍有不准的时候,在影响我生活时我也曾愤怒地认为天气预报不考虑,但大家都知道事实并非如此。票房预测刚刚开始,或许应该得到更多包容。从长远来看,通过不断的优化,如果票房预测产品最终能够达到一定的准确度,那么对于整个电影产业将会提供非常重要的参考价值,比如对投资方、拍摄方、推广方提供更准确的数据参考,从而引导他们在宣传推广、剧情设置甚至是甄选演员等方面做出更加准确、有利的判断。

THE END
1.大数据预测分析的四个关键因素预测分析的关键点有哪些大数据预测分析(Big Data Predictive Analytics)可谓是大数据的圣杯,也是众多数据分析人士的终极梦想。谁不想帮助企业做出英明的业务决策、卖出更多商品和服务、让客户更开心同时避免灾难的发生呢?但是预测分析同时也是一个极端困难的任务,实施成功的预测分析有赖于以下四大关键因素: https://blog.csdn.net/xinxing__8185/article/details/46470067
2.大数据分析预测需求.docx大数据分析预测需求.docx 26页内容提供方:布丁文库 大小:41.09 KB 字数:约1.21万字 发布时间:2024-06-28发布于浙江 浏览人气:4 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)大数据分析预测需求.docx 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 https://max.book118.com/html/2024/0627/8067071040006104.shtm
3.大数据预测性分析大数据预测性分析:洞察未来趋势的关键 随着大数据时代的到来,大数据预测性分析成为越来越多企业重要的战略工具。通过利用大数据技术和分析工具,企业可以更准确地预测未来趋势,从而优化决策和资源分配。本文将探讨大数据预测性分析的重要性、应用领域以及实施策略。 http://www.ntqsjj.com/zhxy/54127.html
4.大数据分析能否预测未来趋势为决策提供依据大数据分析能否预测未来趋势为决策提供依据 大数据时代,一个充满了无限可能的新纪元。随着技术的飞速发展,大数据已经渗透到了我们生活的每一个角落,从金融服务到医疗保健,再到日常消费,它都在发挥着其巨大的影响力。然而,这一时代也带来了新的挑战:如何利用这些数据来预测未来的趋势,为决策提供依据?这一问题是我们今天https://www.jvahvb5c.cn/shou-ji/487055.html
5.预测分析和大数据分析的终极指南数据分析根据IBM公司的研究,大数据预测分析属于高级分析。它能够借助历史数据、统计建模、数据挖掘和机器学习预测未来结果。企业使用预测分析,借助于可以预测的数据模式,了解其风险和机遇。 预测分析也属于大数据和数据科学。如今,企业使用事务性数据库数据、设备日志文件、图像、视频、传感器和其他数据源来获取见解。企业可以借助深度https://www.d1net.com/bigdata/analysis/571788.html
6.一分钟攻略#加拿大28大数据分析预测网(2024平台推荐依托加拿大28大数据分析预测网大数据平台的专业分析,我们通过历史开奖数据和走势的精确分析,致力于为用户提供最专业的预测服务前10月中国市场手机出货量2.5亿部 同比增8.9% 中新社北京11月27日電 (記者 劉育英)中國信息通信研究院27日發佈的數據顯示,今年前10個月,中國市場手機出貨量2.5億部,同比增長https://m.dslyy.com/patt1128i74IB-PoZG
7.每天1分钟加拿大28大数据分析预测网(2024排行榜加拿大28大数据分析预测网 加拿大pc28二维码 采用加拿大28大数据分析预测网与GPT-4.0+AI智能模型,提供最精准的预测和查询服务,聚焦专业研究和算法创新,力求打造最优质的查询平台(高质量发展调研行)苏轼云“一日不可无此君”,“此君”何以育一方?https://www.ccgx.gov.cn/mahjZp11130.aspx
8.大数据三大分析类型解析:描述性,预测性,规范性分析慧都智能制造大数据革命催生了不同种类,类型和阶段的数据分析。在本文中,就将探讨三种不同类型的分析-描述性分析,预测性分析和描述性分析-来了解每种类型的分析可以提供什么以改善组织的运营能力。 描述性分析 如今,90%的组织使用描述性分析,这是分析的最基本形式。定义描述性分析的最简单方法是回答问题“发生了什么?”。这种类https://bigdata.evget.com/post/16976.html
9.大数据分析技术时间序列分析在金融市场预测与销售趋势分析中的应用大数据分析技术是利用先进的计算机和数据处理技术,对海量、多样化和高维度的数据进行分析和挖掘,从中获取有价值的信息和知识。它可以帮助企业更好地理解市场,预测趋势,优化销售策略,提高营销效率。 大数据分析技术的核心作用 大数据分析技术通过数据挖掘、机器学习、人工智能等手段,对海量数据进行深入分析,从而为企业提供更准https://www.jianshu.com/p/76d2e2517e7e
10.如何利用大数据分析来预测和应对市场风险?利用大数据分析来预测和应对市场风险是一种先进的方法,可以帮助公司更好地制定战略和管理风险。以下是一些步骤和方法,可以帮助公司有效利用大数据分析来预测和应对市场风险:1. 数据收集和整理:收集与市场风险相关的各种数据,包括市场趋势、竞争情报、消费者行为等。整理和清洗数据,使其适合分析。2. 数据分析:利用数据分析https://www.chinaacc.com/zhucekuaijishi/jhwd/zy20231128113440.shtml
11.大数据决策分析——数据建模与预测(豆瓣)本书将大数据分析用于管理实践与政策评估中的多个应用场景,运用管理学、数据科学、系统工程、交通工程、统计学、数学等不同学科的分析模型和研究方法,实现多学科的深度交叉融合,促进数据建模与预测科学的发展。 本书的研究内容将有助于提升管理者的决策能力和创新效率,揭示决策范式转变的机理与规律,开展以决策支撑为导向https://book.douban.com/subject/36469184/
12.什么是大数据分析?MicrosoftAzure通过本指南了解云中的大数据分析。了解大数据如何实现更全面、更明智的决策方法。https://azure.microsoft.com/zh-cn/resources/cloud-computing-dictionary/what-is-big-data-analytics
13.百家争鸣:2019大数据预测观点数据观中国大数据产业观察Fractal analytics的战略顾问、董事会成员道格?希拉里(Doug Hillary)表示,(未来)分析有足够的空间去影响日常业务的方方面面。 【数据观注释】Fractal Analytics组建于2000年,致力于为企业(消费品公司、零售商和金融机构)提供理解、预测和培养消费者行为,及改善市场营销、定价、供应链、风险管控和索赔管理的工具。 https://www.cbdio.com/BigData/2019-01/07/content_5978881.htm