《财务大数据基础》课件项目3财务大数据清洗.pptx

财务大数据基础数据采集内容回顾数据采集调查问卷的要素和注意事项同时采集多个Excel文件多家上市公司财务数据的采集调查问卷采集EXCEL文件采集Web文件采集项目二回顾项目二展示

财务大数据清洗任务一数据清洗认知任务二数据类型规范任务三

数据清洗30招任务四

数据清洗运用任务五项目实训(PowerBI数据清洗)任务一数据清洗认知

数据清洗概念数据清洗:重新检查和验证数据的过程,旨在删除重复信息,纠正现有错误并提供数据一致性。脏数据高质量数据任务一数据清洗认知

数据清洗作用数据搬运工?EXCEL四步曲获取数据汇总数据(表格)数据透视表分析趋势及原因任务一数据清洗认知

数据清洗作用80%数据处理80%数据分析处理的数据量较大(千万);最小的处理单元是行和列(批量处理思维);有操作过程记录(关键)任务一数据清洗认知

数据清洗——PowerBIPowerBI采集的数据是从多个渠道抽取而来原始数据,避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏数据”。任务一数据清洗认知PowerQuery介绍

PowerQuery是微软的数据连接和数据准备技术,使业务用户能够无缝访问存储在数百个数据源中的数据,并通过易于使用、引人入胜且无代码的用户体验来对其进行调整以适应他们的需求。任务一数据清洗认知

PowerQuery认知——进入PQPowerQuery入口如果还没有任何数据,在PowerBIDesktop中,点击获取数据,选择相应的数据格式导入后,就可以进入PowerQuery编辑器;如果已经导入数据,想再次进入查看或者编辑,可以点击上图中的“转换数据”进入。任务一数据清洗认知

PowerQuery认知——PQ界面功能区包含“文件”“主页”“转换”“添加列”“视图”“工具”。1.“文件”菜单:关闭并应用:关闭查询编辑器并应用所做的更改。应用:应用所做的更改,但不关闭查询编辑器。关闭:关闭查询编辑器。保存:保存当前所做的更改。

2.“主页”选项卡:提供常见的查询功能。任务一数据清洗认知

PowerQuery界面——功能区任务一数据清洗认知

PowerQuery应用步骤区记录了在PowerQuery的每一步操作,主要作用是可以对操作的步骤进行删除和修改。PowerQuery界面——应用步骤区任务一数据清洗认知(1)可以修改之前的操作,其中带有设置标记“齿轮”的,都是可以更改的。(2)可以删除某一个步骤。单击步骤旁边的“×”按钮,就可以删除该步骤。(3)可以移动步骤,互换顺序。在进行这个操作时,需要注意前后操作可能出现的冲突。(4)这个“应用的步骤”面板复制了我们的操作,当更新数据后,只需要单击“刷新”按钮,所有的步骤都会从头到尾全自动化地操作一遍,不再需要做重复的工作。PowerQuery界面——应用步骤区

数据类型残缺数据——空值——删除、替换或补充错误数据——异常值——删除或补全重复数据——删除任务二数据类型规范

数据类型任务二数据类型规范“视图”选项卡——数据概览任务二数据类型规范

数据清洗第1招——提升标题任务二数据类型规范

数据清洗第2招——行列操作删除列删除行任务二数据类型规范

数据清洗第3招——更改数据类型任务二数据类型规范

数据清洗第4招——检测数据类型任务实施

每位同学使用PowerBI软件对老师发给大家的“资产负债表1”

进行处理。任务二数据类型规范

任务二数据类型规范

维度:一种“属性、范围、系数、承受能力”意思的包涵。在不同的对象指代不同的意思。——百度汉语一维表与二维表任务二数据类型规范一维表:仅靠单行就能锁定全部信息。二维表:需要行和列来定位数值的。一维表与二维表一维表二维表任务二数据类型规范一维表与二维表一维表是符合数据库设计规范,数据丰富详实,适合做流水账,方便存储,有利于做统计分析;二维表特点是明确直观,适合打印、汇报。哪一种类型的表格适合作为源数据进行数据分析?字段——列为单位属性一维表——数据分析任务二数据类型规范

数据清洗第5招——逆透视逆透视列的逆透视,是把二维表转换到一维表的过程将表中的列换成了值透视任务二数据类型规范任务实施

同学在新浪财经网址上采集一家公司的资产负债表,并将采集到的数据转换为一维表。网址如下:/corp/go.php/vFD_BalanceSheet/stockid/002269/ctrl/2020/displaytype/4.phtml采集不同公司或年度的数据只需替换上述网址中的股票代码或年份即可。

数据类型残缺数据——空值——删除、替换或补充错误数据——异常值——删除或补全重复数据——删除课前回顾一维表:仅靠单行就能锁定全部信息。二维表:需要行和列来定位数值的。

通过处理“资产负债表2”

复习清洗小招数:课前回顾第1招——提升标题第2招——逆透视第3招——替换值第4招——检测并更改数据类型第5招——删除错误/空值任务二数据类型规范

数据清洗第6招——替换值“–”替换为“0”任务二数据类型规范

数据清洗第7招——删除错误/空值右键删除错误筛选-去掉null勾选任务三数据清洗30招数据清洗运用场景讨论:假如你是某公司数据分析人员,表格中存在哪些数据问题?任务三数据清洗30招数据清洗运用场景任务三数据清洗30招

1汇总文件夹数据2第一行用作标题3筛选删除重复表头4删除列5删除重复项目6删除空白项目7数据格式调整8检测数据类型9替换10填充11移动12拆分13重命名14提取分隔符之前的文本15修整格式16格式-首字母大写17排序18逆透视(余下了解)19条件列20索引列21重复列22

THE END
1.刘伟峰教你轻松处理大数据中的“零”CCF短视频刘伟峰带你了解:块指针数组的秘密 CCF短视频 免费 刘伟峰:苹果M1 vs 英特尔i9,谁更强? CCF短视频 免费 2014中国大数据技术与产业发展报告 2013中国大数据技术与产业发展报告 中国大数据技术与产业发展报告 评论 共0条评论 发表 作者 CCF短视频 摘要 不想被数据中的“零”困扰?刘伟峰讲解如何通过三元组方式https://dl.ccf.org.cn/video/videoDetail.html?id=7290591089526784
2.浪潮云申请基于大模型的数据清洗方法专利,能够提高数据清洗的效率浪潮云申请基于大模型的数据清洗方法专利,能够提高数据清洗的效率 快报金融界灵通君 北京 0 打开网易新闻 体验效果更佳统一台湾后,我国这四处领土必须收回,个个都是战略要地! 闲聊新知 515跟贴 打开APP 人类为啥要褪去全身毛发?却保留了头发、腋毛和阴毛? 李论科学 1268跟贴 打开APP 坦克打战列舰 哈哈社V 880https://3g.163.com/v/video/VPI9R6C53.html
3.最准一码一肖100%凤凰网,实地验证数据计划Surface76.1701. 实时性:该计划能够实时收集和分析数据,为用户提供最新的投资建议。 2. 准确性:通过专业的数据清洗技术和人工智能算法,该计划能够确保数据的准确性,提高预测的可靠性。 3. 全面性:该计划涵盖了金融、股票、期货等多个领域,能够为用户提供全方位的投资建议。 http://www.bxkxdz.com/post/19094.html
4.官方正版数据清洗当当聚英汇图书专营店在线销售正版《【官方正版】数据清洗-微课视频版 黄源 大数据与人工智能技术数据清洗数据处理聚英汇图书》。最新《【官方正版】数据清洗-微课视频版 黄源 大数据与人工智能技术数据清洗数据处理聚英汇图书》简介、书评、试读、价格、图片等相关信息,http://product.dangdang.com/11914194031.html
5.大数据分析:Python爬虫数据清洗和数据可视化(第2版·微课视频版大数据分析:Python爬虫、数据清洗和数据可视化(第2版·微课视频版)(大数据与人工智能技术丛书)的书评 ···(全部 0 条) 论坛· ··· 在这本书的论坛里发言 当前版本有售· ··· 当当网 44.10元 购买纸质书 中图网 38.30元 购买纸质书 + 加入https://book.douban.com/isbn/978-7-302-60523-2/
6.大数据分析:Python爬虫数据清洗和数据可视化:微课视频版Python数据分析与可视化 :微课视频版 作者:魏伟一 ISBN:9787302546665 出版社:清华大学出版社 出版年:2020 Python与数据分析及可视化 :微课视频版 作者:李鲁群 ISBN:9787302595960 出版社:清华大学出版社 出版年:2022 Python 3爬虫、数据清洗与可视化实战 作者:零一 ISBN:9787121391187 出版社:电子工业出版社 出版年:https://www.las.ac.cn/front/book/detail?id=594ac25d1404c3d28fd6e0485e0cfd9b
7.数据清洗——黄源涂旭东罗少甫编著2)包含丰富的教学资源,本书配有微课视频、教学课件、习题答案等。 3)紧跟时代潮流,注重技术变化,书中包含了*新的大数据分析知识及一些开源库的使用。 4)编写本书的教师都具有多年的教学经验,重难点突出,能够激发学生的学习热情。 《数据清洗》主要介绍数据清洗技术的基本概念与应用。全书共有8章,分别讲述了数据清洗http://www.cmpedu.com/books/book/5602376.htm
8.数据采集与预处理(微课版)图书本书详细阐述了大数据领域数据采集与预处理的相关理论和技术,全面讲解了数据采集与预处理的全流程及在多领域的应用案例。本书共8章,包括数据采集与预处理概述、数据采集与存储、数据采集进阶、数据清洗、数据规整与分组聚合、豆瓣电影排行榜数据采集与预处理、使用Scrapy框架与Selenium采集股市每日点评数据并可视化、房产数https://www.ryjiaoyu.com/book/details/45985
9.清华大学出版社图书详情数据处理实践教程(微课版)本书内容设置比较丰富,以案例教学为导向,所有例子都配有相应的操作视频。 提供课件、咨询QQ:2301891038(仅限教师)。作者:刘小丽、温金明、王肃、胡彦、梁里宁、杜宝荣 丛书名:面向新工科专业建设计算机系列教材 定价:49元 印次:1-4 ISBN:9787302599999 出版日期:2022.02.01 印刷日期:2024.07.http://www.tup.tsinghua.edu.cn/booksCenter/book_09097101.html
10.Excel财务数据分析与可视化(微课版).pdf赵萍2022年版Excel财务数据分析与可视化(微课版).pdf-赵萍 -2022年版-人民邮电出版社 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 本书以Excel为数据分析工具,设置71个工作案例和96个财务分析决策模型,从数据采集与规范化处理开始,通过企业真实决策案例,由浅入深地介绍了财务数据分析建模和实施,到最终形成https://max.book118.com/html/2022/1027/8122022045005006.shtm
11.Python十大经典练手项目,让你的Python技能点全亮!练习目标:业务逻辑分析/Model层开发/商品首页后端数据渲染/用户个人页面管理/购物车功能完善/视频传输权限与协议/超级管理员的创建/后台管理首页显示设置/模型数据可视化操作/分类过滤与模糊查询/数据可视化页面的优化 爬取数据展示: 项目七 服务器日志数据清洗分析 https://blog.csdn.net/m0_59163425/article/details/130368639
12.船舶应用范文12篇(全文)制作微课的一般顺序:选择整理教学内容;按照采用哪种制作技术确定微课类型(以录屏技术为主体微课或以拍摄技术为主体微课);构思微课教学活动(课堂教学,现场教学,实践性教学,理论性教学,有无学生出镜);按照教学内容编写微课稿本(讲稿);按照讲稿实施微课媒体联姻设计;制作、寻找媒体资源,建立微课资源包(图片视频音频动画);创https://www.99xueshu.com/w/ikeykghjsteq.html
13.发动机拆装实训报告(精选6篇)3.学习正确使用拆装设备、工具、量具的方法。4.了解安全操作常识,熟悉零部件拆装后的正确放置、分类及清洗方法,培养良好的工作和生产习惯。5.锻炼和培养学生的动手能力。实训要求: 1.学会汽车常用拆装工具和仪器设备的正确使用。 2.学会汽车的总体拆装、调整和各系统主要零部件的正确拆装。3.学会汽车的主要零部件的检https://www.360wenmi.com/f/filee6f5sgbx.html
14.数据清洗的基本方法本微课程是数据采集与分析技术的学习资源,讲授了数据清洗的基本方法,主要包括解决数据质量问题、让数据更适合做挖掘或者展示、标准流程等内容。,5分钟微课网 微课改变学习 学习改变人类http://www.5minutes.com.cn/Web/Course/CourseDetail.aspx?id=99912700-1316-469c-8cf1-b41fd4a97d25
15.星空app官方版官方版下载星空app官方版2024最新版下载2024-12-11 01:26:52 HOT【 星空体彩官网app 】系统类型:星空体彩官网app(官方)官方网站IOS/Android通用版/手机APP(2024APP)【下载次数8】支持:winall/win7/win10/win11现在下载,新用户还送新人礼包星空体彩官网app这是朋友推荐给我的软件,很好用软件下载很方便快捷,操作也很http://www.hkjunan.com/dox/detail/kodorpt.html
16.大数据与人工智能技术丛书数据清洗-微课视频版 黄源,何婕 本书的编写目的是向读者介绍数据清洗技术的基本概念与应用。全书共10章,分别为数据清洗概述、文件格式、Web数据抽取、网络爬虫、Kettle数据清洗、数据迁移、文本数据处理、Python数据清洗、DataCleaner数据分析与清洗以及数据清洗综合实训。本书将理论与实践操作相结合,通过大量的案例帮助读者https://wqbook.wqxuetang.com/topic/1103.html
17.废塑料薄膜的干法清洗及设备研究暂无数据 图书推荐 Python 3爬虫、数据清洗与可视化实战 电子工业出版社 零一 韩要宾 黄园园 2018-03-01 Python 3 爬虫、数据清洗与可视化实战(第2版) 电子工业出版社 零一 2020-07-01 图表详解塑料模具设计技巧 电子工业出版社 覃鹏翱 2010-01-01 塑料成型工艺与模具设计(第4版)(附微课视频) 人民邮电出版社https://wap.cnki.net/touch/web/Dissertation/Article/-2006107344.nh.html