自助数据集数据准备

FineBI作为一款自助式数据分析产品,提供丰富强大的功能让企业数据分析者,通过高效自助分析,进行数据决策。

本文按照各个模块,对FineBI产品的特有概念进行解释说明,以便用户进行使用。

「数据集」是用户拿来做分析的表。

表(数据集)是数据分析的依据和基础,数据分析就是对表内数据进行分析。

「业务包」是一种数据管理概念,是存放表(数据集)的容器,可以理解为存放数据集的文件夹。

「业务包」是为了实现对表(数据集)管控而存在,因此,在「业务包」中只能放置表(数据集)。

「分组」是一种数据管理概念。通过添加不同的分组,将业务包按照需求分类存放,方便数据查找。

「分组」相当于「业务包」的上层文件夹,「分组」是为了实现对「业务包」管控而存在的文件夹。因此,在「分组」下只能添加「业务包」及下一级分组。

「字段」是「数据集」中的列,每个数据集都是由多个字段组成。

按照形式分类分为数值、文本和日期类型的三种字段,通过字段前的标志可以识别不同种类。

方便用户以数据的一列作为最小单位进行数据分析。

数据处理时,可以在自助数据集中添加指定字段(列);仪表板进行数据分析时,可以选择所需要的字段(列)进行分析。

「基础表」是未经过用户深度加工过的表(数据集)。

自助数据集是深度加工的表。因此,「基础表」代表「数据集」中的三类:数据库DB表、SQL数据集、Excel数据集。

基础表往往是管理员提供好的原始表(Excel数据集用户可以自己上传)。

无基础不分析,所有的分析向回追溯,都能找到一个基础表作为根基。所以可以理解为——基础表是分析的源头,是上层分析的基石,是分析枝繁叶茂之根本。

「我的自助数据集」相当于一个只属于用户自己的特殊分组。可以在其中创建新的业务包和分组,满足个性化、私人化的数据分析需求。

如果只是因为个人需求做数据分析,可以将这些表(Excel数据集及自助数据集)存放在「我的自助数据集」下进行查看和分析。管理员无法通过权限设置,查看并公开我的自助数据集里面的内容。

「我的自助数据集」中的表,是数据分析性质的自助数据集。

「自助数据集」是数据集中的深度数据加工过的表。

自助数据集是为了实现普通用户可以自己进行数据处理实现需求存在的表,而非统一由管理员代劳。

自助数据集可以实现对数据进行深入加工,深层次分析的效果。

一个做好的自助数据集,可以作为后续可视化分析的基础,也可以再被其他自助数据集继续调用。

「数据处理用户」在普通业务包(非「我的自助数据集分组」)下创建的自助数据集是「处理性质数据集」。

「处理性质数据集」主要是基于「基础表」创建的出来的表(自助数据集)。是可以处理大数据量的自助数据集,以及对其设置权限。

为了给其他人作为数据分析的基础。

「处理性质数据集」一般是用来给更广大的「数据分析用户」提供能够进行数据分析的表(自助数据集)。对于一些有深入分析需求的「数据分析用户」,可以基于「处理性质数据集」进行个性化的数据处理,再进行可视化分析。

「处理性质数据集」作为比「基础表」更复杂,比做可视化分析表简单的中间表。可以满足大部分数据分析用户的通用类需求。

「数据分析用户」创建的数据集是「分析性质数据集」;

另外,「数据处理用户」在「我的自助数据集」下创建的数据集也是「分析性质数据集」。

注:在「我的自助数据集」下创建的,不是给其他人分析的基础,因此都是数据分析性质的自助数据集。

「分析性质数据集」是为了实现更流畅的数据分析体验而存在,但是不能对其分配行列权限,且能处理的数据量相对比较小。

在组件制作中,字段按分析数据的角度分类,分为「维度」和「指标」字段。从不同的「维度」去分析「指标」,用「指标」对分析的「维度」进行量化,从而得出数据分析结果。

文本和日期类型字段默认为「维度」字段,数值类型默认为「指标」字段。

字段是数据集中的列,具体可参见「第2节」下字段的定义。

在可视化组件中数据集中的字段,通常被划分为「维度」和「指标」两类。

可视化组件制作就是将数据集中的字段拖入分析区域进行分析。因此,字段是实现可视化分析的基础。

维度指我们分析数据的角度。

示例

维度字段

维度

分析不同月份/年份的销售额变化

月份/年份(日期类型)

分析不同省/市的销量占比

省/市(文本类型)

地区

维度字段包含:日期类型字段、文本类型字段、指标名称(制作可视化组件时自动产生的字段)

从不同的维度去分析数据,可以让我们对数据有更全面的认识和了解,也能让我们更好的制定计划和决策。

「指标」是对维度的量化,维度讲究的是从不同的角度出发去分析数据,而指标就是不同维度分析出来的结果,这个结果可以是数值,也可以是比值。

指标

销售额

不同省/市的销量占比

销量占比

指标字段包含:数值类型字段、计算指标字段(是在仪表板中添加计算指标获得的字段)、记录数(制作可视化组件自动产生的字段)

通过指标的量化,可以让我们精准的看到业务产出,从而更好的衡量目标达成的结果。

聚合是若干行按照一定的标准变成一行,汇总到更高类别的行级别数据。

直连就是直接连接数据库取数据,使用的是直连引擎。直连不能支持多个不同数据源相互关联,一旦关联就需要进入spider引擎,即本地模式。

1)避免数据资源冗余:目前很多企业有较为专业的大数据平台,通过直连引擎取数,可以在保障数据分析性能的同时避免数据资源冗余。

2)满足实时数据需求:直连引擎实时取数,最高实现毫秒级数据刷新,满足用户对数据实时性的要求。

本地模式的数据需要抽取并存储到FineBI的Spider引擎中,使用的是Spider引擎。后续的分析需是从引擎来提取离线数据进行。

1)节约成本:使用本地数仓支持跨库取数,多表合并等功能,节约企业的数据仓库成本。

2)提升性能:抽取数据的计算性能较快,能够满足大数据量的快速分析,帮助客户很好的解决数据性能问题,支撑自助分析,提升用户的分析和查看体验。

实时数据是直连模式下,使用直连引擎直接连接数据库,获取实时的数据(最新的数据)。

随数据库变化,实时变化。

抽取数据是本地模式下,使用Spider引擎将数据库的数据抽取并存储,可支持离线使用的数据。

THE END
1.什么是“指标平台”?一文详解企业如何搭建和利用指标平台标准化指标体系:通过定义统一的指标计算规则和口径,避免因理解差异导致的决策偏差。 2. 实时监控与预警 实时数据展示:利用可视化仪表盘实时监控关键指标(如销售额、库存量、客户流失率等)。 自动化预警:通过设置指标阈值,及时发现异常并触发预警,支持快速响应。 https://blog.csdn.net/yuanziok/article/details/144142699
2.技术分析公式文件格式详解:从入门到精通的完整指南研究行业竞争格局,选择具有竞争优势的企业。https://www.55188.com/thread-27812860-1-1.html
3.java可视化打印标签模板设计器mob64ca140d61c6的技术博客一:国庆结束了,回来上班,结果老大说过两天才出差,所以这两天就用来补自己不太懂的知识或者以前没有熟悉的知识,jsp的标签就是,因为在项目中自己封装了一些标签,但是我自己只是会用,真正的原理性的东西我还是不是很明白,所以今天一天的时间基本上都是在网上找资料来熟悉jsp标签的知识。 https://blog.51cto.com/u_16213671/12674318
4.福州市长乐区长限生态补水泵站工程设备及安装采购项目附件中小企业适用价格扣除办法时应提供《中小企业声明函》,投标人须按招标文件规定格式填写,并对声明的真实性负责,否则不予价格扣除。(2)根据财政部、司法部联合印发《关于政府采购支持监狱企业发展有关问题的通知》(财库【2014】68号)文件规定,符合规定的监狱和戒毒企业(以下简称监狱企业)参加政府采购活动视同小型、微型http://zfcg.fuzhou.gov.cn/upload/document/20220704/3d3e292a86194601bf18f0db30b6d9f6.html
5.手把手教您如何进行数据质量管理当数据流经质量保证监控检查点时,监控数据以确保高质量的输出。 洞察力: 在整个数据管道中正确应用数据质量维度将产生卓越的业务决策。 数据流的任何阶段都可能发生数据质量问题。 防止数据质量差的连锁效应 数据是数据驱动型组织决策的基础。 因此,如果组织的基础数据出现问题,这可能会对许多下游业务功能产生多米诺骨牌https://36kr.com/p/2346113073061509
6.实践阿里QuickBI智能图表入门电子表格:负责在线电子表格(webexcel)的相关操作功能,涵盖行列筛选、普通/高级过滤、分类汇总、自动求和、条件格式等数据分析功能,并支持数据导出,以及文本处理、表格处理等丰富功能。 仪表板:负责将可视化图表控件拖拽式组装为仪表板,支持线图、饼图、柱状图、漏斗图、树图、气泡地图、色彩地图、指标看板等40多种图表;https://www.jianshu.com/p/f498b1ef7aae
7.2020级五年制人才培养方案2020级五年制人才培养方案http://www.jxxdjsxy.com/jiaowuzaixian/zhuanyeshezhi/2022-06-19/8135.html
8.详解Salesforce报表和仪表板仪表板组件和报告之间的关系是1:1; 对于每个仪表板组件,都有一个源报告。但是,您可以在单个仪表板上的多个仪表板组件中使用相同的报告(例如,在条形图和饼图中使用相同的报告)。您可以在单个仪表板页面上显示多个仪表板组件,创建强大的可视化显示以及使用通常具有共同主题(如销售绩效或客户支持)的多个报表的方式。http://www.forenose.com/column/content/427084987.html
9.万字解读数据可视化平台指标 衡量数据, 对数据的量化.比如销售量是100元, 利润是50元等 3. 创建分组表 创建组件 完成了上一节内容学习后,已成功上传制作组件所需的「入门表」,接下来进行仪表板组件的制作。 选择需要分析的数据表,创建组件,创建组件的同时会自动创建一张仪表板,放置组件。一个组件只能依赖一张表制作。选择「数据准备>https://www.360doc.cn/article/78825344_1123140552.html
10.用于版本控制的Splunk仪表板和报告源备份Splunk是一种用于日志管理和数据分析的强大工具。它提供了一个可视化的仪表板和报告系统,用于监控、分析和可视化各种数据源的信息。Splunk仪表板和报告源备份是指对Splunk仪表板和报告进行备份和https://cloud.tencent.com/developer/information/%E7%94%A8%E4%BA%8E%E7%89%88%E6%9C%AC%E6%8E%A7%E5%88%B6%E7%9A%84Splunk%E4%BB%AA%E8%A1%A8%E6%9D%BF%E5%92%8C%E6%8A%A5%E5%91%8A%E6%BA%90%E5%A4%87%E4%BB%BD
11.APQ是什么?有哪些应用深圳市航顺芯片技术研发有限公司通俗的来讲,PTC就是一个半导体材料,而且这个半导体材料的正温度系数很大,在实际应用当中,PTC经常是以热敏电阻的身份出现的,而锂电池保护板就是通过其中器件材料的大阻值,从而变相的成为断路,切断电流达到保护的作用,这样一解释,大家就会很容易的想到,PTC是锂电池保护板中一个很重要的元器件,主要的保护功能也是通过它https://bbs.elecfans.com/jishu_2178041_1_1.html