通过FineBI的数据编辑功能,用户可以快速进行数据清洗、多表合并、数据结构调整、数据分析和数据校验等操作,以满足实际业务场景中对数据的处理需求。这些操作能够帮助用户从杂乱无章的数据中整理出有序的、可靠的数据,为后续的分析和决策提供有力支持。
那么我们在实际业务场景中,如何使用FineBl的功能,快速处理数据呢
在数据清洗阶段,可以使用FineBI的数据编辑功能进行以下操作:
通过字段设置,可以选择需要保留或排除的字段,快速调整字段位置、重命名字段,从而快速整理数据。
1)删除多余列
上传数据后,有一些字段不需要参与分析,或者是空白列。点击字段表头,下拉删除列。如下图所示
2)转化字段类型
分析的是时候,会按照字段类型进行分类,用维度衡量指标。需要调整类型不正确的字段。
例如,用户ID、产品编码是维度字段,往往因为都是数字被自动识别为指标,需要修改类型为文本,如下图所示:
3)重命名、翻译字段
将一些不规范的字段名进行重命名。例如将英文字段转化为中文,如下图所示:
利用去重功能,可以快速删除数据集中的重复行,确保数据的唯一性。
FineBI支持删除所有数据的重复行、也支持依据部分字段删除重复行。
例如,订单ID是唯一字段,相同ID只要保留一条。点击表头下拉,发现订单ID存在大量重复值。
则使用「删除重复行」功能处理数据,如下图所示:
null值作为一个必定会遇到的问题,在不同的业务场景下会有截然不同的处理方式。
在数据量巨大的时候,如果null值很少,不会对我们计算总和或平均值造成很大的波动,那我们可以直接忽略。
若有些null值在处理时希望直接作为脏数据整行剔除时,则可以使用表头的快捷过滤迅速的将空值进行排除。
也支持添加「过滤」步骤,筛选非空数据。
例如,下图所示中的数据,这位同学英语成绩为空的原因可能是他本身就因病没参加考试,此时既不能放着不管,也不能直接删去他的这一行数据。
对于这种情况,我们要做的是针对某一类特殊情况打上对应的标签,以便在后续的分析中,有选择地过滤。
在FineBI中,可以用「新增公式列」或者更方便的「条件标签列」来实现。
可以使用新增列,根据业务需求进行自定义计算或添加辅助字段。
根据具体的分析需求,可以使用以下功能对数据结构进行调整和转换。
通过拆分行列的操作,将包含多个字段值的一列(行)拆分为多个列(行),以便更细粒度地进行数据分析。
原始数据字段内容混杂,不利于开展分析。拆分行列并转换后,字段结构简单清晰。如下图所示:
通过行转列的操作,可以将数据集中的多行转换为一行,适用于某些数据透视分析的需求。
例如,将不同的科目从列转为行。如下图所示:
使用「行转列」即可一步到位。如下图所示:
通过列转行的操作,可以将数据集中的多列转换为一列,方便进行一些特定类型的数据操作和分析。
为了方便分析,需要将多个数据表合并到一个数据集中,可以使用以下功能:
通过上下合并功能,将多个数据表按照行的方式进行合并,合并后的数据集包含了原始表格的所有行。合并后表格上下扩展,分析的字段并没有增加,但是行数变多了。
有「学生成绩」的三张Excel表,在数据中,选择「学生成绩-Sheet1」字段,通过「上下合并」添加「学生成绩-Sheet2」字段,完成上下合并其中两张的操作。如下图所示:
根据需求,可以通过新增列的方式从其他数据表中获取数据,并将其添加到当前数据集中,方便进一步分析和计算。
这个功能可以将其他表的指标字段进行聚合后合并(Sumif)或是查询对应的维度匹配到这张表中(Vlookup)。
通过左连接、右连接等操作,将多个数据表按照指定的关联条件融合在一起,形成新的数据集。
FineBI的数据编辑功能还提供了一些数据分析的工具和操作,例如:
通过分组和汇总的操作,可以根据指定的字段将数据集分成不同的组(如相同值一组、自定义分组、日期字段按年;年月分组等),并进行聚合计算,如求和、计数、平均值等。如下图所示:
根据需要,可以通过新增列的操作在数据集中添加自定义计算的列,以便更好地满足业务需求和数据分析要求。
选中字段后,可以在左下角快速获得平均值、总和、记录数等数据,我们可以通过对熟悉的数据进行校验,结合经验来判断是否正确。
利用这一点,我们可以通过过滤出部分关键数据,并取消应用一些疑惑的关键步骤来进行试错。就如同刚学数学时习惯性的多次验算一样,虽然对老玩家略显繁琐,但的确是最令新手放心的定心丸。
通过表头快速过滤出少部分数据进行“抽样检测”。如下图所示:
灵活运用步骤区的小技巧帮助自己快速检查。如下图所示:
右侧步骤区还支持复制粘贴步骤等操作,用户可以自己探索。
可添加的分析步骤如下表所示:
将其他表的字段,根据合并依据分组汇总添加到本表
行转列可将一维表转成二维表
将二维表转换为一维表
鼠标选中内容,快速反馈问题
鼠标选中存在疑惑的内容,即可快速反馈问题,我们将会跟进处理。