什么是汇总表?
汇总表是聚合的结果,它被保存到数据库或数据仓库中,以便人们可以使用这些预计算的指标。
“汇总表”这个术语可能会让人困惑,因为有些人用“汇总表”来描述任何聚合函数的结果,比如在按某些度量和维度进行筛选和分组后得到的表。根据这个定义,汇总表基本上和数据透视表一样,只是没有数据透视功能。
这里的区别在于这些表是否保存在您的数据仓库中。在数据仓库中创建汇总表可以方便人们生成报告,而无需查询原始数据。从这个意义上说,汇总表的功能很像物化视图(物化视图不一定聚合数据)。
示例:数据仓库中的汇总表
例如,您可能正在使用一个采用星型模式设置的分析数据库,其中事实表包含数万条单独的订单记录,周围是描述这些订单的维度表。如果您的组织中有人想要生成一份包含过去七天按产品类别划分的销售数据的周报,那么每次都从原始事实表和维度表中计算将是低效且昂贵的。
相反,创建汇总表可以让您减少表连接和数据聚合的频率。这样,将来当有人创建该报告时,他们可以使用汇总表作为基础,而无需每次都从头计算这些数字。
虽然汇总表会带来一些维护工作(例如确保您的数据按计划刷新,或者在筛选和分组不完全符合人们需求时进行调整),但它们仍然是处理大型数据集的非常高效的方法。