汇总数据
使用 Metabase 的汇总功能来计算平均值、总计和其他指标
简介
当我们提出诸如“上周每天有多少人下载了我们的应用程序?”之类的问题时,我们是在要求提供数据的汇总。在本指南中,您将看到在 Metabase 中向图表和表格添加汇总的所有方法,并学习在 Metabase 中使用汇总的一些技巧和窍门。
我们假设您已经知道如何在查询构建器中提问。
如何考虑汇总
汇总意味着将来自多个记录的数据组合在一起并生成一个数字,例如“产品评分的平均值”。因此您需要确定
- 将用于组合值的数值指标:例如,计数、求和或平均值
- 将组合其值的列:例如,数量、价格或评分
- (可选)分组字段。它们确定数据的分组(或分组)依据。例如,您可以按月份计算订单数量,或按产品类别计算产品评分,或两者兼而有之。分组字段也常被称为维度。
这里“维度”一词具有暗示性:对于折线图或条形图,第一个分组将用作 X 轴。
例如,在 Metabase 中您可以找到
- 评分平均值
- 按产品类别划分的评分平均值
- 每个月按产品类别划分的订单总额平均值
在所有这些情况下,指标是 平均值
,列是 评分
,但添加分组会创建不同的汇总和图表。
按列汇总
查看表格时,您可以点击列标题以按此列创建表格汇总。您将看到的汇总类型将根据列类型而异。例如,您可以在每个新 Metabase 实例附带的示例数据库中的“账户”表中找到平均席位数。
汇总图表或表格
-
查看表格或图表时,您可以点击右上角的“汇总”按钮,向表格或图表添加汇总。
您可以在“汇总依据”块中添加指标,通过点击“分组依据”块中的列名来更改分组字段,并通过点击列名旁边的“+”按钮添加更多分组字段。
-
在查询构建器中,您可以添加一个“汇总”块并选择指标、列和分组字段。请查看查询构建器中提问教程!
如何为您的汇总选择图表
当您点击带有汇总的查询上的“可视化”时,Metabase 将自动选择它认为最适合您结果的图表。例如,如果您按时间序列列分组,Metabase 将创建折线图;如果您按类别分组,Metabase 将创建条形图。在大多数情况下,Metabase 选择的图表将是最佳选择。
您可以更改图表类型。Metabase 图表对汇总中可用于图表的分组数量和类型有要求
图表类型 | 分组要求 | 分组用于.. |
---|---|---|
数字、量表和进度图表 | 单个数字,无分组 | 不适用 |
饼图 | 1 个分组 | 扇形颜色 |
瀑布图和漏斗图 | 1 个分组 | X 轴 |
地图 | 按具有地理数据的列进行 1 个分组 | 位置 |
趋势图 | 按时间序列数据列进行 1 个分组 | 比较的时间段 |
折线图、条形图、行图、面积图和组合图 | 1 或 2 个分组 | 第一个分组用于 X 轴(行图为 Y 轴),第二个用于颜色 |
数据透视表 | 至少 2 个分组 | 行和列 |
散点图 | 1 到 3 个分组 | 第一个分组用于 X 轴,第二个用于颜色,第三个用于气泡大小 |
例如,您可以将饼图更改为条形图,但不能更改为数据透视表。
使用自定义表达式汇总
如果您想构建使用更复杂函数(如中位数)或包含“汇总含税订单的总计”等条件的汇总,您可以使用 Metabase 的自定义表达式。
例如,您可以添加这样的汇总
SumIf([Subtotal], [Tax] > 0)
请查看我们的自定义表达式教程了解更多信息。
汇总技巧
按日期和时间分组
您可以按日期和时间列进行分组。Metabase 将自动选择一个粒度进行分组:例如,对于日期列,它将自动按月份分组。您可以通过点击时间段来更改粒度。
按数值变量分组
在 Metabase 中,您不仅可以按类别或日期分组:您还可以按数值变量(如 价格
)分组。Metabase 会为您对数值变量进行分箱,创建用于分组的“类别”。
如果您在按数值变量分组时选择“计数”作为指标,您将创建此变量的直方图(也称为分布图)。
累积汇总
Metabase 有两种类型的累积汇总:累积求和和计数。对于每条记录,它们将返回表格中直到该记录的所有值的总和或计数。
这些汇总与其他汇总略有不同,因为它们返回的数据取决于表格中数据的顺序。
假设您有一个按月份显示值的表格。累积求和将按如下方式计算:
月份 | 值 | 累积求和 |
---|---|---|
七月 | 5 | 5 |
十一月 | 4 | 5+4 = 9 |
三月 | 2 | 5 + 4 + 2 = 11 |
但如果月份的顺序改变(而值保持不变),则累积求和也会改变。
月份 | 值 | 累积求和 |
---|---|---|
三月 | 2 | 2 |
七月 | 5 | 2 + 5 = 7 |
十一月 | 4 | 2 + 5 + 4 = 11 |
去重值
Metabase 的“去重值”汇总返回该列中去重值的数量。如果您想查看去重值本身,您可以改为创建任何按该列分组的汇总。
例如,如果您想查看产品类别的所有去重值,您可以按产品类别分组来计算行数。这将为您提供一列包含所有去重类别值,以及一列包含每个类别的行计数(您可以从结果中隐藏计数列)
SQL 专家注意事项
在 SQL 中,您通过在 SELECT
语句中添加像 COUNT
这样的函数来汇总——类似于您如何根据其他列的值计算新列。
在 Metabase 中,这两个操作是不同的:要添加新列,您可以使用“自定义列”块,但要添加聚合,您使用“汇总”块。
下一步:添加自定义列
在 Metabase 中创建自定义列以计算新指标或清理数据