数据摘要
使用 Metabase 的摘要来计算平均值,总数和其他指标
简介
当我们提出像“上周每天有多少人下载了我们的应用?”这样的问题时,我们是在请求数据的一个摘要。在本指南中,您将了解在Metabase中为图表和表格添加摘要的所有方法,并学习一些在Metabase中使用摘要的技巧和窍门。
我们假设您已经知道如何在查询构建器中提出问题。
如何考虑摘要
摘要意味着将来自多个记录的数据合并在一起,生成一个单一数字,例如“产品评分的平均值”。因此,您需要确定
- 将要用于合并值的数值指标:例如,计数、求和或平均值
- 将要合并值的列:例如,数量、价格或评分
- (可选)分组。它们确定数据是如何被分割(或分组)的。例如,您可以根据月份计算订单数量,或根据产品类别计算产品评分,或两者都计算。分组也常被称为维度。
在这里,“维度”这个词有提示作用:对于折线图或柱状图,第一个分组将作为X轴。
例如,在Metabase中您可以找到
- 评分平均值
- 按产品类别计算评分平均值
- 按产品类别计算每月平均订单总额
在这些所有情况下,指标是平均值
,列是评分
,但添加分组会创建不同的摘要和图表。
按列摘要
在查看表格时,您可以单击列标题通过此列创建表格的摘要。您将看到的摘要类型将根据列类型而异。例如,您可以在每个新Metabase实例附带的标准数据库中找到“账户”表中的平均座位数。
摘要图表或表格
-
在查看表格或图表时,您可以在右上角单击“摘要”按钮向表格或图表添加摘要。
您可以在“按以下方式摘要”块中添加指标,通过单击“按以下方式分组”块中的列名更改分组,并通过单击列名旁边的+按钮添加更多分组。
-
在查询构建器中,您可以添加摘要块并选择指标、列和分组。查看在查询构建器中提出问题以获取查询构建器教程!
如何为您的摘要选择图表
当您在带有摘要的问题上单击“可视化”时,Metabase将自动选择它认为最适合您结果的图表。例如,如果您根据时间序列列进行分组,Metabase将创建折线图;如果您根据类别分组,则创建柱状图。在大多数情况下,Metabase选择的图表将是最佳选项。
您可以更改图表类型。Metabase图表对在摘要中用于图表的分组数量和类型有要求
图表类型 | 分组要求 | 分组用于... |
---|---|---|
数量、仪表和进度图表 | 单个数字,无分组 | N/A |
饼图 | 1个分组 | 段落的颜色 |
瀑布图和漏斗图 | 1个分组 | X轴 |
地图 | 按具有地理数据的列进行1个分组 | 位置 |
趋势图 | 按具有时间序列数据的列进行1个分组 | 比较的时间段 |
折线图、柱状图、行图、面积图和组合图 | 1或2个分组 | 第一个分组用于X轴(或行图的Y轴),第二个分组用于颜色 |
交叉表 | 至少 2个分组 | 行和列 |
散点图 | 1到3个分组 | 这是X轴的第一个突破点,第二个是颜色,第三个是气泡大小 |
例如,您可以将饼图改为柱状图,但不能转换为交叉表。
使用自定义表达式总结
如果您想构建使用更复杂的函数(如中位数)或包含条件(如“计算含税订单的总数”)的摘要,可以使用Metabase的自定义表达式。
例如,您可以添加如下摘要
SumIf([Subtotal], [Tax] > 0)
查看我们的自定义表达式教程了解更多信息。
总结技巧
按日期和时间分组
您可以根据日期和时间列进行分组。Metabase将自动选择一个粒度进行分组:例如,对于日期列,它将自动按月份分组。您可以通过点击时间段来更改图形的详细程度
按数值变量分组
在Metabase中,您不仅可以按类别或日期分组,还可以按数值变量分组,如价格
。Metabase将为您对数值变量进行分箱,创建用于分组的“类别”
如果您在按数值变量分组时选择“计数”作为度量标准,您将创建此变量的直方图(也称为分布图)。
累计总结
Metabase有两种类型的累计总结:累计总和和计数。对于每条记录,它们将返回表中所有值到这条记录的总和或计数。
这些总结与其他总结略有不同,因为它们返回的数据取决于表中数据的顺序。
假设您有一个按月份值组成的表格。累计总和将按如下方式计算
月份 | 值 | 累计总和 |
---|---|---|
七月 | 5 | 5 |
十一月 | 4 | 5+4 = 9 |
三月 | 2 | 5 + 4 + 2 = 11 |
但是,如果月份的顺序发生变化(而值保持不变),则累计总和也会发生变化
月份 | 值 | 累计总和 |
---|---|---|
三月 | 2 | 2 |
七月 | 5 | 2 + 5 = 7 |
十一月 | 4 | 2 + 5 + 4 = 11 |
不同值
Metabase的“不同值”总结返回列中不同值的数量。如果您想查看实际的不同值,您可以创建任何摘要,并使用该列进行分拆。
例如,如果您想查看所有产品类别的不同值,您可以要求按产品类别对行进行计数。这将为您提供包含所有不同类别值的列,并为每个类别提供行计数列(您可以从结果中隐藏计数列)
SQL专家注意
在SQL中,您通过在SELECT
语句中添加像COUNT
这样的函数来总结——类似于您根据其他列的值添加基于值的计算新列的方式。
在Metabase中,这两个操作是不同的:要添加新列,您可以使用自定义列块,但要添加聚合,您使用摘要块。
下一步:添加自定义列
在Metabase中创建自定义列以计算新的度量标准或清理您的数据