汇总和分组
当我们有类似“上周每天有多少人下载了我们的应用?”这样的问题时,我们是在询问数据的摘要。摘要通常由两部分组成:一个或多个我们关心的数字(在数据术语中称为“指标”),以及我们希望如何分组或细分该数字。要回答“上周每天有多少人下载了我们的应用?”这个示例问题:
- 指标将是下载应用的人数计数(行数计数)。
- 我们希望该指标按“每天”分组。
- 并且我们希望为“上周”过滤行。
通常有两种常见的方式来汇总您的数据
- 计算表格中的行数
- 获取数字列的总和或平均值
而且很多时候,您会将该指标按以下内容分组
- 时间
- 地点
- 类别
汇总指标
添加汇总步骤允许您选择如何聚合前一步骤的数据。您可以选择一个或多个指标,并可选择按一个或多个维度(列)对这些指标进行分组。在选择指标时,您可以从基本函数(如 sum
、average
和 count
)中选择;或者您可以选择管理员定义的常用指标;或者您可以编写公式来创建自定义表达式。
常用指标包括
- 行数计数:表格中的总行数,在应用任何过滤器之后。如果您正在查看您的
Orders
表,并且想知道价格高于 40 美元的订单数量,您将按“价格高于 40 美元”进行过滤,然后选择行数计数
,因为您希望 Metabase 计算有多少订单与您的过滤器匹配。 - ...总和:特定列中所有值的总和。
- ...平均值:单列中所有值的平均值。
- ...的不同值的数量:单列所有单元格中唯一值的数量。这在尝试找出上个月售出了多少种不同类型的产品(而不是总共售出了多少)时很有用。
- ...的累积总和:这为您提供特定列的运行总计。为了使此指标有用,您需要按日期列对其进行分组,以查看其随时间的变化。
- 累积行数计数:这为您提供表格中随时间变化的行数的运行总计。就像
...的累积总和
一样,您需要按日期列对其进行分组,才能使其有用。 - ...的标准偏差:一个数字,表示列的值与该列的平均值相比,正负变化多少。
- ...最小值:所选字段中存在的最小值。
- ...最大值:所选字段中存在的最大值。
如果您汇总并添加分组,则可以再次汇总。您还可以在两者之间添加步骤来过滤和/或连接。例如,您的第一个汇总步骤可能是获取每月订单计数,然后您可以添加第二个汇总步骤,通过选择您的 count
列的 ...平均值
来获取平均每月订单总额。
您还可以在结果页面上的侧边栏中添加指标和分组:侧边栏顶部是您选择要查看的数字(“指标”)的位置,下面部分是您选择如何对该数字进行分组(或如何“细分”)的位置。
如果您的管理员创建了任何特定于您的公司或组织的命名指标,它们将位于此下拉菜单的常用指标部分下。这些可能是您公司计算收入的官方方式之类的内容。
分组您的指标
根据您选择的分组列,Metabase 将向您显示它认为最适合此摘要的默认可视化或图表。因此,如果您选择日期列,您将看到如下所示的折线图(您可以单击绿色的汇总按钮来查看摘要侧边栏)。
当您单击与当前选定的分组列不同的分组列时,分组将切换为使用该列。但是,如果您想添加额外的分组,只需单击列右侧的加号 (+) 图标。要删除分组,请单击 X 图标。
某些分组列将为您提供选择分组大小的选项
- 对于日期时间列,您可以单击
按月
字样将分组更改为日、周、小时、季度、年等。您还可以通过同一日期时间列添加具有不同时间粒度的多个细分(例如,按周和星期几分组)。有关按年周分组的信息,请参阅年周。 -
对于年龄等数字列,Metabase 将自动“分箱”结果,因此您将看到您的指标按年龄段分组,如 0-10、11-20、21-30 等。与日期一样,您可以单击当前的分箱选项将其更改为特定数量的分箱。目前,您无法为分箱选择自己的范围。
如果您选择固定数量的分箱,Metabase 会将数据范围划分为该数量的相等大小的间隔。某些间隔可能最终没有数据,Metabase 将不会显示它们。
阅读 Metabase 其他版本的文档。