汇总和分组

Summarizing

当我们有类似“上周每天有多少人下载了我们的应用?”这样的问题时,我们是在询问数据的摘要。摘要通常由两部分组成:一个或多个我们关心的数字(在数据术语中称为“指标”),以及我们希望如何分组细分该数字。要回答“上周每天有多少人下载了我们的应用?”这个示例问题:

  • 指标将是下载应用的人数计数(行数计数)。
  • 我们希望该指标按“每天”分组。
  • 并且我们希望为“上周”过滤行。

通常有两种常见的方式来汇总您的数据

  • 计算表格中的行数
  • 获取数字列的总和或平均值

而且很多时候,您会将该指标按以下内容分组

  • 时间
  • 地点
  • 类别

汇总指标

添加汇总步骤允许您选择如何聚合前一步骤的数据。您可以选择一个或多个指标,并可选择按一个或多个维度(列)对这些指标进行分组。在选择指标时,您可以从基本函数(如 sumaveragecount)中选择;或者您可以选择管理员定义的常用指标;或者您可以编写公式来创建自定义表达式

常用指标包括

  • 行数计数:表格中的总行数,在应用任何过滤器之后。如果您正在查看您的 Orders 表,并且想知道价格高于 40 美元的订单数量,您将按“价格高于 40 美元”进行过滤,然后选择 行数计数,因为您希望 Metabase 计算有多少订单与您的过滤器匹配。
  • ...总和:特定列中所有值的总和。
  • ...平均值:单列中所有值的平均值。
  • ...的不同值的数量:单列所有单元格中唯一值的数量。这在尝试找出上个月售出了多少种不同类型的产品(而不是总共售出了多少)时很有用。
  • ...的累积总和:这为您提供特定列的运行总计。为了使此指标有用,您需要按日期列对其进行分组,以查看其随时间的变化。
  • 累积行数计数:这为您提供表格中随时间变化的行数的运行总计。就像 ...的累积总和 一样,您需要按日期列对其进行分组,才能使其有用。
  • ...的标准偏差:一个数字,表示列的值与该列的平均值相比,正负变化多少。
  • ...最小值:所选字段中存在的最小值。
  • ...最大值:所选字段中存在的最大值。

如果您汇总并添加分组,则可以再次汇总。您还可以在两者之间添加步骤来过滤和/或连接。例如,您的第一个汇总步骤可能是获取每月订单计数,然后您可以添加第二个汇总步骤,通过选择您的 count 列的 ...平均值 来获取平均每月订单总额。

Multiple summarize steps

您还可以在结果页面上的侧边栏中添加指标和分组:侧边栏顶部是您选择要查看的数字(“指标”)的位置,下面部分是您选择如何对该数字进行分组(或如何“细分”)的位置。

如果您的管理员创建了任何特定于您的公司或组织的命名指标,它们将位于此下拉菜单的常用指标部分下。这些可能是您公司计算收入的官方方式之类的内容。

分组您的指标

根据您选择的分组列,Metabase 将向您显示它认为最适合此摘要的默认可视化或图表。因此,如果您选择日期列,您将看到如下所示的折线图(您可以单击绿色的汇总按钮来查看摘要侧边栏)。

Grouping by a date column

当您单击与当前选定的分组列不同的分组列时,分组将切换为使用该列。但是,如果您想添加额外的分组,只需单击列右侧的加号 (+) 图标。要删除分组,请单击 X 图标。

Multiple groupings

某些分组列将为您提供选择分组大小的选项

  • 对于日期时间列,您可以单击 按月 字样将分组更改为日、周、小时、季度、年等。您还可以通过同一日期时间列添加具有不同时间粒度的多个细分(例如,按周和星期几分组)。有关按年周分组的信息,请参阅年周
  • 对于年龄等数字列,Metabase 将自动“分箱”结果,因此您将看到您的指标按年龄段分组,如 0-10、11-20、21-30 等。与日期一样,您可以单击当前的分箱选项将其更改为特定数量的分箱。目前,您无法为分箱选择自己的范围。

    Multiple groupings

    如果您选择固定数量的分箱,Metabase 会将数据范围划分为该数量的相等大小的间隔。某些间隔可能最终没有数据,Metabase 将不会显示它们。

阅读 Metabase 其他版本的文档