汇总与分组
当我们提出“上周每天有多少人下载了我们的应用程序?”这样的问题时,我们实际上是在请求数据的**汇总**。汇总通常由两部分组成:一个或多个我们关心的*数字*(在数据术语中称为“指标”),以及我们希望如何*分组*或*细分*这些数字。要回答“上周每天有多少人下载了我们的应用程序?”这个示例问题:
- 指标将是下载应用程序的人数(行数)。
- 我们希望该指标按“每天”分组。
- 我们希望筛选“上周”的行。
您通常会以两种常见方式汇总数据
- 计算表中的行数
- 获取数字列的总和或平均值
很多时候,您会**按**以下方式**分组**该指标
- 时间
- 地点
- 类别
汇总指标
添加汇总步骤可以帮助您选择如何聚合上一步的数据。您可以选择一个或多个指标,并选择性地通过一个或多个维度(列)对这些指标进行分组。在选择指标时,您可以从 sum
、average
和 count
等基本函数中选择;或者您可以选择管理员定义的常用指标;或者您可以通过编写公式创建自定义表达式。
常用指标包括
- 行数: 表格中应用任何筛选器后的总行数。如果您正在查看
Orders
表,并想知道有多少订单的价格高于 40 美元,您可以按“价格高于 40”进行筛选,然后选择Count of rows
,因为您希望 Metabase 计算有多少订单符合您的筛选条件。 - 总和: 特定列中所有值的总和。
- 平均值: 单列中所有值的平均值。
- 不同值的数量: 单列所有单元格中唯一值的数量。当您尝试找出上个月销售了多少种不同*类型*的产品(而不是总共销售了多少)时,这很有用。
- 累计总和: 这为您提供了特定列的累计总数。为了使此指标有用,您需要按日期列对其进行分组,以便查看其随时间的变化。
- 行累计计数: 这为您提供了表格中行数随时间变化的累计总数。与
Cumulative sum of…
一样,您需要按日期列对其进行分组,以便使其有用。 - 标准差: 一个表示列值与该列平均值之间偏差程度(正负)的数字。
- 最小值: 所选字段中存在的最小值。
- 最大值: 所选字段中存在的最大值。
如果您进行了汇总并添加了分组,那么您可以再次进行汇总。您还可以在中间添加筛选和/或联接步骤。例如,您的第一个汇总步骤可以是获取每月订单数量,然后您可以添加第二个汇总步骤,通过选择 Average of…
您的 count
列来获取每月订单总额的平均值。
您还可以在结果页面的侧边栏中添加指标和分组:侧边栏顶部是您选择要查看的数字(“指标”)的地方,下方是您选择如何对该数字进行分组(或如何“细分”)的地方。
如果您的管理员创建了特定于您公司或组织的命名指标,它们将在此下拉菜单的“**常用指标**”部分下显示。这些可能包括您公司计算收入的官方方式。
分组您的指标
根据您选择的分组列,Metabase 将显示它认为最适合此汇总的默认可视化或图表。因此,如果您选择一个日期列,您将看到一个折线图(您可以点击绿色的“**汇总**”按钮查看汇总侧边栏)。
当您点击与当前选择不同的分组列时,分组将切换为使用该列。但如果您想*添加*一个额外的分组,只需点击列右侧的加号 (+) 图标。要删除分组,请点击 X 图标。
一些分组列将为您提供选择分组大小的选项
- 对于日期时间列,您可以点击
by month
字样,将分组更改为按天、周、小时、季度、年等。您还可以通过同一日期时间列添加多个细分,并使用不同的时间粒度(例如,按周和按星期几分组)。有关按年周分组的信息,请参阅年周。 -
对于年龄等数字列,Metabase 会自动“分箱”结果,因此您会看到您的指标按年龄段分组,例如 0-10、11-20、21-30 等。与日期一样,您可以点击当前分箱选项将其更改为特定数量的分箱。目前,您无法选择自己的分箱范围。
如果您选择固定数量的分箱,Metabase 将把数据范围分成等大小的这些数量的间隔。某些间隔可能最终没有数据,Metabase 将不会显示它们。
阅读其他Metabase 版本的文档。