汇总数据

使用 Metabase 的汇总功能来计算平均值、总计和其他指标

简介

当我们遇到“上周每天有多少人下载了我们的应用程序?”之类的问题时,我们要求对数据进行**汇总**。在本指南中,您将看到在 Metabase 中向图表和表格添加汇总的所有方法,并学习在 Metabase 中使用汇总的一些技巧和窍门。

我们假设您已经知道如何在查询构建器中提出问题

如何考虑汇总

汇总是指将来自多个记录的数据组合在一起并生成一个数字,例如“产品评级的平均值”。因此,您需要确定

  • 将用于组合数值的**指标**:例如,计数、总和或平均值
  • **列**,其值将被组合:例如,数量、价格或评级
  • (可选)**细分**。它们确定数据**按**细分(或分组)的组。例如,您可以计算按月份分组/细分的订单数量,或按产品类别分组/细分的产品评级,或两者都计算。细分也常称为**维度**。

这里的“维度”一词具有启发性:对于折线图或条形图,第一个细分将用作 X 轴。

例如,在 Metabase 中,您可以找到

  • 评级的平均值

Average of rating in the query builder Visualization of avg rating as a single number

  • 按产品类别划分的评级平均值

Avg rating by category in the QB Avg rating by category as a bar chart

  • 每个月的每个产品类别的平均订单总额

Avg rating by category and month QB Avg rating by category and month as a time series

在所有这些情况下,指标都是 平均值,列都是 评级,但添加细分会创建不同的汇总和图表。

按列汇总

在查看表格时,您可以单击列标题以按此列创建表格的汇总。您将看到的汇总类型将根据列类型而有所不同。例如,您可以在每个新 Metabase 实例附带的示例数据库中的“帐户”表中查找平均座位数。

Summarize column

汇总图表或表格

  • 在查看表格或图表时,您可以单击右上角的“汇总”按钮,以向表格或图表添加汇总。

    您可以在“汇总依据”块中添加指标,通过单击“分组依据”块中的列名称来更改细分,并通过单击列名称旁边的 + 按钮来添加更多细分。

  • 在查询构建器中,您可以添加一个“汇总”块并选择指标、列和细分。查看查询构建器中提出问题,获取有关查询构建器的教程!

如何为您的汇总选择图表

当您单击具有汇总的问题上的“可视化”时,Metabase 将自动选择它认为最适合您结果的图表。例如,如果您按时间序列列分组,Metabase 将创建一个折线图,如果您按类别分组,则创建一个条形图。在大多数情况下,Metabase 选择的图表将是最佳选择。

您可以更改图表类型。Metabase 图表对您可以用于馈入图表的汇总中的细分的数量和种类有要求

图表类型 细分要求 细分用于...
数字、仪表和进度图表 单个数字,无细分 不适用
饼图 1 个细分 分段颜色
瀑布图和漏斗图 1 个细分 X 轴
地图 按具有地理数据的列划分的 1 个细分 位置
趋势图 按具有时间序列数据的列划分的 1 个细分 用于比较的时间段
折线图、条形图、行图、面积图和组合图 1 个或 2 个细分 X 轴(或行图的 Y 轴)的第一个细分,颜色的第二个细分
数据透视表 至少 2 个细分 行和列
散点图 1 到 3 个细分 X 轴的第一个细分,颜色的第二个细分,气泡大小的第三个细分

例如,您可以将饼图更改为条形图,但不能更改为数据透视表。

使用自定义表达式汇总

如果您想构建使用更复杂的中位数函数或包含“汇总含税订单的总额”之类的条件的汇总,您可以使用 Metabase 的自定义表达式

例如,您可以添加如下汇总

SumIf([Subtotal], [Tax] > 0)

查看我们的自定义表达式教程以了解更多信息。

汇总技巧

按日期和时间分组

您可以按日期和时间列分组。Metabase 将自动选择要分组的粒度:例如,对于日期列,它将自动按月份分组。您可以通过单击时间段来更改图表粒度

Change time series granularity

按数值变量分组

在 Metabase 中,您不仅可以按类别或日期分组,还可以按数值变量分组,例如 价格。Metabase 将为您对数值变量进行分箱,从而创建用于分组的“类别”

Autobin

如果您在按数值变量分组时选择“计数”作为指标,您将创建一个此变量的直方图(也称为分布图)。

Histogram

累积汇总

Metabase 有两种类型的累积汇总:累积总和和计数。对于每个记录,它们将返回表中直到此记录的所有值的总和或计数。

这些汇总的工作方式与其他汇总略有不同,因为它们返回的数据取决于表中数据的顺序。

假设您有一个按月份显示值的表格。累积总和将按如下方式计算

月份 累积总和
七月 5 5
十一月 4 5+4 = 9
三月 2 5 + 4 + 2 = 11

但是,如果更改月份排序(而值保持不变),则累积总和也会更改

月份 累积总和
三月 2 2
七月 5 2 + 5 = 7
十一月 4 2 + 5 + 4 = 11

不同值

Metabase 的“不同值”汇总返回列中不同值的数量。如果您想查看不同的值本身,您可以创建一个按该列细分的任何汇总。

例如,如果您想查看产品类别的所有不同值,您可以要求按产品类别分组的行数计数。这将为您提供一列包含所有不同类别值,以及一列包含每个类别的行数计数(您可以从结果中隐藏计数列

table with category values and count per category

SQL 专家须知

在 SQL 中,您通过将诸如 COUNT 之类的函数添加到 SELECT 语句中来汇总 — 类似于您如何添加基于其他列的值计算的新列

在 Metabase 中,这两个操作是不同的:要添加新列,您可以使用“自定义列”块,但要添加聚合,您可以使用“汇总”块。

下一步:添加自定义列

在 Metabase 中创建自定义列以计算新指标或清理您的数据

下一篇文章