汇总数据

使用 Metabase 的汇总功能来计算平均值、总计和其他指标

简介

当我们提出“上周每天有多少人下载了我们的应用程序?”这样的问题时,我们要求的是数据的**汇总**。在本指南中,您将了解在 Metabase 中将汇总添加到图表和表格的所有方法,并学习在 Metabase 中使用汇总的一些技巧和窍门。

我们假设您已经知道如何在查询构建器中提问

如何思考汇总

汇总意味着将来自多个记录的数据组合在一起并生成一个单一的数字,例如“产品评级的平均值”。因此,您需要确定

  • 用于组合值的数值**指标**:例如,计数、总和或平均值
  • **列**,其值将被组合:例如,数量、价格或评级
  • (可选)**分组依据**。它们决定了数据**分组**(或**分段**)的组。例如,您可以按月份计算订单数量,或按产品类别计算产品评级,或两者兼而有之。分组依据也通常称为**维度**。

这里的“维度”一词具有暗示性:对于折线图或条形图,第一个分组依据将作为 X 轴。

例如,在 Metabase 中您可以找到

  • 评级平均值

Average of rating in the query builder Visualization of avg rating as a single number

  • 按产品类别划分的评级平均值

Avg rating by category in the QB Avg rating by category as a bar chart

  • 按每个月的产品类别划分的订单总额平均值

Avg rating by category and month QB Avg rating by category and month as a time series

在所有这些情况下,指标都是 平均值,列是 评级,但添加分组依据会创建不同的汇总和图表。

按列汇总

查看表格时,您可以单击列标题以按此列创建表格的汇总。您将看到的汇总类型将根据列类型而异。例如,您可以在随每个新 Metabase 实例提供的示例数据库的“帐户”表格中找到平均席位数。

Summarize column

汇总图表或表格

  • 查看表格或图表时,您可以单击右上角的“汇总”按钮,将汇总添加到表格或图表中。

    您可以在“按此汇总”块中添加指标,通过单击“分组依据”块中的列名来更改分组依据,并通过单击列名旁边的 + 按钮来添加更多分组依据。

  • 在查询构建器中,您可以添加一个“汇总”块并选择指标、列和分组依据。查看查询构建器中提问教程,了解更多信息!

如何为您的汇总选择图表

当您点击带有汇总的查询的“可视化”时,Metabase 将自动选择它认为最适合您结果的图表。例如,如果您按时间序列列分组,Metabase 将创建折线图;如果您按类别分组,Metabase 将创建条形图。在大多数情况下,Metabase 选择的图表将是最佳选择。

您可以更改图表类型。Metabase 图表对汇总中可用于图表的分组依据的数量和类型有要求

图表类型 分组依据要求 分组依据用于...
数字、量表和进度图 单个数字,无分组依据 不适用
饼图 1 个分组依据 段的颜色
瀑布图和漏斗图 1 个分组依据 X 轴
地图 按具有地理数据的一列进行 1 个分组依据 地点
趋势图 按具有时间序列数据的一列进行 1 个分组依据 比较的时间段
折线图、条形图、行图、面积图和组合图 1 或 2 个分组依据 第一个分组依据用于 X 轴(或行图的 Y 轴),第二个分组依据用于颜色
透视表 至少 2 个分组依据 行和列
散点图 1 到 3 个分组依据 第一个分组依据用于 X 轴,第二个用于颜色,第三个用于气泡大小

例如,您可以将饼图更改为条形图,但不能更改为透视表。

使用自定义表达式进行汇总

如果您想构建使用更复杂函数(如中位数)或包含“汇总含税订单总额”等条件的汇总,您可以使用 Metabase 的自定义表达式

例如,您可以添加这样的汇总

SumIf([Subtotal], [Tax] > 0)

查看我们的自定义表达式教程以了解更多信息。

汇总技巧

按日期和时间分组

您可以按日期和时间列分组。Metabase 将自动选择要分组的粒度:例如,对于日期列,它将自动按月分组。您可以通过点击时间段来更改粒度

Change time series granularity

按数值变量分组

在 Metabase 中,您不仅可以按类别或日期分组:您还可以按数值变量(如 价格)分组。Metabase 将为您对数值变量进行分箱,创建用于分组的“类别”

Autobin

如果您在按数值变量分组时选择“计数”作为指标,您将创建此变量的直方图(也称为分布图)。

Histogram

累积汇总

Metabase 有两种类型的累积汇总:累积总和和计数。对于每条记录,它们将返回表格中直到该记录的所有值的总和或计数。

这些汇总与其他汇总略有不同,因为它们返回的数据取决于表格中数据的顺序。

假设您有一个按月份列出的值的表格。累积总和将按如下方式计算

月份 累积总和
七月 5 5
十一月 4 5+4 = 9
三月 2 5 + 4 + 2 = 11

但如果月份的顺序发生变化(而值保持不变),则累积总和也会发生变化

月份 累积总和
三月 2 2
七月 5 2 + 5 = 7
十一月 4 2 + 5 + 4 = 11

唯一值

Metabase 的“唯一值”汇总返回列中唯一值的**数量**。如果您想查看唯一值本身,您可以改用该列的分组依据创建任何汇总。

例如,如果您想查看产品类别的所有唯一值,您可以要求按产品类别分组的行数。这将为您提供一列包含所有唯一类别值,以及一列包含每个类别的行数(您可以隐藏计数列

table with category values and count per category

SQL 专家注意事项

在 SQL 中,您通过在 SELECT 语句中添加 COUNT 等函数来进行汇总——类似于您如何添加根据其他列的值计算的新列

在 Metabase 中,这两个操作是不同的:要添加新列,您可以使用自定义列块,但要添加聚合,您可以使用汇总块。

这有帮助吗?

感谢您的反馈!
分析师每周技巧
获取可行的见解
关于 AI 和数据的资讯,直接发送到您的收件箱
© . This site is unofficial and not affiliated with Metabase, Inc.