汇总数据

使用 Metabase 的汇总功能来计算平均值、总计和其他指标

简介

当我们提出诸如“上周每天有多少人下载了我们的应用程序?”之类的问题时,我们是在要求提供数据的汇总。在本指南中,您将看到在 Metabase 中向图表和表格添加汇总的所有方法,并学习在 Metabase 中使用汇总的一些技巧和窍门。

我们假设您已经知道如何在查询构建器中提问

如何考虑汇总

汇总意味着将来自多个记录的数据组合在一起并生成一个数字,例如“产品评分的平均值”。因此您需要确定

  • 将用于组合值的数值指标:例如,计数、求和或平均值
  • 将组合其值的:例如,数量、价格或评分
  • (可选)分组字段。它们确定数据的分组(或分组依据。例如,您可以按月份计算订单数量,或按产品类别计算产品评分,或两者兼而有之。分组字段也常被称为维度

这里“维度”一词具有暗示性:对于折线图或条形图,第一个分组将用作 X 轴。

例如,在 Metabase 中您可以找到

  • 评分平均值

Average of rating in the query builder Visualization of avg rating as a single number

  • 按产品类别划分的评分平均值

Avg rating by category in the QB Avg rating by category as a bar chart

  • 每个月按产品类别划分的订单总额平均值

Avg rating by category and month QB Avg rating by category and month as a time series

在所有这些情况下,指标是 平均值,列是 评分,但添加分组会创建不同的汇总和图表。

按列汇总

查看表格时,您可以点击列标题以按此列创建表格汇总。您将看到的汇总类型将根据列类型而异。例如,您可以在每个新 Metabase 实例附带的示例数据库中的“账户”表中找到平均席位数。

Summarize column

汇总图表或表格

  • 查看表格或图表时,您可以点击右上角的“汇总”按钮,向表格或图表添加汇总。

    您可以在“汇总依据”块中添加指标,通过点击“分组依据”块中的列名来更改分组字段,并通过点击列名旁边的“+”按钮添加更多分组字段。

  • 在查询构建器中,您可以添加一个“汇总”块并选择指标、列和分组字段。请查看查询构建器中提问教程!

如何为您的汇总选择图表

当您点击带有汇总的查询上的“可视化”时,Metabase 将自动选择它认为最适合您结果的图表。例如,如果您按时间序列列分组,Metabase 将创建折线图;如果您按类别分组,Metabase 将创建条形图。在大多数情况下,Metabase 选择的图表将是最佳选择。

您可以更改图表类型。Metabase 图表对汇总中可用于图表的分组数量和类型有要求

图表类型 分组要求 分组用于..
数字、量表和进度图表 单个数字,无分组 不适用
饼图 1 个分组 扇形颜色
瀑布图和漏斗图 1 个分组 X 轴
地图 按具有地理数据的列进行 1 个分组 位置
趋势图 按时间序列数据列进行 1 个分组 比较的时间段
折线图、条形图、行图、面积图和组合图 1 或 2 个分组 第一个分组用于 X 轴(行图为 Y 轴),第二个用于颜色
数据透视表 至少 2 个分组 行和列
散点图 1 到 3 个分组 第一个分组用于 X 轴,第二个用于颜色,第三个用于气泡大小

例如,您可以将饼图更改为条形图,但不能更改为数据透视表。

使用自定义表达式汇总

如果您想构建使用更复杂函数(如中位数)或包含“汇总含税订单的总计”等条件的汇总,您可以使用 Metabase 的自定义表达式

例如,您可以添加这样的汇总

SumIf([Subtotal], [Tax] > 0)

请查看我们的自定义表达式教程了解更多信息。

汇总技巧

按日期和时间分组

您可以按日期和时间列进行分组。Metabase 将自动选择一个粒度进行分组:例如,对于日期列,它将自动按月份分组。您可以通过点击时间段来更改粒度。

Change time series granularity

按数值变量分组

在 Metabase 中,您不仅可以按类别或日期分组:您还可以按数值变量(如 价格)分组。Metabase 会为您对数值变量进行分箱,创建用于分组的“类别”。

Autobin

如果您在按数值变量分组时选择“计数”作为指标,您将创建此变量的直方图(也称为分布图)。

Histogram

累积汇总

Metabase 有两种类型的累积汇总:累积求和和计数。对于每条记录,它们将返回表格中直到该记录的所有值的总和或计数。

这些汇总与其他汇总略有不同,因为它们返回的数据取决于表格中数据的顺序。

假设您有一个按月份显示值的表格。累积求和将按如下方式计算:

月份 累积求和
七月 5 5
十一月 4 5+4 = 9
三月 2 5 + 4 + 2 = 11

但如果月份的顺序改变(而值保持不变),则累积求和也会改变。

月份 累积求和
三月 2 2
七月 5 2 + 5 = 7
十一月 4 2 + 5 + 4 = 11

去重值

Metabase 的“去重值”汇总返回该列中去重值的数量。如果您想查看去重值本身,您可以改为创建任何按该列分组的汇总。

例如,如果您想查看产品类别的所有去重值,您可以按产品类别分组来计算行数。这将为您提供一列包含所有去重类别值,以及一列包含每个类别的行计数(您可以从结果中隐藏计数列

table with category values and count per category

SQL 专家注意事项

在 SQL 中,您通过在 SELECT 语句中添加像 COUNT 这样的函数来汇总——类似于您如何根据其他列的值计算新列。

在 Metabase 中,这两个操作是不同的:要添加新列,您可以使用“自定义列”块,但要添加聚合,您使用“汇总”块。

下一步:添加自定义列

在 Metabase 中创建自定义列以计算新指标或清理数据

下一篇文章
© . All rights reserved.