数据摘要

使用 Metabase 的摘要来计算平均值,总数和其他指标

简介

当我们提出像“上周每天有多少人下载了我们的应用?”这样的问题时,我们是在请求数据的一个摘要。在本指南中,您将了解在Metabase中为图表和表格添加摘要的所有方法,并学习一些在Metabase中使用摘要的技巧和窍门。

我们假设您已经知道如何在查询构建器中提出问题

如何考虑摘要

摘要意味着将来自多个记录的数据合并在一起,生成一个单一数字,例如“产品评分的平均值”。因此,您需要确定

  • 将要用于合并值的数值指标:例如,计数、求和或平均值
  • 将要合并值的:例如,数量、价格或评分
  • (可选)分组。它们确定数据是如何被分割(或分组)的。例如,您可以根据月份计算订单数量,或根据产品类别计算产品评分,或两者都计算。分组也常被称为维度

在这里,“维度”这个词有提示作用:对于折线图或柱状图,第一个分组将作为X轴。

例如,在Metabase中您可以找到

  • 评分平均值

Average of rating in the query builder Visualization of avg rating as a single number

  • 按产品类别计算评分平均值

Avg rating by category in the QB Avg rating by category as a bar chart

  • 按产品类别计算每月平均订单总额

Avg rating by category and month QB Avg rating by category and month as a time series

在这些所有情况下,指标是平均值,列是评分,但添加分组会创建不同的摘要和图表。

按列摘要

在查看表格时,您可以单击列标题通过此列创建表格的摘要。您将看到的摘要类型将根据列类型而异。例如,您可以在每个新Metabase实例附带的标准数据库中找到“账户”表中的平均座位数。

Summarize column

摘要图表或表格

  • 在查看表格或图表时,您可以在右上角单击“摘要”按钮向表格或图表添加摘要。

    您可以在“按以下方式摘要”块中添加指标,通过单击“按以下方式分组”块中的列名更改分组,并通过单击列名旁边的+按钮添加更多分组。

  • 在查询构建器中,您可以添加摘要块并选择指标、列和分组。查看在查询构建器中提出问题以获取查询构建器教程!

如何为您的摘要选择图表

当您在带有摘要的问题上单击“可视化”时,Metabase将自动选择它认为最适合您结果的图表。例如,如果您根据时间序列列进行分组,Metabase将创建折线图;如果您根据类别分组,则创建柱状图。在大多数情况下,Metabase选择的图表将是最佳选项。

您可以更改图表类型。Metabase图表对在摘要中用于图表的分组数量和类型有要求

图表类型 分组要求 分组用于...
数量、仪表和进度图表 单个数字,无分组 N/A
饼图 1个分组 段落的颜色
瀑布图和漏斗图 1个分组 X轴
地图 按具有地理数据的列进行1个分组 位置
趋势图 按具有时间序列数据的列进行1个分组 比较的时间段
折线图、柱状图、行图、面积图和组合图 1或2个分组 第一个分组用于X轴(或行图的Y轴),第二个分组用于颜色
交叉表 至少 2个分组 行和列
散点图 1到3个分组 这是X轴的第一个突破点,第二个是颜色,第三个是气泡大小

例如,您可以将饼图改为柱状图,但不能转换为交叉表。

使用自定义表达式总结

如果您想构建使用更复杂的函数(如中位数)或包含条件(如“计算含税订单的总数”)的摘要,可以使用Metabase的自定义表达式

例如,您可以添加如下摘要

SumIf([Subtotal], [Tax] > 0)

查看我们的自定义表达式教程了解更多信息。

总结技巧

按日期和时间分组

您可以根据日期和时间列进行分组。Metabase将自动选择一个粒度进行分组:例如,对于日期列,它将自动按月份分组。您可以通过点击时间段来更改图形的详细程度

Change time series granularity

按数值变量分组

在Metabase中,您不仅可以按类别或日期分组,还可以按数值变量分组,如价格。Metabase将为您对数值变量进行分箱,创建用于分组的“类别”

Autobin

如果您在按数值变量分组时选择“计数”作为度量标准,您将创建此变量的直方图(也称为分布图)。

Histogram

累计总结

Metabase有两种类型的累计总结:累计总和和计数。对于每条记录,它们将返回表中所有值到这条记录的总和或计数。

这些总结与其他总结略有不同,因为它们返回的数据取决于表中数据的顺序。

假设您有一个按月份值组成的表格。累计总和将按如下方式计算

月份 累计总和
七月 5 5
十一月 4 5+4 = 9
三月 2 5 + 4 + 2 = 11

但是,如果月份的顺序发生变化(而值保持不变),则累计总和也会发生变化

月份 累计总和
三月 2 2
七月 5 2 + 5 = 7
十一月 4 2 + 5 + 4 = 11

不同值

Metabase的“不同值”总结返回列中不同值的数量。如果您想查看实际的不同值,您可以创建任何摘要,并使用该列进行分拆。

例如,如果您想查看所有产品类别的不同值,您可以要求按产品类别对行进行计数。这将为您提供包含所有不同类别值的列,并为每个类别提供行计数列(您可以从结果中隐藏计数列

table with category values and count per category

SQL专家注意

在SQL中,您通过在SELECT语句中添加像COUNT这样的函数来总结——类似于您根据其他列的值添加基于值的计算新列的方式。

在Metabase中,这两个操作是不同的:要添加新列,您可以使用自定义列块,但要添加聚合,您使用摘要块。

下一步:添加自定义列

在Metabase中创建自定义列以计算新的度量标准或清理您的数据

下一篇文章