多级聚合

如何使用查询构建器提出包含多个部分的问题。

许多分析问题只需四个步骤即可解答

  1. 连接几个表格,将所有必需的信息放在一个位置。
  2. 筛选数据,使其仅包含相关值。
  3. 分组聚合这些值,以创建您需要的见解。
  4. 可视化结果,以便您可以了解数据告诉您的内容。

但查询不必就此止步:Metabase 允许您逐步添加更多过滤器和计算更多摘要。为了了解其工作原理,让我们跟踪分析师在探索每周销售的每个类别的商品数量时可能经历的步骤。

我们首先计算示例数据库中每个产品类别每周销售的商品数量。有关销售的信息在 Orders 表中,产品类别在 Products 表中,因此我们通过匹配产品 ID 将它们连接起来。目前,我们想了解所有产品类别,因此我们不需要筛选此数据,但我们需要对其进行分组和汇总,以计算每个类别的每周总数。

Joining orders and products to bring information together, then grouping and summarizing to calculate weekly totals by category.

我们可以将目前的结果可视化为时间序列)折线图,以获得我们以前没有的见解。

Visualizing weekly totals by category.

但是,让我们更进一步,在摘要步骤之后添加另一个过滤器,以从我们的数据中删除小部件。当我们返回到查询构建器并单击编辑器底部的添加过滤器按钮时,它会向我们显示摘要数据中的三列:创建时间类别计数。只需单击几下,我们就可以创建一个过滤器,删除类别为小部件的行。

Defining a filter to remove one category from the summary data.

如果我们保存过滤器并可视化数据,我们将获得结果表。如果您从可视化设置中选择折线图,则该图表现在仅显示我们感兴趣的三个产品类别的折线。

Visualizing the filtered weekly totals by category.

现在假设我们想知道每周销售的这三个类别中每个类别的产品的平均数量。我们已经计算了每个类别的每周销售额,因此我们所要做的就是返回到查询构建器,单击汇总按钮,选择 平均值,然后告诉 Metabase 我们想要按 类别 分组的 计数 的平均值。

Adding a second summarization step to condense the data even further.

我们的可视化现在正是我们想要的:每周销售的小玩意、小工具和 gizmos 的平均数量。

The final summary shows a few key numbers.

生成此表的完整问题

The final analysis shows each step in order from start to finish.

还有其他方法可以计算此结果:例如,我们可以在计算第一个摘要之前过滤掉小部件(大多数分析师会认为这是最佳实践,因为尽早减少数据集的大小可以提高性能)。重要的教训是,我们可以逐步构建见解,因为每个答案都会引出新的问题,并且 Metabase 允许我们逐个添加操作。我们不必提前计划所有内容:如果我们发现我们总是从相同的操作开始,我们可以将这些操作单独保存,如文章 SQL 片段 vs. 已保存的问题 vs. 视图 中所述。

下一步:在表格中搜索

了解如何使用过滤器和自定义表达式在 SQL 问题和简单问题中进行搜索。现在比以往任何时候都更容易在表格中查找单词或短语。

下一篇文章