多级聚合

如何使用查询构建器提出多部分问题。

许多分析问题只需四个步骤就可以回答。

  1. 加入 几张表,以一个地方获取所有所需信息。
  2. 筛选 数据,使其只包括相关的值。
  3. 分组聚合 这些值,以创建您需要的洞察。
  4. 可视化 结果,以便您理解数据在告诉您什么。

不过,查询不必止于此:Metabase 允许您逐步添加更多筛选器和计算更多摘要。为了了解这是如何工作的,让我们追踪分析师在探索每周每个类别销售的物品数量时可能采取的步骤。

我们首先在 示例数据库 中计算每周每个产品类别销售的物品数量。销售信息在 Orders 表中,产品类别在 Products 表中,因此我们通过匹配产品 ID 将它们连接起来。目前我们想知道关于所有产品类别的情况,所以不需要筛选这些数据,但我们确实需要对其进行分组和汇总,以计算按类别的周总数。

Joining orders and products to bring information together, then grouping and summarizing to calculate weekly totals by category.

我们可以将到目前为止的结果可视化为一组时间序列线图,以获得之前没有的洞察。

Visualizing weekly totals by category.

然而,让我们进一步,在汇总步骤之后添加另一个筛选器,以从数据中排除小部件。当我们返回到查询构建器并点击编辑器底部的 添加筛选器 按钮时,它显示给我们汇总数据中的三个列:Created AtCategoryCount。几秒钟就可以创建一个筛选器,删除类别为小部件的行。

Defining a filter to remove one category from the summary data.

如果我们保存筛选器并可视化数据,我们将得到一个结果表。如果您从可视化设置中选择折线图,则图表现在只显示我们对三个感兴趣的产品类别的线条。

Visualizing the filtered weekly totals by category.

现在假设我们想知道这三个类别每周销售的平均产品数量。我们已经按类别计算了每周销售量,所以我们需要做的就是返回查询构建器,点击 汇总按钮,选择 平均,然后告诉 Metabase 我们想要按 CategoryCount 进行平均。

Adding a second summarization step to condense the data even further.

我们的可视化现在正是我们想要的:每周销售的 doohickeys、gadgets 和 gizmos 的平均数量。

The final summary shows a few key numbers.

产生此表的完整问题

The final analysis shows each step in order from start to finish.

还有其他方法可以计算此结果:例如,我们可以在计算第一个摘要之前过滤掉小部件(大多数分析师会认为这是一种最佳实践,因为早期减少数据集的大小可以改善性能)。重要的一课是我们可以逐步构建洞察,因为每个答案都会引出新的问题,Metabase 允许我们按顺序添加操作。我们不必提前规划一切:如果我们发现我们总是从相同的操作开始,我们可以像在文章 SQL 片段与已保存问题与视图 中解释的那样,将它们分别保存。

下一节:在表中搜索

学习如何在您的SQL问题和简单问题中使用筛选器和自定义表达式进行搜索。在您的表中查找单词或短语现在比以往任何时候都要简单。

下一篇文章