多级聚合
如何使用查询构建器提问多个部分。
许多分析问题只需四个步骤即可解答
- 联接几个表以将所有所需信息集中到一个地方。
- 筛选数据,使其仅包含相关值。
- 分组并聚合这些值以创建您所需的洞察。
- 可视化结果,以便您了解数据所传达的信息。
然而,查询不必止步于此:Metabase 允许您逐步添加更多筛选器和计算更多汇总。为了了解其工作原理,让我们回顾一下分析师在探索每周每个类别销售多少件商品时可能会经历的步骤。
我们首先在示例数据库中计算每个产品类别每周销售的商品数量。销售信息在 Orders
表中,产品类别在 Products
表中,因此我们通过匹配产品 ID 来联接这些表。目前我们想了解所有产品类别,所以不需要筛选这些数据,但我们需要对其进行分组和汇总,以计算按类别划分的每周总数。
我们可以将目前的结果可视化为时间序列折线图,以获得以前没有的洞察。
然而,让我们进一步,在汇总步骤之后添加另一个筛选器,以从数据中排除小部件。当我们返回查询构建器并点击编辑器底部的添加筛选器按钮时,它会显示汇总数据中的三列:Created At
、Category
和 Count
。只需点击几下,我们就可以创建一个筛选器,删除类别为小部件的行。
如果我们保存筛选器并可视化数据,我们将得到一个结果表。如果您从可视化设置中选择折线图,该图表现在将只显示我们感兴趣的三个产品类别的线条。
现在假设我们想知道这些三个类别中每个类别每周销售的平均产品数量。我们已经计算了按类别划分的每周销售额,所以我们只需返回查询构建器,点击汇总按钮,选择 Average
,然后告诉 Metabase 我们希望按 Category
分组计算 Count
的平均值。
现在,我们的可视化正是我们想要的:每周销售的小玩意、小工具和小配件的平均数量。
生成此表的完整问题
还有其他方法可以计算此结果:例如,我们可以在计算第一次汇总之前筛选出小部件(大多数分析师会认为这是一种最佳实践,因为及早减小数据集大小可以提高性能)。重要的经验是,我们可以逐步构建洞察,因为每个答案都会引出新的问题,并且 Metabase 允许我们根据需要逐步添加操作。我们不必提前规划一切:如果我们发现总是从相同的操作开始,我们可以单独保存这些操作,如文章代码片段 vs. 保存的问题 vs. 视图中所述。
下一篇:在表中搜索
了解如何使用筛选器和自定义表达式在您的 SQL 问题和简单问题中进行搜索。现在,在您的表中查找单词或短语比以往任何时候都更容易。