多级聚合
如何使用查询构建器提问多部分问题。
许多分析问题只需四个步骤即可回答
- 连接几个表以将所有必需信息集中到一个地方。
- 筛选数据,使其仅包含相关值。
- 分组并聚合这些值以创建您所需的洞察。
- 可视化结果,以便您能够理解数据告诉您什么。
然而,查询不必就此止步:Metabase 允许您逐步添加更多筛选器并计算更多摘要。为了了解这是如何工作的,让我们追踪分析师在探索每周销售的每个类别商品的数量时可能经历的步骤。
我们首先在示例数据库中计算每个产品类别每周销售的商品数量。销售信息在 Orders
表中,产品类别在 Products
表中,因此我们通过匹配产品 ID 来连接它们。目前我们想了解所有产品类别,因此我们不需要筛选此数据,但我们需要对其进行分组和汇总,以计算按类别划分的每周总数。
我们可以将到目前为止的结果可视化为时间序列折线图,以获得以前没有的洞察。
但是,让我们更进一步,在汇总步骤之后添加另一个筛选器,以从数据中删除小部件。当我们返回查询构建器并单击编辑器底部的添加筛选器按钮时,它会显示汇总数据中的三列:Created At
、Category
和 Count
。单击几下即可创建一个筛选器,删除类别为小部件的行。
如果我们保存筛选器并可视化数据,我们将得到一个结果表。如果从可视化设置中选择折线图,则图表现在只显示我们感兴趣的三种产品类别的线条。
现在假设我们想知道这三个类别每周销售的产品的平均数量。我们已经计算出按类别划分的每周销售额,所以我们所要做的就是返回查询构建器,点击汇总按钮,选择平均值
,然后告诉 Metabase 我们想按类别
对计数
求平均值。
我们的可视化现在正是我们想要的:每周销售的小玩意、小工具和奇特装置的平均数量。
产生此表的完整问题
还有其他方法可以计算此结果:例如,我们可以在计算第一个摘要之前筛选出小部件(大多数分析师认为这是一种最佳实践,因为及早减小数据集大小可以提高性能)。重要的教训是,我们可以逐步构建洞察,因为每个答案都会引出新问题,并且 Metabase 允许我们随着问题的出现逐一添加操作。我们不必提前计划所有事情:如果我们发现总是以相同的操作开始,我们可以将这些操作单独保存,如文章片段、已保存问题与视图中所述。