聚合
什么是聚合?
聚合是指使用数学函数对数据进行汇总的行为,例如对列中的值进行平均,或计算表中的行数。所得的数字通常被称为指标,这与 Metabase 中的指标不同。
一个字段中的单个值本身可能没有太多意义,但当我们以某种特定方式组合这些值时,我们可以绘制出更全面的数据图。聚合是将这些值合并为单个结果的过程,通常与分组结合进行——即基于某个值(例如,按维度分组,如产品类别或国家)组合多行。
聚合可以在实时计算,但您也可以创建摘要表来保存您的结果,并在将来使用这些聚合函数。当处理大量数据集时,摘要表尤其有用;由于摘要表是预先计算的,依赖于它们的查询可以运行得更快。
SQL中的常见聚合函数
不同的数据库有不同的函数集,但以下是一些您可能会遇到的常见聚合函数。
COUNT()
- 计算表中的行数。AVG()
– 计算字段值的平均值。MIN()
– 识别字段中的最小值。MAX()
– 识别字段中的最大值。SUM()
– 返回字段中值的总和。STDEV()
– 计算字段中值的方差。
示例聚合
使用Metabase的示例数据库,假设我们想知道产品按产品类别的平均价格。在这种情况下,我们将使用Products
表。我们的SQL查询将如下所示
SELECT
category,
avg(price)
FROM products
GROUP BY category
正如我们想要的,我们已经计算了Products
表中Price
列的平均值,并按其在Category
字段中的值进行分组。
如果我们想在Metabase的查询构建器中执行相同的聚合,我们将通过Price
的平均值进行总结,然后按Category
分组,如下面的图像所示