什么是聚合?
聚合是指使用数学函数对数据进行汇总的过程,例如对某一列的值求平均或计算表中行数。由此产生的数字通常称为度量(metric),这与 Metabase 中的 指标(metrics)不同。
单个字段中的值本身可能意义不大,但当我们以某种特定方式组合这些值时,我们可以更全面地了解我们的数据。聚合是将其值折叠为单个结果的过程,通常与分组(grouping)结合执行——即根据特定值合并多行,例如按维度(如产品类别或国家/地区)进行分组。
聚合可以即时计算,但您也可以创建包含结果的汇总表,并将这些聚合函数的结果保存以供将来使用。汇总表在使用大型数据集时尤其有用;由于汇总表是预先计算的,因此依赖它们的查询可以运行得更快。
SQL 中的常见聚合函数
不同的数据库有不同的函数集,但以下是一些您将遇到的最常见的聚合函数
COUNT()- 计算表中的行数。AVG()– 计算字段中值的平均值。MIN()– 识别字段中的最小值。MAX()– 识别字段中的最大值。SUM()– 返回字段中值的总和。STDEV()– 计算字段中值的标准差。
示例聚合
使用 Metabase 的示例数据库,假设我们想按产品类别了解我们产品的平均价格。在这种情况下,我们将使用 Products 表。我们的 SQL 查询将如下所示:
SELECT
category,
avg(price)
FROM products
GROUP BY category
正如我们想要的,我们计算了 Products 表的 Price 列值的平均值,并根据 Category 字段的值对这些平均值进行了分组。
如果想在 Metabase 的查询构建器中执行相同的聚合,我们将通过“汇总”(Summarize)选择 Price 的“平均值”(Average),然后按 Category 分组,如下图所示: