数据和商业智能术语表

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
V
W
X

什么是聚合?

聚合是指通过数学函数汇总数据的行为,例如计算列中的平均值或计算表中的行数。结果数字通常称为度量,这与 Metabase 中的度量不同。

字段中的单个值本身可能没有多大意义,但当我们以某种特定方式组合这些值时,我们可以更全面地描绘我们的数据。聚合是将这些值折叠成单个结果的过程,通常与分组结合执行——即根据某个值(例如按产品类别或国家/地区等维度)组合多行。

聚合可以即时计算,但您也可以使用结果创建汇总表,并保存这些聚合函数的结果以备将来使用。汇总表在处理大型数据集时特别有用;由于汇总表是预先计算的,因此依赖它们的查询可以运行得更快。

SQL 中常见的聚合函数

不同的数据库有不同的函数集,但这里有一些您会遇到的最常见的聚合函数

  • COUNT() - 计算表中的行数。
  • AVG() – 计算字段中值的平均值。
  • MIN() – 标识字段中的最小值。
  • MAX() – 标识字段中的最大值。
  • SUM() – 返回字段中值的总和。
  • STDEV() – 计算字段中值的标准差。

聚合示例

使用 Metabase 的示例数据库,假设我们想知道按产品类别分组的产品平均价格。在这种情况下,我们将使用Products表。我们的 SQL 查询将如下所示

SELECT
    category,
    avg(price)
FROM products
GROUP BY category

正如我们所愿,我们计算了Products表的Price列中的平均值,并根据Category字段中的值对这些平均值进行了分组。

如果要在 Metabase 的查询构建器中执行相同的聚合,我们将按Price平均值进行汇总,然后按Category进行分组,如下图所示

<em>Fig. 1</em>. Performing an aggregation in the query builder: average price of products grouped by product category.
图 1. 在查询构建器中执行聚合:按产品类别分组的产品平均价格。

相关术语

延伸阅读

这有帮助吗?

感谢您的反馈!
© . This site is unofficial and not affiliated with Metabase, Inc.