度量和维度

如何在查询中处理定量和定性字段。

正如我们在概述中所述,典型的数据库由表组成,每个表包含行和列。根据其数据类型,这些列(或字段)包含定性或定量信息。维度度量是帮助我们区分字段中存储何种值,并进而决定我们能对这些字段进行何种操作的概念。

以表格形式查看数据只能帮助您到一定程度;在某个时候,您需要运行查询或执行操作,以使数据更有用,例如向您展示特定字段中存储信息的相关模式。这就是度量和维度发挥作用的地方。

维度:数据的“谁、什么、何地、何时”

包含定性信息的字段是维度。这些是描述性属性,例如产品类别、客户地址或国家/地区。维度可以包含数字字符(如字母数字客户 ID),但它们不是数字(例如,将列中的所有 ID 号加起来没有意义)。

日期字段也是维度,因为计算所有订单发生的年份之和可能没有帮助。相反,您可能希望按日期进行分组。日期字段是维度,但持续时间字段不是;您可以对持续时间字段进行有价值的计算,例如计算一个人在您的网站上花费的平均秒数。

可以这样想:如果您无法(或不会)计算某个字段,那么它就是一个维度。数字本身只讲述了部分故事,维度则提供描述和添加上下文。

让我们看看 Metabase 的示例数据库。如果我们选择浏览数据,然后选择 Products 表,我们将看到以表格形式呈现的产品信息。此表包含八列。

The Sample Database

要确定这些字段哪些是维度,请考虑哪些字段提供了关于产品的描述性信息。我们会立即注意到标题 (Title)类别 (Category)供应商 (Vendor) 是定性信息,它们用文字描述了产品。尽管包含数字,但 IDEan创建时间 (Created At) 也是维度,因为这些数字并非您希望计算的值。

度量:可计算的数值字段

度量是量化数据——例如订单小计、购买商品数量或在特定页面上花费的时间。因此,度量是可计算的。假设您有一个度量:购买商品数量,您可以计算平均订单数量、按降序排列数量、汇总所有数量等。

让我们再次查看 Products 表,以确定哪些字段是度量。这很容易,因为我们已经确定其中六个是维度。剩下的是价格 (Price)评分 (Rating),这很合理,因为计算这些字段对我们的业务可能很有价值。例如,我们可以计算客户对我们产品的平均评分。

至此,我们已经检查了此表中的每个字段,并确定了哪些是维度,哪些是度量。

维度

  • ID
  • Ean
  • 标题
  • 类别
  • 供应商
  • 创建时间

度量

  • 价格
  • 评分

在 Metabase 中使用度量和维度

在 Metabase 中提问时,您可以选择汇总您的数据、筛选数据,或同时进行。

按指标和分组汇总

汇总功能允许我们根据一些特定参数(通常是度量和维度)对数据进行封装。例如,我们可能希望查看按类别细分的产品平均价格。如上所述,价格 (Price) 字段是我们的度量,而类别 (Category) 是一个维度。

Summarizing the average price of products according to their category.

简而言之:如果您按特定指标进行汇总,则选择的字段是度量。如果您按分组进行汇总,该字段通常是维度。通常来说,指标指的是您对给定度量执行的定量操作类型。它们是这些汇总的“方式”,无论是平均值、标准差还是不同值的数量。

Metabase 中的指标是指您和您的团队希望反复使用的已保存的计算数字。管理员可以创建和编辑指标,这样您就不必在每次查询收入时重新计算收入值。

尽管分组通常涉及维度字段,但您可以按度量进行分组。如果这样做,Metabase 将自动将这些数值划分为区间,使分组更加有用。我们已根据价格(我们的度量)对 Products 表进行了分组,Metabase 会自动为我们划分价格区间。

When grouping by a measure like price, Metabase automatically bins the results.

筛选度量和维度

您可以在 Metabase 中根据度量或维度筛选数据。筛选器根据特定字段限制查询结果。我们决定筛选 Products 表,要求 Metabase 显示类别不是 Gizmo 且价格高于 50 美元的产品。在此查询中,我们同时按维度和度量进行了筛选。

Filtering products by category and price.

在 Metabase 中,分段是管理员可以创建和保存的命名筛选器,供组织内的所有 Metabase 用户重复使用和引用。分段有助于跨团队的数据分析标准化和一致性;例如,作为管理员,您可以创建正式定义特定客户或产品组的分段。

下一篇:事实表的分析工程

如何根据实际分析用例为事实表建模。

下一篇文章
© . All rights reserved.