Metabase 作为指标存储
如何设置 Metabase,并创建模型以帮助确定指标存储的指标。

为什么需要指标存储
一个好的指标存储将能够帮助回答您一些最重要的问题
- 您的业务表现如何?您可以分解您的业务在不同领域的进展情况吗?
- 如果事情像现在这样继续下去会发生什么?下个季度的数据会是什么样?明年呢?
- 如果您改为针对一个或多个指标并增加或减少它们会发生什么?这些变化将如何影响您的目标结果?
- 您有多少跑道?
- 今年您应该招聘多少人?
设置数据库
本指南假定您已经设置了数据库。如果您还没有数据库,您可以快速使用 Postgres 设置一个数据库,或查看我们的 不同类型数据库 指南以决定使用其他数据库。
您可以使用 ETL(提取、转换、加载)工具将数据从您的应用程序移动到您的数据库。以下是一些入门建议
一旦您的数据库中有数据,您就可以继续设置并连接到 Metabase。
设置 Metabase
有两种基本方法可以 开始使用 Metabase
-
云端:我们为您托管 Metabase,以便您可以专注于使用它,而不是运行它。创建一个帐户并按照结账流程操作。这将引导您完成选择计划和设置基本安装的步骤。
将您的数据库连接到 Metabase
您可能已经在注册期间设置了数据库。但是,如果您需要添加数据库连接,请单击 Metabase 右上角的齿轮图标,然后导航到 管理设置 > 数据库 > 添加数据库 。请参阅 我们的文档。
在 Metabase 中创建模型
数据建模有助于说明您计划使用的数据类型,并在多个数据点之间建立连接。
使用原始数据可能会导致数据值不一致或错误/不良数据行。为了更好地可视化 Metabase 中数据的结构,我们建议首先创建数据模型。
使用数据模型,您将能够
- 保持数据准确性。
- 为多种用例标准化数据。
- 清理和组织您的数据,使其最适合分析。
- 更快地识别和修复问题。
数据建模还有助于丰富您的数据。例如,您现在可以添加列,或重命名列和值。
不同类型的模型
有许多不同类型的 数据模型,例如逻辑/物理模型,如 关系型、星型模式 或 平面表(也称为宽表或 OBT) 模型。
对于数据仓库,星型和平面表模型是最常用的。但是,平面表正变得越来越被企业广泛使用,因为它们也可以更好地支持最终用户。
由于最终目标是将您的指标导入电子表格,我们建议在 Metabase 中建模为平面表。通过将您的数据组织到一个平面表中,您可以在列和行中看到您的所有数据,类似于电子表格。
在 Metabase 中创建平面表模型
首先,在右上角选择 新建 + > 模型 。接下来,选择查询构建器选项并选择您的数据库。选择您要添加到模型中的数据。保存模型。
您的数据将自动放入列和行中,就像一个平面表。然后,您可以编辑和添加元数据以完成您的模型。
添加和编辑元数据
向模型添加元数据可以帮助整合数据以供自助服务使用。例如,多人可以从相同的数据中提取数据,而不会对数据代表什么产生歧义。
Metabase 还使用元数据来呈现用于列的过滤器,并启用图表上的钻取问题。
要在模型中添加或编辑元数据,请单击模型顶部的元数据按钮。在这里,您可以编辑列名、类型、描述以及它的显示方式。
识别关键指标
有了建模数据,您现在可以为您的指标存储识别关键指标。
在这个定义中,指标是任何可量化的度量。您可以使用指标创建时间序列,这将帮助您跟踪和可视化数据趋势、周期性变化、季节性变化和不规则性。
此处指标和时间序列的好处取决于您的用例。例如,在财务建模的情况下,您可以将这些指标导入电子表格,以创建实际值、预测和用于建模替代情景的输入。
如果您是指标新手,并且不太确定要跟踪什么,请先查看我们关于 如何为您的业务开发最重要的指标 的博客文章。下面的演练还提供了在 Metabase 中创建问题时如何识别关键指标的背景信息。
创建一个问题
当您准备好创建指标时,在 Metabase 中创建一个 问题。从+ 新建下拉菜单中,选择问题,然后选择您的模型。
Metabase 中的问题是查询及其结果和可视化。通常,数据团队编写 SQL 查询以从数据库检索数据。Metabase SQL 编辑器 以相同的方式运行。
但是,在创建问题时使用 Metabase 查询构建器 可以为您提供额外的钻取功能,用于您的可视化。
使用查询构建器从您的数据模型表中选择特定数据,并 汇总数据。此摘要由两部分组成:您关心的一个或多个汇总数字(在数据术语中称为“指标”),以及您希望如何查看该数字的分组或细分。
一些常见的指标建议(如平均值)已经出现在 汇总 下。您可以使用这些指标,或识别您自己的指标。人们倾向于以两种常见方式汇总数据:计算表中的行数,或获取数值列的总和或平均值。
例如,要回答“上周每天有多少人下载了我们的应用程序?”这个问题,您需要创建一个指标来 计数 下载应用程序的人数 。您需要按“每天”对指标进行分组。并且您需要为“上周”过滤行。
使用查询构建器构建您的摘要,如果需要,请按时间、地点、类别等 分组 您的 指标。
您还可以使用 自定义表达式(其操作方式类似于电子表格软件中的公式和函数)来建立更复杂的指标。
例如,在某些 情景 中,您可能需要使用自定义表达式,例如创建 自定义列 以计算特定指标,如 NPS 评分。
保存您的问题,这将保存您的指标。
您甚至可以从您保存的指标构建新模型。例如,如果您正在创建业务指标(如每月 ARR),您可以 将您的每月 ARR 问题转换为模型。