Metabase作为指标存储
如何设置 Metabase 并创建模型以帮助识别指标存储中的指标。
为什么需要指标存储
一个好的指标存储将能够帮助回答你的一些最重要的问题
- 你的业务表现如何?你能分解你的业务在不同领域中的进展情况吗?
- 如果事情继续按目前的样子发展,会发生什么?下个季度、下一年会是什么样子?
- 如果你决定针对一个或多个指标并增加或减少它们,会发生什么?这些变化将如何影响你的目标结果?
- 你有多少发展空间?
- 今年你应该招聘多少人?
设置数据库
本指南假设您已经建立了一个数据库。如果您还没有数据库,您可以快速使用 Postgres 或参考我们关于 不同类型数据库 的指南来选择另一个。
您可以使用 ETL(提取、转换、加载)工具将数据从您的应用程序移动到您的数据库。以下是一些建议以开始
一旦您的数据库中有数据,您就可以继续设置并连接到 Metabase。
设置 Metabase
开始使用 Metabase 有两种基本方法 [如何运行 Metabase 生产环境]
-
云服务:我们为您托管 Metabase,这样您就可以专注于使用它,而不是运行它。创建一个账户并遵循结账流程。这将引导您选择一个计划并设置基本安装。
将您的数据库连接到 Metabase
您可能已经在注册时设置了数据库。但是,如果您需要添加数据库连接,请点击 Metabase 右上角的齿轮图标,导航到 管理设置 > 数据库 > 添加数据库。请参阅 我们的文档。
在 Metabase 中创建模型
数据建模有助于说明您计划使用的数据类型,并建立多个数据点之间的连接。
处理原始数据可能会导致数据值不一致,或出现错误/差数据行。为了更好地在 Metabase 中可视化数据结构,我们建议首先创建数据模型。
有了数据模型,您将能够
- 维护数据准确性。
- 标准化数据以适用于多个用例。
- 清理和组织数据,使其最适合分析。
- 更快地识别和修复问题。
数据建模还有助于丰富您的数据。例如,您现在可以添加列,或重命名列和值。
不同类型的模型
存在许多不同类型的数据模型,例如关系型/物理模型,如 关系型、星型模式 或 平面表(也称为宽表或 OBT)模型。
对于数据仓库,星型和平面表模型最常使用。然而,平面表正越来越受到企业的青睐,因为它也能更好地支持最终用户。
由于最终目标是导入指标到电子表格,我们建议在 Metabase 中以平面表的形式建模。通过将数据组织到单个平面表中,您可以在列和行中查看所有数据,类似于电子表格。
在 Metabase 中创建平面表模型
首先,在右上角选择 新建 + > 模型。接下来,选择查询构建器选项并选择您的数据库。选择要添加到模型中的数据。保存模型。
数据将自动放入列和行中,类似于平面表。然后您可以编辑并添加元数据以完成模型。
添加和编辑元数据
将元数据添加到您的模型中可以帮助您整合数据,以便自助使用。例如,多个人可以从相同的数据中提取,而不会对数据的代表含义产生歧义。
Metabase 还使用元数据来在列上应用过滤器,并在图表上启用钻取问题。
要添加或编辑模型中的元数据,请点击您模型顶部的“元数据”按钮。在这里,您可以编辑列名、类型、描述以及其显示方式。
识别关键指标
使用您建模的数据,您现在可以识别您度量存储中的关键指标。
在本定义中,指标是任何可量化的度量。您可以使用指标来创建时间序列,这有助于您跟踪和可视化数据趋势、周期性变化、季节性变化和不规则性。
指标和时间序列的好处取决于您的用例。例如,在金融建模的情况下,您可以将这些指标导入电子表格中,以创建实际值、预测和建模替代场景的输入。
如果您对指标不熟悉,不确定要跟踪什么,请参阅我们关于如何在开发业务最重要的指标的博客文章。下面的演练也提供了在 Metabase 中创建问题时如何识别关键指标的相关背景。
创建问题
当您准备好创建指标时,在 Metabase 中创建一个问题。从 + 新 下拉菜单中选择问题,然后选择您的模型。
Metabase 中的问题包括查询及其结果和可视化。通常,数据团队编写 SQL 查询从数据库中检索数据。Metabase 的SQL 编辑器以相同的方式运行。
然而,在创建问题时使用 Metabase 的查询构建器,您将获得与可视化相关的额外钻取功能。
使用查询构建器从您的数据模型表中选择特定的数据,并总结数据。这个总结由两部分组成:您关心的一个或多个汇总数字(在数据术语中称为“指标”),以及您希望按何种方式对数字进行分组或分解。
一些常见的指标建议,如平均值,将已出现在 汇总 下。您可以使用这些指标,或识别自己的指标。人们通常以两种常见方式总结数据:计算表中的行数,或获取数值列的总和或平均值。
例如,为了回答“上周每天有多少人下载了我们的应用?”这个问题,您会创建一个计量指标,该指标会计算下载应用的人数。您将指标按“每天”分组。并且您将行筛选为“上周”。
使用查询构建器构建您的总结,并在需要时,按时间、地点、类别等对您的指标进行分组。
您还可以使用 自定义表达式,这些表达式类似于电子表格软件中找到的公式和函数,以建立更复杂的指标。
例如,有几个场景可能需要使用自定义表达式,例如创建一个自定义列来计算特定的指标,如NPS 分数。
保存您的问题,这将保存您的指标。
您甚至可以从保存的指标中构建新的模型。例如,如果您正在创建业务指标,如月度 ARR,您可以将您的月度 ARR 问题转换为模型。