保持您的分析有序
如何保持你的分析有序,因为用户数量、问题和仪表盘的数量不可避免地增加。
如果你想保持竞争力,你需要让组织中的每个人都能够访问他们需要的数据来做出更好的决策。然而,这种数据民主化的代价是分析的大量涌入——这可能会让你难以知道哪些分析是你可以信赖的。
了解这一点很重要:这个问题没有治疗方法。总会有一定程度的分析熵需要驯服,但有了适当的工具和流程,你将能够控制不可避免的混乱。
数据民主化的问题
这些问题的核心在于定义:我们如何具体定义像收入、终身价值、流失等业务逻辑?在这里,“定义”意味着通常任何对组织重要的可量化概念。不仅要知道X是什么,还要知道我们如何计算X?这些术语是你衡量组织的方式,定义得越具体、越一致,就越好。
以下是我们需要防范的定义问题之一
人们在哪里找到特定的定义?
一旦你开始从不同的角度切割你的数据来观察你的组织,定义就会激增:收入、流失率、预期终身价值等等。如果我们想了解为什么我们的客户会流失,我们应该参考哪些定义?我们需要定义哪些新定义?并且(实际上)我能在Metabase中找到这些官方定义吗?
冲突的定义
我们指的是:我们是否真的在谈论同一件事?以收入为例。对于销售团队,收入可能是预订,但会计人员指的是已确认的收入累计,而市场营销团队说的是终身收入。
重新定义,或者是标准定义是什么?
如果我们发现同一概念有多个定义,我们应该信任哪一个?它们都是错误的吗?即使多个团队都同意我们应该追踪周环比预订,预订的统计方法也可能因查询而异:一个查询可能是准确的,另一个可能是错误的且未经审查的,由一个不知道官方计算预订的查询的分析员创建;或者忘记排除测试数据,或者没有考虑到折扣,或者简单地创建了一个新的查询,以不同的方式切割预订。
变化的定义
计算月收入的计算方法可能会随着一些收入流的结束和其他流量的增加而改变。如果我们有不同部门使用相同的定义在多个问题、模型和仪表盘中,我们应该如何管理定义的变化?
驯服混乱的策略
在确定了问题后,让我们谈谈如何减轻它们。我们将讨论分为两类:Metabase提供的功能和您应该采用的组织流程。
功能
以下是一些与Metabase一起提供的工具,可以帮助你保持组织有序。你可能已经熟悉了问题、仪表盘和集合,但在这里列举出来,以便全面了解工具集。
模型
模型 允许您将常用概念编码化,作为新问题的起点,这些新问题可以轻松地反复引用。通过查询构建器和 SQL 问题构建的问题可以转换为模型,并且它们将在搜索结果中显示得更高,以鼓励在您的组织中使用。您还可以自定义模型元数据,允许您指定列类型,这样您就可以在 SQL 问题中进行钻取。
例如,您可以编写一个问题来汇总和计算有关“活跃用户”(您如何定义一个人为“活跃”)的信息,然后将其转换为模型,以便人们知道在有关活跃用户的问题时该去哪里。
数据引用和描述
Metabase 提供了您可以在其中包含有助于说明特定项的文本的位置,无论该项是数据库、表、模型、问题、仪表板还是其他任何东西。您不需要描述一切,但您包含的描述越多,人们花在弄清楚“这是否是正确的数据?”上的时间就越少,他们的分析就越好。用数据记录异常特别重要(例如,表是否包含测试数据或员工账户或其他分析师应了解的异常)。
对于“官方”数据库、仪表板、模型和问题,您应要求所有者维护其文档。并且不要在标题上偷懒;您可以用几个额外的词做很多事情。将“客户订单”与以下内容进行比较:“官方:北美滚动 7 天平均每日订单”。
有关 Metabase 中参考工具的更多信息,请参阅使用 Metabase 的数据浏览器探索数据。
事件和时间线
事件 允许团队捕捉上下文,并在人们查看数据时提供这些上下文。因此,例如,您可以添加一个事件来标记销售、电子邮件营销或新版本的开始。这样,人们就可以看到这些事件对数据(如果有)有何影响。您还可以防止所有关于为什么 4 月份或任何其他月份的数字上升或下降的问题。
您可以按时间线组织这些事件,时间线与集合相关联,因此团队可以将事件分组到连贯的时间线中。不同的时间线可以分组影响您业务的不同集合的事件:月相、气象现象、占卜仪式等。
细分和度量
管理员可以定义官方过滤器(或过滤器集),称为细分,可以在 Metabase 的查询构建器中使用。例如,您可以通过细分正式定义“活跃用户”是什么。“活跃用户”将随后出现在 筛选侧边栏 中,因此任何人都可以通过活跃用户筛选他们的查询,以查看这些特定用户购买的产品类型、商品在购物车中停留的时间等。
同样,度量 编码计算。例如,管理员可以设置“平均订单总额”的官方度量,这样每个人都知道(并且可以使用)该度量的官方计算,该计算包括税费,但不包括应用的折扣。
细分和度量都有版本。有关更多信息,请参阅细分和度量。
SQL 片段
SQL 片段 是基于 GUI 的细分和度量的 SQL 对应物。您可以使用它们来捕获和复制小块 SQL 代码。这些片段可以捕获细分、度量、复杂的连接或其他任何可能在许多查询中重用的 SQL 代码。
细分、度量片段的想法是编码化定义,并使它们容易更改,因为随着时间的推移,您会细化定义。当您更新一个片段时,使用该片段的每个问题都将从一致的方式中受益于更新的定义。有关更多信息,请参阅SQL 片段:重用和共享 SQL 代码。
集合
集合组包括问题、模型、仪表板(以及其他集合)。此外,您可以将最重要的项目固定到集合的顶部,尤其是“我们的分析”根集合,以便固定仪表板显示在主页上。要了解更多信息,请查看使用集合权限。
官方集合
官方集合功能允许您指定特定的集合为重要集合。当管理员将集合标记为官方集合时,它会获得徽章,并在搜索结果中靠近顶部显示,使用户能够轻松找到它。
已验证项目
管理员可以验证问题和模型,以表示他们已查看并批准了它们。这些已验证项目在其名称旁边有一个勾选标记,因此用户可以轻松地识别出管理员认为可信赖的问题。
如果您想了解更多关于验证功能的信息,请查看我们关于建立信任的文章。
流程
了解工具的作用是战斗的一半;另一半是知道何时以及如何使用它们。
为每个部门创建集合
为每个部门创建一个集合,并仅允许一小群人编辑。该小组应整理该集合,并且仅固定已验证的问题、模型和仪表板,这些仪表板附有有用的描述,并积极维护。
SQL片段文件夹
SQL片段文件夹允许您按部门组织文件夹,为这些文件夹分配所有者,并利用文件夹权限。
采用命名约定
在您的仪表板、集合、模型和问题中设置标准命名约定,以便清楚地知道哪些项目是官方的。您如何定义该约定不太重要,重要的是要有一个约定。如有疑问:即使是“认证”或“官方”这样的简单前缀(例如,“官方:每1000用户打开的电子邮件”)也有助于人们筛选搜索结果并了解哪些项目已经过验证。
指定用于实验和工作进行中的集合
为人们存储工作进行中的项目(有时称为临时或游乐场集合)指定专门的地方。人们可以使用个人集合进行实验,但也很重要要有公共地方,人们可以在那里与他人共享他们的工作,以获取对他们的分析进展的反馈。
任何人都可以复制官方问题板和仪表盘,但你应该鼓励人们将这些项目保存到个人收藏夹中,或指定用于实验的收藏夹中。如果这些区域中的任何一个仪表盘开始流行,您可以将其移至相关的“官方”收藏夹。您可以为这些官方收藏夹设置权限,以便每个人都可以查看,但只有少数人可以编辑它们,确保该收藏夹中的所有内容都是正确且积极维护的。
制定存档项目的政策
对于这些短暂的项目,明确设定人们应该存档它们的时间,以免这些游乐场充满杂乱。如果您正在管理您部门的收藏夹,并且只固定经过审核的项目,杂乱的问题就会减少,但保持临时收藏夹相对较新将提高搜索结果。
而且,不必过于担心存档,因为您可以在任何时候恢复项目。
还有哪些方法可以驯服混乱?
如果您有任何要分享的技巧,或者对Metabase的更改或改进的想法,请在我们论坛上告诉我们。
下一节:多个环境
启动开发、预发布或测试环境的选择。