保持分析井井有条
随着用户、问题和仪表板数量的不可避免地增加,如何保持您的分析井井有条。
如果您想保持竞争力,就需要让组织中的人员访问他们所需的数据,以便做出更好的决策。然而,数据民主化的代价是不可避免的分析洪流——这可能使您难以判断哪些分析值得信赖。
重要的是要明白,这个问题没有一劳永逸的解决方案。分析熵永远存在,但只要有适当的工具和流程,您就能控制住不可避免的混乱。
分析民主化带来的问题
这些问题的核心在于定义:我们究竟如何定义诸如收入、生命周期价值、流失率等业务逻辑?“定义”在这里泛指对您的组织重要的任何可量化概念。不仅仅是 X 是什么,而是我们如何 计算 X?这些是您衡量组织的指标,您定义得越具体(和一致),效果就越好。
以下是一些我们需要提防的定义问题
人们在哪里可以找到具体的定义?
一旦您开始从不同角度切分数据以审视您的组织,定义就会大量涌现:收入、流失率、预期生命周期价值等等。如果我们想了解客户流失的原因,我们应该参考哪些定义?我们需要定义哪些新定义?(字面上)我在 Metabase 中哪里可以找到这些官方定义?
相互冲突的定义
冲突的意思是:我们甚至在讨论同一件事吗?以收入为例。对销售团队来说,收入可能意味着预订量,但会计人员指的是已确认的应计收入,而营销团队则在谈论终身收入。
重新定义,或者哪个是规范定义?
如果我们发现同一个概念有多个定义怎么办?我们如何判断哪个值得信任?它们都偏离了目标吗?即使多个团队同意我们应该跟踪周环比预订量,这些预订量的统计方式也可能因查询而异:一个查询可能是准确的,另一个查询可能是不准确且未经审查的,由一位不知道官方预订量计算查询已存在的分析师创建;或者忘记省略测试数据,或者未能考虑折扣,或者只是简单地创建了一个新查询以不同的方式切分预订量。
不断变化的定义
随着某些收入来源的终止和其他来源的增加,月收入的计算可能会发生变化。如果不同部门在多个问题、模型和仪表板中使用相同的定义,我们应该如何管理定义的更改?
驯服混乱的策略
明确问题后,我们来谈谈如何缓解它们。我们将把讨论分为两类:Metabase 提供的功能,以及我们建议您采用的组织流程。
功能
以下是 Metabase 附带的一些工具,它们将帮助您保持井井有条。您可能已经了解问题、仪表板和集合,但在此处列出它们是为了全面了解工具包。
模型
模型允许您将那些常用概念编码为新问题的起点,以便轻松反复引用。通过查询构建器构建的问题和SQL 问题都可以转换为模型,它们将在搜索结果中显示得更靠前,以鼓励在组织内使用。您还可以自定义模型元数据,允许您指定列类型,以便即使在 SQL 问题上也可以下钻。
例如,您可以编写一个问题,汇集并计算“活跃用户”的信息(无论您如何定义一个人为“活跃”),然后将该问题转换为模型,以便人们在对活跃用户有疑问时知道去哪里查找。
数据参考和描述
Metabase 提供了用于包含有用文本的地方,这些文本可以情境化特定项,无论该项是数据库、表、模型、问题、仪表板,还是其他任何内容。您不必描述所有内容,但您包含的描述越多,人们花在“这是正确的数据吗?”上的时间就越少,他们的分析也会越好。记录数据异常尤其重要(例如,表是否包含测试数据或员工账户,或其他分析师应注意的异常情况)。
对于“官方”数据库、仪表板、模型和问题,您应该要求所有者维护其文档。不要在标题上偷懒;多几个字可以做很多事。比较一下“客户订单”和这样的标题:“官方:北美地区7天滚动平均每日订单”。
有关 Metabase 中参考工具的更多信息,请查看使用 Metabase 的数据浏览器探索数据。
事件和时间线
事件允许团队捕获上下文,并在人们查看数据时提供该上下文。例如,您可以添加一个事件来标记销售开始、电子邮件营销活动或新版本发布。这样,人们就可以看到这些事件对数据产生的影响(如果有的话)。您还可以避免所有关于为什么数字在四月份或任何时候上涨或下降的问题。
您可以将这些事件组织成时间线,并将其与集合关联,这样团队就可以将事件分组到一致的时间线中。不同的时间线可以分组不同的影响您业务的事件集:月相周期、气象现象、神秘仪式等等。
分段和指标
管理员可以定义称为分段的官方筛选器(或筛选器集),这些筛选器可在 Metabase 的查询构建器中使用。例如,您可以通过分段正式定义“活跃用户”是什么。“活跃用户”随后将显示在筛选器侧边栏中,因此任何人都可以通过活跃用户筛选其查询,以查看这些特定用户购买了哪些产品、商品在其购物车中停留多长时间等等。
同样,指标编码了计算。例如,管理员可以为“平均订单总额”设置一个官方指标,以便每个人都知道(并可以使用)该指标的官方计算方法,其中包含税费但省略了应用的折扣。
分段和指标都支持版本控制。要了解更多信息,请查看分段和指标。
代码片段
代码片段是基于 GUI 的分段和指标的 SQL 对应物。您可以使用它们来捕获和复制小段 SQL 代码。这些代码片段可以捕获分段、指标、复杂的连接,或任何您可能希望在多个查询中重用的 SQL 片段。
分段、指标和代码片段的理念是将定义编码化,并使其随着时间的推移易于更改。当您更新一个代码片段时,每个使用该代码片段的问题都将以一致的方式受益于更新后的定义。要了解更多信息,请查看代码片段:重用和共享 SQL 代码。
集合
集合将问题、模型和仪表板(以及其他集合)分组。此外,您可以将最重要的项目固定到集合的顶部,特别是根集合“我们的分析”,以便这些固定的仪表板显示在主页上。要了解更多信息,请查看使用集合权限。
官方集合
官方集合仅适用于 专业版 (Pro) 和 企业版 (Enterprise) 计划(包括自托管和 Metabase 云版)。
该官方集合功能允许您将特定集合指定为重要。当管理员将一个集合标记为官方时,它会获得一个徽章并显示在搜索结果的顶部附近,方便用户查找。
已验证的项目
已验证的项目仅适用于 专业版 (Pro) 和 企业版 (Enterprise) 计划(包括自托管和 Metabase 云版)。
管理员可以验证问题和模型,以表明他们已对其进行查看和批准。这些已验证的项目在其名称旁边会有一个复选标记,因此用户可以轻松识别其管理员认为可信赖的问题。
如果您想了解更多关于验证功能的信息,请查看我们关于建立信任的帖子。
流程
了解工具的功能只是成功的一半;另一半是知道何时以及如何使用它们。
为每个部门创建集合
为每个部门创建一个集合,并仅允许一小部分人编辑。该小组应负责管理该集合,只固定他们已审查、附有有用描述并积极维护的问题、模型和仪表板。
代码片段文件夹
代码片段文件夹仅适用于 专业版 (Pro) 和 企业版 (Enterprise) 计划(包括自托管和 Metabase 云版)。
代码片段文件夹允许您按部门组织文件夹,为这些文件夹分配所有者,并利用文件夹权限。
采用命名约定
在您的仪表板、集合、模型和问题中设置一个标准命名约定,以便明确哪些项目是官方的。您如何定义该约定不如拥有一个约定本身重要。如有疑问:即使是“认证”或“官方”之类的简单前缀(例如,“官方:每 1000 用户的电子邮件打开量”)也可以帮助人们筛选搜索结果并知道哪些项目已通过审查。
指定用于实验和进行中的工作的集合
创建指定位置,供人们存储正在进行的工作(有时称为草稿或游乐场集合)。人们可以也应该使用个人集合进行实验,但拥有公共场所也很重要,人们可以在这些地方与他人分享他们的工作,以获得对其正在进行的分析的反馈。
任何人都可以复制官方问题和仪表板,但您应该鼓励人们将这些项目保存到他们的个人集合中,或保存到指定用于实验的集合中。如果这些区域中的某个仪表板取得成功,您可以将其重新定位到相关的“官方”集合。您可以设置权限,以便所有人都可以查看这些官方集合,但只有少数人可以编辑它们——从而确保该集合中的所有内容都是正确且积极维护的。
制定何时归档项目的政策
对于这些临时性项目,请明确何时应该归档它们,以免这些“游乐场”堆满杂乱无章的内容。如果您正在管理部门的集合,并且只固定经过审查的项目,那么杂乱就会减少,但保持草稿集合相对新鲜将改善搜索结果。
而且不必担心归档,因为您可以随时恢复项目。
驯服混乱的其他想法?
如果您有任何要分享的技巧,或者对 Metabase 的更改或改进有任何想法,请在我们的论坛上告诉我们。
下一步:多环境
启动开发、阶段或测试环境的选项。