2016 年 3 月 14 日,发布于 分析 & BI

8 分钟阅读

机构记忆

Sameer Al-Sakran Portrait
Sameer Al-Sakran
‧ 2016 年 3 月 14 日,发布于 分析 & BI

‧ 8 分钟阅读

分享这篇文章

Australia.

虽然有点夸张,但任何参与过分析工作的人都会有一些与上述故事非常相似的经历。虽然很少有人谈论它,但机构记忆,或者更常见的机构阿尔茨海默症,是规模化分析中最大的持续性问题之一。

什么是机构记忆?

机构记忆是一家公司对事物含义、事物如何变化以及谁改变事物的集体知识。

机构记忆,或者更常见的机构阿尔茨海默症,是规模化分析中最大的持续性问题之一

例如,“我们如何定义活跃用户?”、“我们是在合同签署之日、服务开始之日还是在支票兑现时确认收入?”。

旁注:在下文中,我们将把计算出的常用数字或数字集(例如“活跃用户数”)称为“指标”。我们将把事物常见子集的规范定义称为“细分”。

为什么它很重要?

它使每个人都保持在同一页面上。当不同的人比较按渠道划分的收入时,“收入”和“渠道”指代同一事物非常重要。这包括两种情况:两组人为指标提出了略有不同的含义,以及他们使用了相同的基本报告,但改进或更改从未传达给仍在使用旧定义的组。

更重要的是,如果有两种收入定义,那么通常其中一种是完全错误的。如果您使用的是过时或不正确的定义,那么您可能从这些收入数字中得出的任何结论都可能是错误的。

当人们比较按渠道划分的收入时,“收入”和“渠道”指代同一事物非常重要

它可以让不了解情况的用户轻松调出常用数字并应用常用模式。大多数新手用户都无法自行逆向工程“活跃用户”的定义。为了让他们能够提出自己的问题,这些概念必须是原子性的。

它还可以防止混乱。分析小组(或从事分析工作的人员)最耗时的任务之一是仔细检查数字、协调不匹配的数字以及调试“看起来不对劲”的报告。有传闻称,这至少占用了分析师相当一部分时间,而在大型组织中,最终比实际创建仪表盘或报告更耗时。

它还可以减少组织的 巴士系数。通常,组织中只有一两个人知道特定数字是如何计算的,或者给定指标的真正含义,或者为了按时完成报告而采取的可怕的临时措施,但从未重新审视过。最好在他们决定提前退休并环游世界且没有互联网连接之前捕获此类信息。

通常如何维护它?

根据公司文化对文档的重视程度,通常会有各种文档、电子邮件和内部 wiki 页面描述数据模型。虽然乏味、耗时、容易出错,并且通常是那种使在高合规性企业环境中工作令人沮丧的事情,但在足够小的组织中,偶尔可以以令人满意的速度维护它,以便文档记录员能够跟上进度。

分析小组最耗时的任务之一是仔细检查数字

现在,硬币的另一面是关于常用图表、报告和仪表盘含义的机构记忆。在这里,一切都陷入了绝望的混乱。即使在资源近乎无限的极其成熟的组织中,也有大量由已离职人员编写的数据转换流程、几个月无人更新的旧报告(可能仍然有人使用),旧查询仍然被复制粘贴到新报告中,以及来源或新鲜度不明的电子邮件发送的电子表格。在这里,机构记忆是一个字面意义上的东西:信息被锁定在分析师和工程师的头脑中。

在任何一种情况下,随着数据模型和所需的分析结果发生变化,保持这些记录的更新都非常困难且成本高昂。此外,这些记录通常与最终用户访问数据所使用的系统位于不同的系统中。这使得报告及其记录的含义更有可能背道而驰。

如何改进机构记忆

改进组织机构记忆有两个方面。

首先是良好的旧式流程和纪律。确保记录指标的定义、它们的捕获目的、计算方式以及它们的历史变化。当它们发生变化时,安排时间更新任何中心文档。为常用细分创建模板或代码片段(使用支持它们的工具可获得额外积分)。通常,某些关键指标很难从可用数据中衡量或计算出来。在这种情况下,使用代理或行为类似于基础指标的数字。不用说,您绝对应该记录重要 KPI 的代理是如何计算的及其局限性。

对于我们大多数人来说,纪律和时间非常有限。专注于主力查询和报告。为它们分配所有者,并确保可以轻松查找拥有任何给定常见细分或指标定义的人员。抵制尝试记录一切的诱惑。创建常用报告的优先级列表,并专注于覆盖前 20%。请记住,在这些情况下,主要成本在于随着时间的推移保持文档更新,而不是第一次编写文档。

机构记忆是一个字面意义上的东西:信息被锁定在分析师和工程师的头脑中

第二个主要方面是工具。一些数据基础设施比其他基础设施更脆弱。对同一指标使用许多不同的系统会导致混乱和维护负担。在可能的情况下,最好拥有一套通用工具和一个常用报告存储库。标准化一个中心位置,人们可以在其中查找有关该数据模型的信息,并在尽可能大的程度上使其成为人们首先查找的位置。花时间编辑和改进此信息集合,因为它将在以后节省时间和挫败感。

如何使用 Metabase 让生活更轻松

Metabase 自早期以来的主要设计目标之一是帮助非技术用户使用其公司数据库。人们普遍认为 SQL 可能难以学习,并且典型的 BI 程序具有令人困惑的界面。然而,大部分困难在于大多数非分析师不了解数据模型的工作方式,或者如何实际提出明智的问题。

虽然 Metabase 的设计目标是在 5 分钟内提供简单的分析,但 Metabase 的大部分功能只有在最初的蜜月期结束后才会显现出来。一旦您的组织开始看到拥有仪表盘中心位置、通过 Pulses 定期报告和共享报告的价值,就应该开始管理您的数据模型,以允许公司的其他人员提出自己的问题。

大部分困难在于大多数非分析师不了解数据模型的工作方式

在解决机构记忆问题时,我们专注于确保组织的机构记忆存在于分析消耗的地方。如果每天都看到某些东西,您就更有可能保持其更新。我们还专注于提供一些简单的工具,而不是试图涵盖所有情况。我们希望保持描述更新的简单行为能够解决足够多的问题,以激发用户对更多问题的兴趣。我们使从机构记忆到实际数据或报告本身的移动变得容易,以便它可以作为培训资源。

在 Metabase 中捕获机构记忆

  • 在可能令人困惑的字段上自由使用描述。
  • 在表上使用描述来描述字段应如何使用,以及与之相关的常见陷阱。
  • 将有趣实体的常用定义封装为 细分
  • 为了重用常用图表的 KPI 或其他有趣的指标,请将它们保存为指标
  • 确保让人们知道在您让他们入职时应该使用哪些指标和细分,并保持这些更新!如果人们知道细分或指标是规范定义,他们就会使用它。一旦开始松懈,他们就会回到制造混乱的方式。

如果您尚未使用 Metabase,请试用一下

您可能也喜欢

所有文章
地图数据可视化:最佳实践图像 2024 年 12 月 19 日,发布于 分析 & BI

地图数据可视化:最佳实践

了解如何创建具有影响力的地图数据可视化,其中包含有关使用图钉地图、网格地图和区域地图来突出显示模式并制定数据驱动型决策的技巧。

Alex Yarosh Portrait
Alex Yarosh

6 分钟阅读

如何可视化时间序列数据:最佳实践 图像 2024 年 11 月 20 日 发布于 分析 & BI

如何可视化时间序列数据:最佳实践

了解关于时间序列数据以及如何将其可视化。包含最佳实践和方便的速查表。

Alex Yarosh Portrait
Alex Yarosh

3 分钟阅读

所有文章
Close Form Button

订阅我们的新闻通讯

随时掌握 Metabase 的更新和新闻。绝无垃圾邮件。