‧
8 分钟阅读
机构记忆

Sameer Al-Sakran
‧ 8 分钟阅读
分享本文
虽然有些夸张,但任何曾涉足分析领域的人都会遇到一个与上述故事非常相似的经历。虽然很少有人提及,但“机构记忆”,或者更常见地说“机构健忘症”,是规模化分析中最大的持续性问题之一。
什么是机构记忆?
机构记忆是一个公司对其事物的含义、它们如何变化以及谁改变了它们的集体知识。
机构记忆,或者更常见地说机构健忘症,是规模化分析中最大的持续性问题之一。
例如,“我们如何定义活跃用户?”、“我们是在合同签订当天、服务开始的第一天还是收到款项时确认收入?”
旁注:在下文中,我们将计算出的常见数字或数字集,如“活跃用户数”,称为“指标”。我们将事物常见子集的规范定义称为“细分”。
为什么它很重要?
它让每个人都保持一致。当不同的人比较按渠道划分的收入时,“收入”和“渠道”指代相同的事物很重要。这包括两种情况:一是两个团队对指标的含义略有不同;二是他们使用相同的基本报告,但改进或更改从未传递给仍使用旧定义的一组人。
更重要的是,如果收入有两个定义,那么其中一个通常是完全错误的。如果您使用了过时或不正确的定义,那么您从这些收入数字中得出的任何结论都可能是错误的。
当人们比较按渠道划分的收入时,“收入”和“渠道”指代相同的事物很重要。
它让不了解情况的用户能够轻松地调出常见数字并应用常见模式。大多数新手用户无法自行逆向工程“活跃用户”的定义。为了让他们能够提出自己的问题,这些概念是原子性的很重要。
它还能防止混乱。分析团队(或从事分析工作的人员)最大的时间浪费之一是重复检查数字、协调不匹配的数字以及调试“看起来不对劲”的报告。据经验,这至少占据了分析师相当一部分的时间,在大型组织中,这最终比实际创建仪表板或报告更耗时。
它还降低了组织的 巴士系数。通常,在一个组织中,只有一两个人知道某个数字是如何计算的,或者某个指标真正意味着什么,或者为了按时发布报告而从未重新审视过的那些糟糕透顶的细节。最好在他们决定提前退休并周游世界,没有网络连接之前,将这类信息记录下来。
它通常是如何维护的?
根据公司文化对文档的重视程度,通常有各种文档、电子邮件和内部 wiki 页面描述数据模型。尽管乏味、耗时、易出错,并且通常是那种让人在高度合规的企业环境中工作时感到心力交瘁的事情,但在一个足够小且行动足够慢的组织中,文档维护人员能够跟上步伐,偶尔也能以令人满意的速度进行维护。
分析团队最耗时的工作之一就是反复核对数字。
现在,这枚硬币的另一面是关于常见图表、报告和仪表盘含义的机构记忆。在这里,一切都处于绝望的混乱之中。即使在拥有近乎无限资源的极其复杂的组织中,也存在着大量由已离职人员编写的数据转换过程、几个月没有人更新但可能仍在使用或未使用的旧报告、仍被复制粘贴到新报告中的旧查询,以及来源或新鲜度不明的电子邮件电子表格。在这里,机构记忆是一个真实的存在:信息被锁在分析师和工程师的头脑中。
在这两种情况下,随着数据模型和所需分析结果的变化,保持这些信息的更新非常困难且成本高昂。此外,这些记录通常存储在与终端用户访问数据所使用的系统分离的系统中。这使得报告及其记录的含义更容易出现偏差。
如何改善机构记忆
改善您组织的机构记忆有两个方面。
首先是良好的旧式流程和纪律。确保您记录了指标的定义、它们旨在捕捉的内容、如何计算以及其历史变化。随着它们的变化,请预留时间更新任何中央文档。为常见的细分创建模板或代码片段(如果使用支持它们的工具,则额外加分)。通常,一些关键指标很难从可用数据中测量或计算。在这种情况下,会使用代理,即行为类似于底层指标的数字。不用说,您绝对应该记录重要 KPI 的代理如何计算及其局限性。
对于我们大多数人来说,纪律和时间都非常有限。专注于重要的查询和报告。为它们分配所有者,并确保可以轻松查找到任何给定常见细分或指标定义的负责人。抵制记录所有内容的诱惑。创建常见报告的优先列表,并专注于覆盖前 20%。请记住,在这些情况下,主要成本在于随着时间的推移保持文档的最新状态,而不是第一次编写它们。
机构记忆是真实存在的:信息被锁在分析师和工程师的头脑中。
第二个主要方面是工具。有些数据基础设施比其他更脆弱。为相同的指标使用大量不同的系统会导致混淆和维护负担。在可能的情况下,最好拥有一套通用的工具和常见报告的存储库。标准化一个中央位置,人们可以在其中查找有关数据模型的信息,并尽可能将其作为人们查找信息的首选。花时间编辑和完善这些信息集合,因为这将在以后节省时间和减少挫败感。
如何使用 Metabase 让生活更轻松
Metabase 从早期开始的主要设计目标之一就是帮助非技术用户使用他们公司的数据库。众所周知,SQL 很难学习,而且典型的 BI 程序界面也很混乱。然而,很多困难在于大多数非分析师不了解数据模型的工作原理,或者如何提出有意义的问题。
尽管 Metabase 的设计目标是在 5 分钟内提供简单的分析,但 Metabase 的大部分功能只有在最初的新鲜感过后才能显现出来。一旦您的组织开始从集中式仪表板、通过脉冲(Pulses)的定期报告和共享报告中看到价值,就该策划您的数据模型,让您公司的其他人员能够提出自己的问题。
大部分困难在于大多数非分析师不了解数据模型是如何工作的。
在解决机构记忆问题时,我们致力于确保组织的机构记忆存在于分析消费的地方。如果某件事每天都摆在您面前,您就更有可能保持其更新。我们还专注于提供一些简单的工具,而不是试图涵盖所有情况。我们希望仅仅通过保持描述的更新就能解决足够多的问题,从而激发用户对更多功能的兴趣。我们使其易于从机构记忆转向实际数据或报告本身,从而使其成为一个培训资源。
在 Metabase 中捕捉机构记忆
- 对可能引起混淆的字段,请大量使用描述。
- 在表上使用描述来解释字段应如何使用,以及与它们相关的常见陷阱。
- 将有趣的实体的常见定义封装为细分
- 对于常用图表显示的关键绩效指标(KPI)或其他有趣的指标,请将其保存为指标。
- 在用户入职时务必告知他们应使用哪些指标和细分,并保持这些信息的最新!如果人们知道某个细分或指标是规范定义,他们就会使用它。一旦它开始出现偏差,他们就会回到制造混乱的老路。
如果您还没有使用 Metabase,不妨一试。