‧
阅读时间:8分钟
机构记忆
Sameer Al-Sakran
‧ 阅读时间:8分钟
分享这篇文章
虽然有些夸张,但任何参与过任何形式的分析的人都会有一些与上面故事非常相似的故事。虽然很少有人谈论它,但机构记忆,或更常见的机构阿尔茨海默病,是规模分析中最大的持续问题之一。
什么是机构记忆?
机构记忆是一家公司对事物含义、如何变化以及谁改变了它们的集体知识。
机构记忆,或更常见的机构阿尔茨海默病,是规模分析中最大的持续问题之一
例如,“我们如何定义活跃用户?”,“我们在合同签订日、提供服务第一天还是支票到账时认可收入?”
旁白:在下文中,我们将计算的常见数字或数字集(如“活跃用户数量”)称为“指标”。我们将对事物的常见子集的规范定义称为“细分”。
为什么这很重要?
它使每个人都保持一致。当不同的人按渠道比较收入时,重要的是“收入”和“渠道”指的是同一件事。这包括两组对指标有稍微不同含义的情况,以及他们使用了相同的基线报告,但改进或更改从未传递给仍然使用旧定义的组。
更重要的是,如果有两种收入定义,那么其中一种通常就是完全错误的。如果你使用的是过时或不正确的定义,那么从这些收入数字中得出的任何结论都可能是不准确的。
当人们通过渠道比较收入时,重要的是“收入”和“渠道”指的是同一件事。
这使那些不理解正在发生什么的人能够轻松地调取常用数字并应用常见模式。大多数新手用户无法自行逆向工程“活跃用户”的定义。为了让他们能够提出自己的问题,这些概念必须是原子化的。
这也防止了混乱。数据分析组(或进行数据分析工作的人)最大的时间浪费之一就是核实数字、调和不相符的数字以及调试“看起来不正常”的报告。据估计,这至少占分析师时间的相当一部分,在大型组织中,这最终成为比创建仪表板或报告更大的时间浪费。
它还减少了组织的总人数。通常,一个组织中只有一两个人知道如何计算某个特定数字或者给定指标真正意味着什么,或者那些从未再次回顾的糟糕角落。更好的做法是在他们决定提前退休并乘船环游世界(没有互联网连接)之前,捕捉到这类信息。
通常是如何维护的呢?
根据公司文化文档的多少,通常有多种文档、电子邮件和内部维基页面描述数据模型。虽然这很繁琐、耗时、易出错,而且在高度合规的商务环境中,这通常是一种让人感到精神崩溃的工作,但在足够小的组织里,如果组织移动速度足够慢,那么文档编写者有时也能跟上这个节奏。
数据分析组最大的时间浪费之一就是核实数字。
现在,硬币的另一面是关于常见图表、报告和仪表板的机构记忆。在这里,一切都是混乱无序的。即使在极其复杂的组织里,资源几乎无限,也存在着大量的数据转换过程,这些过程是由公司不再存在的人编写的,几个月没有人更新的旧报告,这些报告可能仍然被某人使用,或者没有被使用,旧的查询仍然被复制粘贴到新的报告中,以及来自不明来源或新鲜度的电子邮件电子表格。在这里,机构记忆是字面上的东西:信息被锁在分析师和工程师的头脑中。
在两种情况下,随着数据模型和所需的分析结果发生变化,保持这些信息的更新都是非常困难和昂贵的。此外,这些记录通常生活在与终端用户访问数据使用的系统不同的系统中。这使得报告及其文档意义分道扬镳的可能性更大。
如何提高机构记忆?
提高组织机构记忆有两个方面。
首先,是老式的流程和纪律。确保你记录了指标的定义、它们想要捕获的内容、它们的计算方法以及它们的历史变化。随着它们的变化,为更新任何中央文档安排时间。创建模板或代码片段以供常用段使用(使用支持这些工具会加分)。通常,一些关键指标很难从现有数据中测量或计算。在这种情况下,使用代理,或者与底层指标表现相似的数字。不用说,你应该明确记录重要KPI的代理计算方法及其局限性。
对我们大多数人来说,时间和精力都十分有限。因此,应该专注于核心查询和报告。为它们指定负责人,并确保可以轻松找到任何给定通用段或指标的定义所有者。抵制尝试记录所有内容的诱惑。创建一个常见报告的优先级列表,并专注于涵盖前20%。记住,在这些情况下,主要成本在于随着时间的推移保持文档更新,而不是第一次编写它们。
机构记忆是一种字面意义上的东西:信息被锁定在分析师和工程师的头脑中。
第二个主要战场在于工具。某些数据基础设施比其他更脆弱。对于同一指标使用大量不同的系统会导致混乱和维护负担。在可能的情况下,最好有一个共同的工具集和常见报告的仓库。在人们可以查找有关该数据模型信息的中央位置进行标准化,并在尽可能的程度上将其作为人们首先查找的地方。花时间编辑和改进这一信息集合,这将在以后节省时间和挫折。
如何使用Metabase让生活更轻松
自从Metabase早期开始,其主要设计目标之一就是帮助非技术用户利用公司的数据库。人们普遍认为,SQL学习起来可能很困难,典型的BI程序界面也可能令人困惑。然而,大部分困难在于,大多数非分析师不了解数据模型是如何工作的,或者如何提出合理的问题。
虽然Metabase的设计目标是5分钟内提供简单的分析,但Metabase的大部分功能只有在最初的蜜月期结束后才会显现。一旦您的组织开始从拥有中央仪表板、通过Pulses的定期报告和共享报告中获得价值,就是时候对数据模型进行整理,以便其他公司人员可以提出他们自己的问题。
大部分困难在于,大多数非分析师不了解数据模型是如何工作的。
在解决机构记忆问题时,我们专注于确保机构的记忆存在于分析被消费的地方。如果某事每天都在你眼前,你更有可能保持其更新。我们还专注于提供一些简单的工具,而不是试图涵盖每一个案例。我们希望简单地保持描述的更新,足以解决足够的问题,以刺激用户的兴趣。我们使从机构记忆到实际数据或报告本身变得容易,从而使其成为培训资源。
在Metabase中捕捉机构记忆
- 在可能令人困惑的字段上自由地使用描述。
- 在表上使用描述来描述字段的用法,以及与之相关的一些常见陷阱。
- 将有趣实体的常见定义封装为段。
- 为了使通常绘制的KPI或其他有趣的指标可重用,请将其保存为指标。
- 在入职时确保人们知道应该使用哪些指标和段,并保持这些更新!如果人们知道一个段或指标是标准定义,他们会使用它。一旦它开始下滑,他们就会回到制造混乱的老路上。
如果您还没有使用Metabase,试试它。