‧
8分钟阅读
组织记忆

Sameer Al-Sakran
‧ 8分钟阅读
分享此文章
虽然有些夸张,但任何涉足分析领域的人都会有一个与上述故事非常相似的经历。尽管很少有人提及,但机构记忆(或更常见的机构阿尔茨海默症)是大规模分析中最大的持续性问题之一。
什么是机构记忆?
机构记忆是一个公司对其所涉及事物的含义、变化方式以及改变者所拥有的集体知识。
机构记忆,或更常见的机构阿尔茨海默症,是大规模分析中最大的持续性问题之一
例如,“我们如何定义活跃用户?”、“我们是在合同签署日、首次提供服务日还是在支票兑现时确认收入?”。
旁注:在下文中,我们将把通常计算出的数字或数字集(例如“活跃用户数量”)称为“度量”。我们将把事物常见子集的规范定义称为“细分”。
为什么它很重要?
它能让每个人保持一致。当不同的人通过渠道比较收入时,确保“收入”和“渠道”指的是同一件事至关重要。这包括两个群体对度量指标产生略微不同含义的情况,以及他们使用相同的基本报告,但改进或变更从未传达给仍在使用旧定义的一方的情况。
更重要的是,如果收入有两个定义,那么其中一个通常是完全错误的。如果您使用了过时或不正确的定义,那么您从这些收入数据中得出的任何结论都可能不准确。
当人们通过渠道比较收入时,确保“收入”和“渠道”指的是同一件事至关重要
它使用户,即使不完全理解正在发生的事情,也能轻松获取常用数据并应用通用模式。大多数新手用户无法自行逆向推导出“活跃用户”的定义。为了让他们能够提出自己的问题,这些概念是原子性的非常重要。
它还能防止混乱。对于分析团队(或从事分析工作的人员)来说,最大的时间浪费之一是反复核对数字、调和不匹配的数字,以及调试“看起来不对劲”的报告。根据经验,这至少占据了分析师相当一部分的时间,在更大的组织中,它最终会比实际创建仪表板或报告更耗费时间。
它还降低了一个组织的巴士系数。通常,一个组织中只有一两个人知道某个特定数字是如何计算的,或某个给定指标的真正含义,或者那些为及时出报告而从未被重新审视的糟糕细节。最好在他们决定提前退休并扬帆远航、断开互联网连接之前,将这些信息记录下来。
通常如何维护?
根据公司文化的文档密集程度,通常会有各种文档、电子邮件和内部维基页面来描述数据模型。尽管这既繁琐、耗时、容易出错,而且通常会让在高度合规的企业环境中工作感到心力交瘁,但在规模足够小、发展速度足够慢,使得文档编写者能够跟上的组织中,偶尔也能以令人满意的速度进行维护。
分析团队最大的时间浪费之一是反复核对数字
另一方面,关于常用图表、报告和仪表板含义的机构记忆,则是一片混乱。即使在拥有近乎无限资源的极其复杂的组织中,也存在着大量由已离职人员编写的数据转换过程、几个月无人更新且可能不再使用的旧报告、仍被复制粘贴到新报告中的旧查询,以及来源不明或时效性存疑的电子邮件电子表格。在这种情况下,机构记忆是一种字面意义上的东西:信息被锁在分析师和工程师的头脑中。
无论哪种情况,随着数据模型和所需分析结果的变化,保持这些记录的最新状态都非常困难且成本高昂。此外,这些记录通常存储在与终端用户访问数据所使用的系统分离的系统中。这使得报告及其文档记录的含义更容易出现偏差。
如何改善机构记忆
改善组织机构记忆有两个方面。
首先是传统的良好流程和纪律。确保您记录度量的定义、它们旨在捕捉的内容、如何计算以及其历史变化。当它们发生变化时,留出时间更新任何核心文档。为常见细分创建模板或代码片段(如果使用支持它们的工具,可获得额外加分)。通常,一些关键度量很难从现有数据中衡量或计算。在这种情况下,会使用代理(即行为与基础度量相似的数字)。毋庸置疑,您绝对应该记录重要KPI代理的计算方式及其局限性。
对我们大多数人来说,时间和精力都非常有限。请专注于那些常用且关键的查询和报告。为它们指定负责人,并确保能够轻松查找到负责任何给定常见细分或度量定义的人员。抵制记录一切的诱惑。创建一个常用报告的优先列表,并集中精力覆盖前20%。请记住,在这种情况下,主要成本在于随着时间的推移保持文档的最新状态,而不是首次编写它们。
机构记忆是一种字面意义上的东西:信息被锁在分析师和工程师的头脑中
第二个主要方面是工具。有些数据基础设施比其他更脆弱。为相同的度量使用大量不同的系统会导致混乱和维护负担。在可能的情况下,最好拥有一套通用工具和常用报告的存储库。标准化一个中心位置,人们可以在那里查找有关数据模型的信息,并尽可能使其成为人们首先查找的地方。花时间编辑和完善这些信息,因为这将节省未来的时间和减少挫败感。
如何使用Metabase让生活更轻松
Metabase自早期以来的一项主要设计目标就是帮助非技术用户利用其公司的数据库。普遍认为SQL学习起来可能很困难,而且典型的BI程序界面令人困惑。然而,大部分困难在于,大多数非分析师不理解数据模型如何工作,或者如何实际提出合理的问题。
Metabase旨在5分钟内提供简单的分析,但其大部分功能只有在初期磨合期结束后才能完全发挥。一旦您的组织开始从仪表板的集中位置、通过Pulses实现的定期报告以及共享报告中看到价值,就该整理您的数据模型,以便公司的其他人员能够提出自己的问题了。
大部分困难在于,大多数非分析师不理解数据模型如何工作
在解决机构记忆问题时,我们专注于确保组织的机构记忆存在于分析被消费的地方。如果某样东西每天都在您眼前,您就更有可能保持其最新状态。我们还专注于提供一些简单的工具,而不是试图涵盖所有情况。我们希望仅仅保持描述最新就能解决足够多的问题,从而激发用户对更多功能的需求。我们让从机构记忆到实际数据或报告本身的转换变得容易,使其成为一个培训资源。
在Metabase中捕捉机构记忆
- 对可能令人困惑的字段,请随意添加描述。
- 在表中添加描述,说明字段应如何使用,以及与之相关的常见陷阱。
- 将有趣实体的常见定义封装为细分
- 对于常用图表中的KPI或需要复用的其他有趣度量,将其保存为度量。
- 在引导新用户时,务必让他们知道应该使用哪些度量和细分,并保持这些信息的最新状态!如果人们知道某个细分或度量是规范定义,他们就会使用它。一旦信息开始过时,他们就会回到制造混乱的老路。
如果您还未使用Metabase,不妨一试。