Chevron Left

查看所有社区故事

数据目录的努力:原因和方法

2024 年 11 月 17 日

作者

Juan Sebastián Suarez Valencia

Meisterlabs

photo of Juan Sebastián Suarez Valencia

Juan Sebastian 是 MeisterLabs 的数据工程师,该公司为全球数百万客户和数十亿事件的现代团队创建协作工具。您可以通过 领英 联系他。

为什么数据文档比想象中更难

当我加入 MeisterLabs 担任数据工程师时,有一件事立刻变得清晰:我们的数据无处不在,而且很难跟踪什么是什么。

从数百个表格到未文档化的指标,上手速度很慢。而且我不是一个人——每个新的分析师或工程师都面临同样的挑战。

因此,我们开始着手为整个分析团队的数据文档建立一个更好的系统。

什么是数据文档(以及为什么分析团队需要它)

将数据文档视为公司数据的操作手册。它不仅仅是列出表格或字段,而是关于

  • 解释数据集是什么以及它为什么存在
  • 跟踪表格之间的关系
  • 定义谁拥有什么
  • 保持术语和指标的一致性

如果没有文档,即使是简单的问题也会导致摩擦。我们是查看新注册用户还是总用户?这个“收入”是净收入还是毛收入?哪个版本才是真相?

an image showing how Data Catalog structure usually looks like: directories with description

等待时间越长,难度越大

数据文档的痛苦不会立竿见影。但随着公司的发展以及分析堆栈变得越来越复杂,不进行文档的成本会迅速增加

  • 重复的仪表板
  • 相互冲突的 KPI
  • 队友离职时丢失的上下文
  • 每位新分析师的入职速度变慢

这就像去健身房:你知道它对你有好处,但好处并不总是立竿见影的。而且你拖延的时间越长,开始就越困难。

数据文档对分析团队的好处

一旦我们致力于更彻底地记录数据,我们开始在日常工作流程中看到回报

🔍 更快的入职 新员工无需四处打听就能找到正确的数据——他们可以自己查找。

📘 共享定义 当每个人都使用相同的术语(如“活跃用户”或“月收入”)时,您的仪表板会讲述一个一致的故事。

🔄 清晰的数据血缘 通过映射数据从源到仪表板的移动方式,更容易调试错误和发现冗余工作。

✅ 所有权和治理 您可以为数据集或仪表板分配所有者,使团队的职责更清晰。

🧠 透明度和信任 完善的数据文档建立信任——特别是对于依赖您的图表做出决策的非技术利益相关者。

我们如何处理数据文档(而不会让它成为第二份工作)

我们没有试图包罗万象。相反,我们从小处着手

  • 首先记录高影响力数据集(例如,用于定期报告或公司范围仪表板的数据集)
  • 使用与我们的工作流程集成的工具,而不是需要不断切换上下文的工具
  • 将文档链接到人们工作的地方——例如直接在 Metabase 或 Notion 中添加定义

最终,我们将其正式化为一个轻量级数据目录。但关键是将文档视为一种习惯,而不是一个项目。

选择用于记录分析堆栈的工具

市面上有许多工具——无论您是想要一个完整的数据目录,还是只是想提高内部清晰度。以下是我们考虑的一些因素

  • 互操作性:它能否从 Metabase 或我们已使用的其他工具中提取使用情况统计信息?
  • 易用性:人们真的会使用它吗?
  • 版本控制或更改跟踪:最好有,尤其是在数据集不断发展时
  • 成本和设置:我们根据团队带宽探索了开源与托管选项

专业提示:不要低估查看哪些查询或仪表板依赖于数据集的帮助。这种可见性让文档变得值得。

阅读更多关于如何在 Metabase 中组织分析的信息。

作者

Juan Sebastián Suarez Valencia

Meisterlabs

photo of Juan Sebastián Suarez Valencia

Juan Sebastian 是 MeisterLabs 的数据工程师,该公司为全球数百万客户和数十亿事件的现代团队创建协作工具。您可以通过 领英 联系他。

您可能也喜欢

撰写社区故事的技巧

Metabot

Metabase

为什么你应该投资数据目录

Ali Baghshomali

Mentat Analytics

何时应该投资客户数据平台 (CDP) 工具?

Ali Baghshomali

Mentat Analytics

您可能也喜欢

撰写社区故事的技巧

Metabot

Metabase

为什么你应该投资数据目录

Ali Baghshomali

Mentat Analytics

何时应该投资客户数据平台 (CDP) 工具?

Ali Baghshomali

Mentat Analytics

© . This site is unofficial and not affiliated with Metabase, Inc.