‧
8 分钟阅读
万圣节特辑:初创公司的数据恐怖故事
Metabase 团队
‧ 8 分钟阅读

分享这篇文章
2022 年 10 月 20 日,我们与 Eesel 联合创始人 Amogh Sarda 和 Mentat Analytics 的数据专家 Ali Baghshomali 坐在一起,讨论了初创公司中一些可怕的数据故事,以及如何避免这些故事。我们讨论了可能发生在年轻公司身上的真实故事,解释了这些故事背后的动机和潜在后果。
以下是对话的简短摘录以及完整录音。
与会者
- Amogh Sarda,Eesel 的联合创始人,Eesel 是一款将您的所有工作文档直接带到新标签页的工具。他常驻澳大利亚,此前曾担任 Atlassian 和 Intercom 的产品经理。他喜欢即兴喜剧,并认为创业生活可能是一场即兴表演。
- Ali Baghshomali 是 Product Analytics Academy 的创始人,这是一所提供高质量产品分析课程的在线学校。他还是 Mentat Analytics 的创始人,Mentat Analytics 是一家顶级的分析咨询机构。他之前曾在 Bird 和 Buzzfeed 的数据团队工作。
- Cynthia Balusek,我们的主持人,也是 Metabase 的成功工程副总裁。
初创公司的事件管理可能出现哪些问题
Amogh: 我想分享的故事是关于我们如何为 Eesel 连接事件,特别是处理早期阶段的事件跟踪。
Eesel 是一款浏览器扩展程序,可过滤您的搜索历史记录,仅在新标签页中显示与工作相关的链接。它的最初目的是为团队协作构建一项新功能。为了跟踪其性能,我们设置了事件跟踪,例如 projectCreated
、projectOpened
…… 看起来很容易也很直接,对吧?
但实际上,在该功能发布后的三个月内,我们将“项目”重命名为“文件夹”,这导致事件名称从 projectCreated
更改为 folderCreated
等。嗯,这也是可以管理的;我们创建了自定义事件,并在某种程度上更新了这些名称。
但后来我们了解到,我们还需要一些更细致的事件,例如 settingOpened
或 linkClicked
。当我们跟踪这些事件时,我们也碰巧更新了我们的产品,并且出现了可以打开这些文件夹的新位置。因此,我们也需要为它们创建新事件。
我们在某个时候面临的问题是: 我们应该忽略数据,还是花费大量时间和精力来保持数据更新?
我们发现了这个 react hook,换句话说,就是“通用点击”,它基本上监听所有点击(按钮、链接、选择),并传递与点击内容关联的元数据。我们无需想出所有这些不同的事件名称,也无需对事件进行 QA。此解决方案与平台无关,几乎可以与所有工具一起使用。这真的让我们的 Eesel 生活变得更轻松。
Ali: Amogh,你谈到了一些团队都在努力解决的问题,即跟踪所有这些事件数据所需的工作。
我们可以将通用跟踪视为自己完成所有事情与允许自动跟踪为您完成工作之间的一种权衡。自动跟踪的优点是您可以捕获大量数据,并节省返回并编辑事件设置的开发时间。
另一方面,缺点是数据最终会变得更加混乱。由于您正在跟踪所有内容,因此会涌入大量事件数据,并且肯定会有一些数据可能没有用。例如,如果您更改产品的结构,事件名称最终会更改。这将增加数据治理方面的一些工作,您必须手动更新事件名称才能使数据保持一致。
另一个缺点是您将错过许多事件属性信息,这些信息可能特定于您正在跟踪的项目。
事件数据是指应用程序中的特定操作或事件。让我们以在线购买商品为例。您搜索产品,查看商品详情,将其添加到购物车,然后购买。这些事件中的每一个都将具有一个事件触发器,该触发器是一个数据点,指示:“有人搜索了”或“有人将商品添加到购物车”。事件带有时间戳,因此您可以知道哪个事件相对于彼此发生的时间。
事件具有与其相关的上下文信息,称为属性。仅知道有人搜索了某些内容是不够的,您还需要知道他们搜索的内容是什么。例如,对于事件“商品已搜索”,属性将是“搜索词”、“搜索类别”等。或者对于事件“商品已购买”,属性将是“商品价格”、“购买数量”等。当您进行自动跟踪时,您不再设置自定义属性。
这里的建议是进行混合事件管理,即放入一些自动跟踪来捕获一组事物,以避免数据中出现空白,但也要确保您进行手动事件跟踪,否则您可能会错过很多信息。
我还建议您将分析部分视为产品开发周期的一部分。因此,对于您构建的每个功能,您都应该提前列出您想要回答的关于该功能的问题列表,或者您想要跟踪的指标。这样,您就可以提前制定事件和属性集,这将帮助您在将来回答这些问题。这样,每次发布新内容时,事件跟踪信息也会随之发布。我在我们的产品分析课程中更详细地介绍了这一点。
初创公司的数据管理:何时选择合适的工具
Amogh: 我想分享的另一个故事是关于我们的第一个数据堆栈。在最初,我们只有几千个用户,没有任何数据库,我们使用了 Intercom 和 Google 表格的组合。所有事件分析都来自 Intercom,特别是我们使用了 Intercom 提供的开箱即用的用户属性。对于任何特定用户,我们都会获得诸如 Signed up
、Last seen
、Browser
、OS
以及一些自定义属性(如“Appversion”、“Eesel 使用的空间量”等)之类的信息。
当时,Intercom 没有太多可用的数据可视化报告。也没有办法可视化随时间变化的趋势。因此,我手动将数据导出到 Google 表格并从中创建可视化效果。随着时间的推移,我们不断升级,开始使用 Metabase、Mixpanel 和 Segment。
Ali: 对于初创公司来说,从 Google 表格开始是非常普遍的,而且它实际上是一个非常强大的工具。部分困难在于您需要不断手动导出、清理和更新数据。对于早期创业公司来说,总是存在这样一个问题: “我们应该使用哪种工具,以及每种工具的最佳使用时机是什么?” 这是我在与客户合作时最常被问到的问题之一。尽管所有公司都不尽相同,并且没有一种适用于所有公司的分析框架,但仍然有一个粗略的规则可以帮助您在合适的阶段选择合适的工具。
-
预发布/封闭 Alpha 版: 当您处于非常早期的阶段(~10 个用户)时,您需要专注于定性方面的事情,并与您的用户进行更深入的对话。
-
发布/公开 Beta 版: 当您发布,并且拥有大约 100 个用户,并且团队中还没有 SQL 专家时 - 产品洞察力将成为您的首要任务。始终建议在发布之前进行设置,以便之后一切就绪。
-
增长/扩展: 虽然之前的设置非常适合产品洞察力,但它实际上并未涵盖业务分析,而这正是 Metabase 等工具的用途所在。当用户超过 1000 个时,您可以开始实施现代数据堆栈。我建议您在开始设置 MDS 之前,团队中应该有人拥有 SQL 经验。即使像 Metabase 这样的工具不一定要求您了解 SQL,但 SQL 仍然是从数据中获得最大价值的主要方法。因此,如果您想继续建立现代数据堆栈,请等到团队中出现数据人员并且可以获得所有权为止。