‧
8 分钟阅读
万圣节特辑:初创公司的数据恐怖故事
Metabase 团队
‧ 8 分钟阅读

分享本文
2022 年 10 月 20 日,我们与 Eesel 联合创始人 Amogh Sarda 和 Mentat Analytics 的数据专家 Ali Baghshomali 坐在一起,讨论了一些初创公司的数据恐怖故事以及如何避免它们。我们谈论了可能发生在一家年轻公司的真实故事,解释了这些故事的动机和潜在后果。
以下是对话的简短摘录和完整录音。
参与者
- Amogh Sarda,Eesel 的联合创始人,Eesel 是一款能将您的所有工作文档直接显示在新标签页中的工具。他常驻澳大利亚,曾是 Atlassian 和 Intercom 的产品经理。他热爱即兴喜剧,并认为创业生活可能就是一场即兴表演。
- Ali Baghshomali 是 Product Analytics Academy 的创始人,这是一所提供高质量产品分析课程的在线学校。他还是 Mentat Analytics 的创始人,这是一家顶级分析咨询机构。他曾在 Bird 和 Buzzfeed 的数据团队工作。
- Cynthia Balusek,我们的主持人,Metabase 的成功工程副总裁。
初创公司事件管理可能出现的问题
Amogh: 我想分享的故事是关于我们如何为 Eesel 部署事件,特别是如何在早期阶段处理事件跟踪。
Eesel 是一款浏览器扩展,它能过滤掉您的搜索历史,只在新标签页中显示与工作相关的链接。我们最初的愿望是为团队协作构建一个新功能。为了跟踪其性能,我们设置了事件跟踪,如 projectCreated
、projectOpened
……看起来简单明了,对吧?
但实际上,在功能发布三个月后,我们将“项目”重命名为“文件夹”,这将事件名称从 projectCreated
更改为 folderCreated
等。嗯,这也可以管理;我们创建了自定义事件并更新了这些名称。
但后来我们明白,我们还需要一些更细致的事件,例如 settingOpened
或 linkClicked
。在我们跟踪这些事件的同时,我们也恰好更新了产品,并且出现了新的地方可以打开这些文件夹。因此我们也需要为它们设置新的事件。
我们某个时候面临的问题是:我们应该放弃数据,还是花费大量时间和精力来保持数据最新?
我们发现了这个React Hook,换句话说,这是一个“通用点击”功能,它基本上监听所有点击(按钮、链接、选择),并传递与所点击内容相关的元数据。我们无需为所有这些不同的事件命名,也无需对事件进行 QA。此解决方案与平台无关,几乎可用于所有工具。这确实让 Eesel 的生活变得更轻松。
Ali: Amogh,你提到了许多团队都在努力解决的一个问题,那就是跟踪所有这些事件数据所需的工作量。
我们可以将通用跟踪视为一种权衡,即是自己完成所有工作,还是让自动跟踪为您完成。自动跟踪的优点是您可以捕获大量数据,节省开发时间,无需返回并编辑事件设置。
另一方面,缺点是数据会变得更加混乱。由于您正在跟踪所有内容,因此会有大量事件数据涌入,其中肯定会有一些可能无用的数据。例如,如果您更改了产品结构,事件名称最终会发生变化。这会增加数据治理方面的一些工作,您将不得不手动更新事件名称以使数据保持一致。
另一个缺点是,您将错过许多可能特定于您正在跟踪的项目的重要事件属性信息。
事件数据是指应用程序中的特定动作或发生情况。让我们举一个在线购物的简单例子。您搜索产品,查看商品详情,将其添加到购物车,然后购买。这些事件中的每一个都会有一个事件触发器,它是一个数据点,表示:“有人搜索了”或“有人将商品添加到了购物车”。事件都带有时间戳,因此您可以知道它们之间发生的相对顺序。
事件还附带上下文信息,称为属性。仅仅知道有人搜索了某些东西是不够的,您还需要知道他们搜索的是什么。例如,对于“商品搜索”事件,属性将是“搜索词”、“搜索类别”等。或者对于“商品购买”事件,属性将是“商品价格”、“购买数量”等。当您进行自动跟踪时,您将不再设置自定义属性。
这里的建议是采用混合事件管理,即进行一些自动跟踪以捕获一组事物,以避免数据出现空白,但也要确保进行手动事件跟踪,否则您可能会错过大量信息。
我还建议您将分析部分视为产品开发周期的一部分。因此,对于您构建的每个功能,您都应该提前列出您想要回答的关于该功能的问题,或想要跟踪的指标。这样,您就可以提前确定一组事件和属性,这些事件和属性将帮助您将来回答这些问题。这样,每当有新功能发布时,事件跟踪信息也会随之发布。我在我们的产品分析课程中更详细地介绍了这一点。
初创公司的数据管理:何时选择合适的工具
Amogh: 我想分享的另一个故事是关于我们的第一个数据栈。我们最初有几千名用户,但没有任何数据库,我们使用 Intercom 和 Google Sheets 的组合。所有事件分析都来自 Intercom,我们特别使用了 Intercom 提供的开箱即用的用户属性。对于任何特定用户,我们都会获得诸如 Signed up
、Last seen
、Browser
、OS
等信息,以及一些自定义属性,如“Appversion”、“Eesel 使用的空间量”等。
当时 Intercom 没有太多可用的数据可视化报告。也没有办法随时间可视化趋势。所以我手动将数据导出到 Google Sheets 并从中创建可视化。随着时间的推移,我们开始使用 Metabase、Mixpanel 和 Segment。
Ali: 对于初创公司来说,从 Google 表格开始是很常见的,而且它实际上是一个非常强大的工具。困难之一是您需要手动不断导出、清理和更新数据。对于早期阶段的初创公司来说,总会有一个问题:“我们应该使用哪种工具,以及何时使用哪种工具?”这是我与客户合作时最常遇到的问题之一。尽管所有公司都不同,没有一个分析框架适用于所有公司,但仍然有一个粗略的规则可以帮助您在合适的阶段选择合适的工具。
-
预发布/封闭 Alpha 版:当您处于非常早期阶段(约 10 位用户)时,您希望专注于定性方面的事情,并深入与用户进行对话。
-
发布/公开 Beta 版:当您发布产品,拥有约 100 位用户,且团队中尚未有 SQL 专家时,产品洞察成为您的优先事项。始终建议在发布前完成此设置,以便之后一切就绪。
-
增长/扩展:虽然先前的设置非常适合产品洞察,但它并未涵盖业务分析,而这正是 Metabase 等工具的作用。当用户达到 1000+ 时,您可以开始实施现代数据栈。在开始设置 MDS 之前,我建议您拥有的一个条件是团队中有人具备 SQL 经验。尽管 Metabase 等工具不一定需要您了解 SQL,但 SQL 仍然是最大限度地利用数据的主要方式。因此,如果您想继续建立现代数据栈,请等到您的团队中出现一名数据人员并能对此负责。