‧
8分钟阅读
万圣节特辑:初创公司的数据恐怖故事
Metabase 团队
‧ 8分钟阅读

分享此文章
2022年10月20日,我们与 Eesel 联合创始人 Amogh Sarda 以及 Mentat Analytics 数据专家 Ali Baghshomali 齐聚一堂,讨论了初创公司的一些数据恐怖故事以及如何避免它们。我们探讨了年轻公司可能遇到的真实案例,并解释了其动机和潜在后果。
以下是对话的简短摘录及完整录音。
与会者
- Amogh Sarda,Eesel 联合创始人,Eesel 是一款能将您所有工作文档直接显示在新标签页的工具。他常驻澳大利亚,曾是 Atlassian 和 Intercom 的产品经理。他热爱即兴喜剧,并认为创业生活可能就是一场即兴表演。
- Ali Baghshomali 是 Product Analytics Academy(一家提供高质量产品分析课程的在线学校)的创始人。他还是 Mentat Analytics(一家顶级分析咨询机构)的创始人。他曾在美国 Bird 和 Buzzfeed 的数据团队工作。
- Cynthia Balusek,我们的主持人,Metabase 成功工程副总裁。
初创公司事件管理可能出现的问题
Amogh: 我想分享的故事是我们如何为 Eesel 设置事件,特别是初创阶段的事件跟踪。
Eesel 是一个浏览器扩展,可以过滤您的搜索历史,只在新标签页中显示与工作相关的链接。我们最初希望为团队协作构建一个新功能。为了跟踪其表现,我们设置了事件跟踪,例如 projectCreated
、projectOpened
……看起来很简单直接,对吧?
但实际上,在功能发布三个月后,我们将“项目”重命名为“文件夹”,这使得事件名称从 projectCreated
更改为 folderCreated
等。嗯,这也还能管理;我们创建了自定义事件并更新了这些名称。
但后来我们发现还需要一些更细致的事件,例如 settingOpened
或 linkClicked
。在跟踪这些事件的同时,我们也更新了产品,出现了可以打开这些文件夹的新位置。所以我们也需要为它们设置新事件。
我们发现了一个 React Hook,换句话说就是“通用点击”功能,它基本上会监听所有点击(按钮、链接、选择框),并传递与点击内容相关的元数据。我们无需再为这些事件想出各种不同的名称,也无需对事件进行质量保证。这个解决方案是平台无关的,几乎可以与市面上的所有工具一起使用。这确实让 Eesel 的工作变得更轻松了。
我们发现了一个 React Hook,换句话说就是“通用点击”功能,它基本上会监听所有点击(按钮、链接、选择框),并传递与点击内容相关的元数据。我们无需再为这些事件想出各种不同的名称,也无需对事件进行质量保证。这个解决方案是平台无关的,几乎可以与市面上的所有工具一起使用。这确实让 Eesel 的工作变得更轻松了。
Ali: Amogh,你提到了许多团队都在努力解决的一个问题,那就是跟踪所有这些事件数据所需的工作量。
我们可以将通用跟踪视为一种权衡,即是所有事情都亲力亲为,还是让自动跟踪为您完成工作。自动跟踪的优点是您可以捕获大量数据,并且节省了回溯和编辑事件设置的开发时间。
另一方面,缺点是数据会变得非常混乱。由于您跟踪所有内容,会有大量事件数据涌入,其中肯定会有一些可能无用的数据。例如,如果您更改产品结构,事件名称最终也会更改。这将在数据治理方面增加一些工作量,您必须手动更新事件名称以保持数据一致性。
另一个缺点是,您将错过许多可能与您正在跟踪的项目相关的事件属性信息。
事件数据是指应用程序中的特定操作或发生情况。我们以在线购物为例。您搜索产品、查看商品详情、将其添加到购物车并购买。这些事件中的每一个都会有一个事件触发器,这是一个数据点,表示:“有人搜索了”或“有人将商品添加到了购物车”。事件都带有时间戳,因此您可以知道它们之间发生的相对顺序。
事件伴随有称为属性的上下文信息。仅仅知道有人搜索了某些东西是不够的,您还需要知道他们搜索了什么。例如,对于事件“商品已搜索”,属性将是“搜索词”、“搜索类别”等。或者对于事件“商品已购买”,属性将是“商品价格”、“购买数量”等。当您进行自动跟踪时,您将不再设置自定义属性。
这里的建议是采用混合事件管理,即进行部分自动跟踪以捕获一组事物,以避免数据出现空白,但也要确保进行手动事件跟踪,否则您可能会错过大量信息。
我还建议您将分析部分视为产品开发周期的一部分。因此,对于您构建的每个功能,您都应该提前列出要回答的有关该功能的问题,或要跟踪的指标。这样您就可以提前设计出有助于您将来回答这些问题的事件和属性集。这样,每次发布新内容时,事件跟踪信息也会随之发布。我在我们的产品分析课程中更详细地介绍了这一点。
初创公司的数据管理:何时选择合适的工具
Amogh: 我想分享的另一个故事是关于我们的第一个数据技术栈。一开始我们有几千名用户,但没有任何数据库,我们结合使用了 Intercom 和 Google 表格。所有事件分析都来自 Intercom,特别是我们使用了 Intercom 提供的开箱即用的用户属性。对于任何特定用户,我们都会获取“已注册”、“上次活动时间”、“浏览器”、“操作系统”等信息,以及一些自定义属性,如“应用程序版本”、“Eesel 使用空间大小”等。
当时 Intercom 没有太多可用的数据可视化报告。也没有办法可视化随时间变化的趋势。所以我手动将数据导出到 Google 表格并从中创建可视化。随着时间的推移,我们逐渐升级,开始使用 Metabase、Mixpanel 和 Segment。
Ali: 对于初创公司来说,从 Google 表格开始是很常见的,而且它实际上是一个非常强大的工具。部分困难在于您需要手动不断导出、清理和更新数据。对于处于早期阶段的初创公司来说,总会有这样一个问题:**“我们应该使用哪种工具,以及每种工具何时使用?”**这是我在与客户合作时最常被问到的问题之一。尽管所有公司都不同,也没有一种分析框架适用于所有公司,但仍然有一个粗略的规则可以帮助您在正确的阶段选择正确的工具。
-
发布前/内测阶段: 当您处于非常早期阶段(约10个用户)时,您需要专注于定性方面,并与用户进行更深入的交流。
-
发布/公测阶段: 当您发布产品并拥有大约100名用户,但团队中还没有 SQL 专业知识时,产品洞察将成为您的首要任务。建议您在发布前设置好所有内容,以便之后一切就绪。
-
增长/规模化阶段: 尽管之前的设置非常适合产品洞察,但它实际上并未涵盖商业分析,而这正是 Metabase 等工具的作用所在。当用户超过1000名时,您可以开始实施现代数据技术栈。在开始设置 MDS 之前,我建议您团队中有人具备 SQL 经验。尽管 Metabase 等工具不一定要求您了解 SQL,但 SQL 仍然是充分利用数据的主要方式。因此,如果您想推进建立现代数据技术栈,请等到您的团队中出现数据人员并能对此负责。