‧
阅读时间:8分钟
万圣节版:初创公司中的数据恐怖故事
Metabase 团队
‧ 8分钟阅读
分享这篇文章
2022年10月20日,我们与 Eesel 的联合创始人 Amogh Sarda 和 Mentat Analytics 的数据专家 Ali Baghshomali 一起讨论了初创公司中的数据恐怖故事以及人们可以做什么来避免这些情况。我们通过一些可能发生在年轻公司中的真实故事,解释了这些故事的动机和潜在后果。
以下是对话的简短摘录以及完整的录音。
参会者
- Amogh Sarda,Eesel(https://eesel.app)的联合创始人。Eesel是一款将所有工作文档直接带到新标签页的工具。他来自澳大利亚,之前曾是Atlassian和Intercom的产品经理。他热爱即兴喜剧,认为创业生活可能就像一场即兴表演。
- Ali Baghshomali是产品分析学院(https://www.productanalytics.academy/)的创始人,这是一所提供高质量产品分析课程的在线学校。他还是Mentat Analytics(https://www.mentatanalytics.co/)的创始人,这是一家顶级数据分析咨询公司。他之前曾在Bird和Buzzfeed的数据团队工作。
- Cynthia Balusek,我们的主持人,同时也是Metabase的成功工程副总裁。
初创公司事件管理可能出错的地方
Amogh:我想分享的故事是关于我们如何为Eesel设置事件,尤其是处理早期阶段的事件跟踪。
Eesel是一款浏览器扩展,可以过滤掉您的搜索历史,并直接在新标签页中显示与工作相关的链接。它始于我们构建团队协作新功能的愿望。为了跟踪其性能,我们设置了事件跟踪,如projectCreated
、projectOpened
……这似乎很简单,不是吗?
但实际上,从功能发布后的三个月开始,我们将“项目”重命名为“文件夹”,将事件名称从projectCreated
更改为folderCreated
等。嗯,这也是可以管理的;我们创建了自定义事件,并更新了这些名称。
但后来我们意识到,我们还需要更多细微的事件,例如例如settingOpened
或linkClicked
。在我们跟踪这些事件的同时,我们还更新了我们的产品,出现了可以打开这些文件夹的新位置。因此,我们也需要为它们设置新的事件。
我们面临的一个问题是:我们应该放弃数据,还是投入大量时间和精力来保持数据的更新?
我们发现了这个react hook,换句话说,是一个“通用点击”,它基本上监听所有点击(按钮、链接、选择)并传递与被点击的任何东西相关的元数据。我们不需要想出所有这些不同的事件名称,也不需要对这些事件进行质量保证。这个解决方案是平台无关的,可以与几乎每个工具一起使用。这真的让我们的Eesel生活变得更简单。
Ali:Amogh,你提到了很多团队都面临的问题,那就是跟踪所有这些事件数据所需的工作。
我们可以将通用跟踪视为自己做事或允许自动跟踪为你工作的权衡。自动跟踪的优点是你可以捕获大量数据,你可以节省开发时间,不必回过头来编辑你的事件设置。
但另一方面,缺点是数据会变得非常混乱。由于你跟踪了所有内容,你会收到大量事件数据,肯定会有一些可能不有用的数据。例如,如果你更改了产品的结构,事件名称将最终更改。这将给数据治理方面带来一些工作,你必须手动更新事件名称以确保数据的一致性。
另一个缺点是,你将错过很多特定于你跟踪的项目的事件属性信息。
事件数据指的是应用程序中特定的动作或事件。让我们以在线购买商品的一个简单例子来说明。你搜索一个产品,查看商品详情,将其添加到购物车,然后购买它。这些动作中的每一个都会有一个事件触发器,它是一个数据点,表示:“有人进行了搜索”或“有人将商品添加到购物车”。事件都会被标记时间戳,这样你可以知道相对于彼此哪个事件发生了。
事件旁边还有一些称为属性的相关上下文信息。只知道有人搜索了某个东西是不够的,你还需要知道他们搜索了什么。例如,对于“商品搜索”事件,属性可能是“搜索词”、“搜索类别”等。或者对于“商品购买”事件,属性可能是“商品价格”、“购买数量”等。当你进行自动跟踪时,你就不再需要设置自定义属性。
这里建议进行混合事件管理,即在捕获一系列事物以避免数据缺失的同时,确保你进行手动事件跟踪,否则你可能会错过很多信息。
我还建议您将分析部分视为产品开发周期的一部分。因此,对于您构建的每个功能,您都应该有一个关于该功能想要回答的问题列表,或者想要提前跟踪的指标。这样,您可以提前制定出一系列事件和属性,以帮助您在未来回答这些问题。这样,每次推出新功能时,事件跟踪信息都会与之一起推出。我在我们的产品分析课程中更详细地介绍了这一点。
初创公司的数据管理:何时选择合适的工具
Amogh:我还想分享另一个故事,关于我们的第一个数据栈。一开始我们只有几千个用户,没有任何数据库,我们使用Intercom和Google Sheets的组合。所有事件分析都来自Intercom,特别是我们使用了Intercom提供的开箱即用的用户属性。对于任何特定用户,我们都会得到诸如已注册
、最后可见
、浏览器
、操作系统
等属性,还有一些自定义属性,如“App版本”、“Eesel使用的空间量”等。
当时Intercom没有太多数据可视化报告。也无法可视化趋势。所以我手动将数据导出到Google Sheets中,并从中创建可视化。随着时间的推移,我们升级了,开始使用Metabase、Mixpanel和Segment。
阿里: 对于初创公司来说,从 Google Sheets 开始非常普遍,实际上这是一个非常强大的工具。其中一部分挑战是需要手动导出、清洗和更新数据。对于早期阶段的初创公司来说,始终存在这样一个问题:“我们应该使用哪个工具,何时使用每个工具?” 这是我在与客户合作时最常见的问题之一。尽管所有公司都不同,没有一种适用于所有公司的分析框架,但仍然有一个大致的规则可以帮助你在正确的阶段选择正确的工具。
-
预发布/封闭测试阶段: 当你处于非常早期的阶段(约10个用户)时,你应该专注于事物的定性方面,并深入与用户进行交流。
-
发布/公开测试阶段: 当你发布,并且大约有100个用户,团队中还没有SQL专业知识时——产品洞察成为你的重点。建议在发布之前设置此内容,以便之后一切就绪。
-
增长/扩展: 虽然之前的设置对于产品洞察非常有效,但它实际上并没有涵盖业务分析,这正是像 Metabase 这样的工具所提供的。在1000+用户时,你可以开始实施现代数据堆栈。我建议你在开始设置现代数据堆栈之前,团队中应该有一个人有SQL经验。尽管像Metabase这样的工具并不一定需要你了解SQL,但SQL仍然是获取数据的最佳方式。因此,如果你想向前推进,建立现代数据堆栈,等待数据人员加入团队并能够掌握这一点。