挑战: 在使用 Metabase 之前,Dribbble 曾使用过另一种商业智能工具,但该工具的原子单元是仪表盘,这使得寻找特定问题变得复杂。他们的团队成员会反复向数据团队询问在哪里查找特定图表。
解决方案: Dribbble 的数据科学总监在一次 dbt Coalesce 演讲中听说了 Metabase。他们最初部署了 Metabase 的开源版本,发现团队可以更轻松地探索数据和提出问题。最终,他们将 Metabase 定为公司唯一的商业智能工具。
成果: Metabase 使非技术团队成员能够轻松地查询和探索他们的数据,而无需寻求数据团队的帮助。
“Metabase 提高了数据的可访问性,让团队中的每个人都能拥有更多能力,而无需学习如何编写 SQL。”
Charles Lariviere
Dribbble 数据科学总监
Dribbble 是全球领先的创意人士社区,供其分享、成长和求职。Dribbble 成立于 2009 年 7 月,已发展成为一个全球性社区,数千万人在此获得灵感并与世界各地的设计师建立联系。截至 2020 年 1 月,已分享近 1000 万个“作品”(设计师作品快照),使 Dribbble 成为最多产、最活跃的设计社区之一。
2021 年,Dribbble 的数据团队决定从头开始重建他们的所有分析堆栈。他们更换了数据仓库、ETL 工具,并迁移到 Metabase。此前,他们的仪表盘都是基于 SQL 的。
“我们主要的痛点是找到正确的信息,这在使用我们之前的工具时更加困难,因为它的原子单元是仪表盘。Metabase 的原子单元是图表,这对我们来说非常有吸引力。当我们的团队成员寻找每日活跃用户时,他们不需要知道这个图表是流量仪表盘的一部分还是任何其他仪表盘的一部分。”—— Dribbble 数据科学总监 Charles Lariviere 说。
Dribbble 最初部署了 Metabase 的开源版本,但后来迁移到了云版本。Charles 表示,他们自己管理开源版本并不算太难,但仍然有些麻烦,而且他们还希望利用完整的企业版/专业版功能包。(此外,他们只是想支持 Metabase 这个开源项目。)
Dribbble 使用 Snowflake 进行所有数据仓储,并使用 dbt 在 Snowflake 中建模数据。在 Metabase 中,他们只提供通过 dbt 建模和测试过的数据。他们使用 Snowplow 捕获人们如何与网站互动,并使用 Dagster 从各种来源 ETL 数据。
Dribbble 团队在公司内部使用 Metabase 进行所有商业智能工作。他们将其用于财务报告、监控订阅指标、网络性能指标、用户增长等诸多方面。
所有旨在供所有人分享和使用的数据都由他们的数据团队准备。但每个人都可以访问、探索数据、下钻,并保存自己的问题。
Dribbble 的产品团队成员在 Metabase 上最活跃。产品经理会大量下钻所有图表,以了解人们如何浏览产品,或者哪些人群对特定指标影响最大。
在大多数情况下,Dribbble 团队使用图形化查询生成器在 Metabase 中提出问题。他们更喜欢这种方式,因为它更容易让任何人下钻并理解图表是如何创建的。
“在基于 SQL 的问题中,你可以看到查询是如何编写的,但除非你熟悉这种语言——而许多人并不熟悉——否则你无法真正完全理解问题是如何构建的。”—— Charles Lariviere 说。
Dribbble 团队也喜欢 Metabase 中数据组织的方式。他们按功能(财务、营销、产品工程等)创建顶级集合,每个集合都包含逻辑文件夹。
有了 Metabase,公司里的每个人都能更容易地找到问题的答案,并直接知道去哪里查找信息。Dribbble 的数据科学负责人表示,与他们之前的商业智能工具相比,他们团队提出的“在哪里找到这些信息?”这类问题更少了。
现在整个团队都能够下钻、添加自己的筛选器、分组,并全面深入挖掘数据。
Dribbble 获得的一个意想不到的好处是了解了 Metabase 的 API 以及他们可以利用它做多少事情。他们已经开始编写代码来自动化他们的工作流程,例如更新所有列的数据类型,并在模型之间添加描述和外键关系。他们还计划自动化指标和分段的创建,以便在版本控制的 dbt 配置文件中管理它们。
“我们越来越关注如何将指标作为创建图表的基础。我们发现这非常强大——直接在表中定义指标,然后所有图表都基于这些指标。这是保持图表一致性的好方法:如果我们决定更新指标,这一更改将反映在使用该指标的所有图表中。”—— Charles Lariviere 说。