2025年4月7日,分类:新闻

8 分钟阅读

Product Hunt AMA回顾:嵌入、开源成功及更多

Sameer Al-Sakran Portrait
Sameer Al-Sakran
‧ 2025年4月7日,分类:新闻

‧ 8 分钟阅读

Product Hunt AMA Recap: embedding, open source success, and more Image

为了准备明天在 Product Hunt 推出我们的嵌入版本,我访问了 p/ama 来回答社区的问题。

我们为什么要推出 Metabase 嵌入式分析?

在过去的10年里,我们一直致力于提供一种简单且开源的方式,让您公司的任何人都能自行运行报告、制作图表,并普遍能够独立探索和处理数据。

我们已被超过7万家各种规模和类型的公司和组织所使用——从财富100强企业到当地的排球俱乐部。

数据分析是一场多人游戏,虽然分析师、数据科学家和其他数据艺术实践者是重要的参与者,但我们一直认为,从事日常工作的人们应该能够根据自己的时间需求获取所需数据。我们越来越多地发现,公司正在使用我们来向其客户(而不仅仅是其员工)提供数据和分析。我们一直在努力使这变得更容易、更快,并将结果称为“Metabase 嵌入式分析”。

在此过程中,我们通过帮助数百家公司在其产品中嵌入分析和报告学到了很多。这通常不仅仅是嵌入一个图表或一个仪表板,而是让您的客户能够根据他们在您的应用程序中生成的数据运行自己的报告。

那么,为什么选择 Product Hunt 呢?虽然你们中的许多人已经通过嵌入式分析实现了令人难以置信的成就——例如创造优质体验、开辟新收入来源以及差异化产品——但我们知道仍有大量团队在从零开始构建分析方面面临挑战。通过在 Product Hunt 发布,我们旨在传播 Metabase 嵌入式分析如何消除这些痛点,并帮助更多公司向其用户提供无缝、自助式分析。

AMA 拆解

在您看来,衡量一个开源项目成功的指标有哪些?

“我认为,如果你正在寻找一个大型、不断增长的开源项目,最重要达到的目标是增加在生产环境中(最好是愉快地)使用你的核心用户群体。反推过来,你还需要跟踪安装数量,以及大致试用你的人数(根据下载量或 Docker Hub 拉取量)。GitHub 会公开其中一些指标,Docker Hub 有另一套指标,你可能还会想在自己的服务器上托管发布版本,以便在那里获得准确的计数。

如果你是一个应用程序,那么某种形式的(选择性加入的)前端客户端跟踪也是理想的,这样你就能了解人们在应用程序内部到底在做什么。”

如果今天从头开始这个产品,你会怎么做?

“最直接的做法是,既然自然语言处理(NLP)基本上已经是一个已解决的问题,我们就会大量依赖自然语言进行查询(注意:我们现在正在使用我们的“Metabot”实现这一点)。

从更宏观的角度看,我会在更早的时候构建至少一个 Metabase 的“预览”付费版本并进行验证。做一个成功的开源项目很难,开一家商业软件公司也很难,两者兼顾则要烦人得多。我认为,了解你将如何商业化(即:测试方法并验证它们)是你需要在早期就理清的事情。我们很幸运,我们早期的一些重大押注最终成功了,但它们也很容易失败。”

当我想到开源分析时,我想到了 Plausible。您能帮我理解一下您是如何定位自己与它们的关系的吗?”

“Metabase 建立在数据库之上,允许您对数据库中的数据运行查询、制作图表、仪表板、设置警报等。Plausible(以及 Google Analytics、Mixpanel 等)是前端库、存储和更简单的查询工具的组合,用于执行所谓的“事件”或“使用”分析。将其视为一个相当专业的用例,而使用 Metabase,您可以对任何现有数据进行切片和分析。”

在这场多人游戏中,您认为 AI 在数据分析中扮演什么角色?

“现在,它是分析部门里一个非常粗心的实习生,其工作需要经过三重检查。

在未来的几个基础模型世代中,我认为它应该最终取代人类分析师在“我有一个问题” -> “这是答案”的循环中,并且可能也解决“这件事很令人困惑,你能深入挖掘一下发生了什么吗?”的问题。”

您的嵌入产品的主要区别是什么?为什么我应该选择它而不是其他竞争对手?

“从根本上说,我认为我们比所有替代方案都更‘省力’。如果你在整理面向客户的模式应该是什么样子上做一些前期工作,你可以在一两周内向客户展示成果。大多数人纠结于像素而完全忽略了数据形态,而我们认为(并鼓励你在产品中这样做)应该反其道而行之。”

在构建 Metabase 嵌入式分析时,您最大的“顿悟”时刻是什么?

“决定一个特定客户能否成功发布、发布所需时间,以及他们的客户是否使用应用内报告的关键因素,往往取决于数据模式(schema)以及应用的一般用户是否理解他们正在看的东西。通常情况下,分析师或数据工程师为其他数据从业者设计模式,却不真正理解他们应用普通用户的心态。”

在多租户设置中,您打算如何支持客户驱动的自定义分析,而不会使共享数据库过载?

“数据库(或数据仓库)的负载并不是我们将在 Metabase 本身解决的魔法问题。在某种程度上,你需要弄清楚要暴露哪些数据集,期望用户提出哪些特定形式的问题,行级别每个客户数据控制的索引模式等等。

在非常低的规模下,让客户直接访问应用程序数据库可能是有意义的。但对于任何实际的客户量,你确实应该配置一个单独的数据库,专门用于服务客户导向的分析。缓存可以在短期内提供帮助,但这终究是死胡同。

我们强烈建议将应用内分析视为面向客户的功能。对于面向客户的功能,性能非常重要,您应该优化数据库模式以支持这一点。这几乎肯定意味着您需要脱离主应用程序数据库,并创建更符合客户对应用程序中对象理解的自定义表。”

您如何看待在开源代码上建立业务?您是否觉得因自托管版本“损失”了收入?还是增加的曝光度“值得”?这甚至是一个正确的提问方式吗?有哪些优点和缺点?

“从根本上讲,你正在无偿提供一款耗费大量成本构建的软件,以换取更高的曝光度、愿意投资并提供帮助(无论是代码还是其他方面)的第三方,以及不断增长的信任。

这是一个难以平衡的等式,从历史上看,大多数人的结果都是负面的。

开源为我们带来了巨大的信誉、对项目充满热情的优秀工程师,以及广泛的曝光度。让这一切得以实现的一个因素是,我们从一开始就对我们要销售什么有着相当清晰的愿景。我确实认为你必须要么完全致力于成为开源,要么完全不走开源路线。我很少看到在这两者之间犹豫不决的人(尤其是在早期)取得成功。如果你选择开源还是闭源,在很多关键的早期决策上(例如,关于用户功能请求、支持等方面)你应该做出非常不同的选择。”

如果我自行构建面向客户的分析功能,有哪些特别具有挑战性或棘手的事情?

“我在另一个评论中提到,从‘我只添加这个图表’到意识到你需要处理通用查询,这是复杂性上最大的飞跃。

另外两个主要挑战是,确保你向最终用户呈现的模式正确无误,以及让整个体验的性能足够好,不至于让你的用户感到不适。”

构建分析功能时最大的难题是什么

“最大的难题是,通常在添加一两个图表后,您就会开始收到客户关于他们需要哪些数据的请求。这些请求通常大相径庭,而且都‘紧急’。在某个时候,您需要接受您需要构建一个通用查询界面,这往往会带来复杂性和麻烦的巨大飞跃。”

结束语

这就是 AMA 的全部内容。我非常愉快地回答了大家的问题,并分享了更多关于 Metabase 嵌入式分析的信息。如果您想帮助更多的构建者、创造者和产品人员发现嵌入式分析是他们的最佳选择,请在 Product Hunt 上支持我们

额外资源

您可能也喜欢

所有文章
The Metabase Community Data Stack Survey: by data teams, for data teams Image 2025年5月16日,分类:新闻

Metabase 社区数据技术栈调查:数据团队为数据团队而进行

现代数据技术栈如何演变:分享您的技术栈并看看它如何比较

Margaret Rimek Portrait
Margaret Rimek

2 分钟阅读

Introducing Metabase's new Embedded Analytics SDK for React Image 2025年2月27日,分类:新闻

介绍 Metabase 新推出的 React 嵌入式分析 SDK

适用于自定义嵌入式分析的 React 工具包,可无缝集成到您的 UI 中

Jess Thompson Portrait
Jess Thompson

1 分钟阅读

所有文章
© . All rights reserved.