2023年Metabase社区数据堆栈报告

数据工具和自助分析的当前状态一览

今年初,我们通过社交渠道和电子邮件发布了一项匿名数据栈调查,以了解更多关于数据工具及其对不同公司规模和角色的影響。

调查对任何人都开放,但我们在收到的189份回复中,有89%是Metabase客户。

由于样本量较小,我们无法说我们的洞察力是对各地数据人员的统计显著代表,但结果有几个你可能想了解的事情,比如一个特定的数据库可能对你的团队士气有害... 继续阅读以了解更多信息。

Blue Star

复制到剪贴板 大型公司更有可能选择开源数据工具

探索仪表板

75%的调查受访者表示他们正在使用开源生产数据库,因此Postgres和MySQL在调查中经常被提及并不令人惊讶。但有一个惊喜:大型公司选择开源生产数据库的频率更高。

大型公司表示,开源,而非性能、可扩展性和安全性,是他们选择生产数据库的决定性因素。

趋势显示,75%的大公司受访者表示dbt目前是他们的数据栈的一部分。开源也是他们选择数据建模工具的前三个原因之一。

开源在调查结果中无处不在,这并不令人惊讶,鉴于我们的社区团结在所有开源工具周围,而不仅仅是BI。

Beige S

复制到剪贴板 客户数据比以往任何时候都更有价值。社交媒体数据呢?那就未必了。

Salesforce是上游数据源的第一名。Stripe和Slack也位列前五。我们很好奇你正在摄入哪些Slack数据...

说到前五名,这些工具都包含大量PII,因此令人惊讶的是,92%的受访者并没有将安全和合规性作为他们选择数据存储选项的主要原因。(这需要另一项调查...)

没有令人惊讶的是:许多人不再从单一社交媒体平台摄入数据。

每月42,000美元的企业API费用可能已经成了最后的致命打击。X,原名Twitter(R.I.P.),在我们的前十名上游数据源中几乎排不上号。
探索仪表板
Pink Hourglass

复制到剪贴板 尽管市场上有很多选择,但大多数公司仍然将数据采集保留在内部。

Airbyte和Fivetran并列第三,但内部数据采集仍然比两者之和更受欢迎。

探索仪表板

可能是遗留架构迫使人们构建内部采集工具。或者第三方工具的成本超过了其带来的好处。

也可能是第三方采集工具仍在不断发展,所以明年我们可能会看到向它们转变的趋势。

但相当多的公司仍然选择构建自己的采集管道。我们在数据目录中也看到了类似的趋势(下面将详细介绍)。

现在您可以将那些Python脚本保留备用。内部数据采集似乎将作为商业产品的一个补充存在,而不是完全被第三方采集工具所取代。

Mustard Ellipsis
探索仪表板

复制到剪贴板 数据目录的未来……不是数据目录吗?

使用数据目录的人中有40%表示他们使用内部工具来托管它。而且没有任何一个商业工具能接近这个选项。

不出所料,绝大多数人说他们根本不使用数据目录。

80%的小公司受访者表示他们要么不使用数据目录,要么不知道是否使用。75%的中型公司受访者也有同样的说法。

虽然77%的大型公司受访者表示他们使用数据目录,但数据目录还是有点坏名声。

在现代数据栈中切换多个工具,并在其之上添加数据目录所带来的痛苦是一个明显的痛点。如果数据目录要保持相关性,它需要一点独创性。

现在感觉是时候让现有的数据工具为用户提供新的数据资产组织方式了;将需要数据目录的替代方案。

Gray Glider

复制到剪贴板 Postgres 是最令人满意的数据库... 如果你在分布式团队中,则更是如此

尽管它是行业中最广泛使用的数据库之一,但MySQL在三个最常用的分析数据库中角色满意度得分最低。

探索仪表板 您可能需要重新考虑您的数据库...以及您的返岗政策。那些在工作中最快乐的人表示,他们在一个分布式团队环境中使用 PostgreSQL。

如果您正在使用 MySQL 并且有不同意见,我们非常乐意听取。 至于我们对 MySQL 低分的理论:它是一个经过考验的数据库,但也许 MySQL 正在维持较老(不那么有趣)的代码库。

Postgres 用户还表示,他们的公司比其他分析数据库的用户更加自我服务,所以如果您是一个全球的完全远程团队,这可能是一个明智的选择。

探索仪表板
Orange Star

复制到剪贴板 分布式团队的自我服务评分更高,但有一个角色与其他角色不同。

在分布式团队中工作的人表示,他们的公司比本地化团队更加自我服务。分布式公司需要自我服务工具和流程来实现异步工作并让员工在方便的时候自行查询。这很简单。

探索仪表板

但从员工满意度调查结果来看,有一个大问题是:不同角色的自我服务观念不同。

数据角色的人员认为,他们的公司相比C级和工程部门,自助服务的程度较低。 探索仪表板

毫不奇怪,C级和工程师认为他们的公司自助服务程度更高。他们是使用自助工具的人。

这些结果可能意味着自助服务正在按预期进行。这也可能意味着数据分析人员认为他们的公司自助服务程度没有他们希望的那么高。这里的变化不大,但值得关注。

好消息是我们可以通知您是否发生了变化!填写下面的调查表,帮助我们了解情况。

数据堆栈调查的未来

数据堆栈调查仍然开放。您现在可以通过表格提交答案。我们将随着新有趣发现的到来创建后续帖子。

仪表板和这份报告是供您使用的静态数据。如果您用这些数据做了什么酷的东西,请确保与我们分享!