今年初,我们通过社交渠道和电子邮件发布了一项匿名数据栈调查,以了解更多关于数据工具及其对不同公司规模和角色的影響。
调查对任何人都开放,但我们在收到的189份回复中,有89%是Metabase客户。
由于样本量较小,我们无法说我们的洞察力是对各地数据人员的统计显著代表,但结果有几个你可能想了解的事情,比如一个特定的数据库可能对你的团队士气有害... 继续阅读以了解更多信息。
75%的调查受访者表示他们正在使用开源生产数据库,因此Postgres和MySQL在调查中经常被提及并不令人惊讶。但有一个惊喜:大型公司选择开源生产数据库的频率更高。
大型公司表示,开源,而非性能、可扩展性和安全性,是他们选择生产数据库的决定性因素。 在x.com上分享趋势显示,75%的大公司受访者表示dbt目前是他们的数据栈的一部分。开源也是他们选择数据建模工具的前三个原因之一。
开源在调查结果中无处不在,这并不令人惊讶,鉴于我们的社区团结在所有开源工具周围,而不仅仅是BI。
Salesforce是上游数据源的第一名。Stripe和Slack也位列前五。我们很好奇你正在摄入哪些Slack数据...
说到前五名,这些工具都包含大量PII,因此令人惊讶的是,92%的受访者并没有将安全和合规性作为他们选择数据存储选项的主要原因。(这需要另一项调查...)
没有令人惊讶的是:许多人不再从单一社交媒体平台摄入数据。
每月42,000美元的企业API费用可能已经成了最后的致命打击。X,原名Twitter(R.I.P.),在我们的前十名上游数据源中几乎排不上号。 在x.com上分享Airbyte和Fivetran并列第三,但内部数据采集仍然比两者之和更受欢迎。
探索仪表板可能是遗留架构迫使人们构建内部采集工具。或者第三方工具的成本超过了其带来的好处。
也可能是第三方采集工具仍在不断发展,所以明年我们可能会看到向它们转变的趋势。
但相当多的公司仍然选择构建自己的采集管道。我们在数据目录中也看到了类似的趋势(下面将详细介绍)。
现在您可以将那些Python脚本保留备用。内部数据采集似乎将作为商业产品的一个补充存在,而不是完全被第三方采集工具所取代。
尽管它是行业中最广泛使用的数据库之一,但MySQL在三个最常用的分析数据库中角色满意度得分最低。
探索仪表板 您可能需要重新考虑您的数据库...以及您的返岗政策。那些在工作中最快乐的人表示,他们在一个分布式团队环境中使用 PostgreSQL。 在 x.com 上分享如果您正在使用 MySQL 并且有不同意见,我们非常乐意听取。 至于我们对 MySQL 低分的理论:它是一个经过考验的数据库,但也许 MySQL 正在维持较老(不那么有趣)的代码库。
Postgres 用户还表示,他们的公司比其他分析数据库的用户更加自我服务,所以如果您是一个全球的完全远程团队,这可能是一个明智的选择。
探索仪表板在分布式团队中工作的人表示,他们的公司比本地化团队更加自我服务。分布式公司需要自我服务工具和流程来实现异步工作并让员工在方便的时候自行查询。这很简单。
探索仪表板但从员工满意度调查结果来看,有一个大问题是:不同角色的自我服务观念不同。
数据角色的人员认为,他们的公司相比C级和工程部门,自助服务的程度较低。 在x.com上分享 探索仪表板毫不奇怪,C级和工程师认为他们的公司自助服务程度更高。他们是使用自助工具的人。
这些结果可能意味着自助服务正在按预期进行。这也可能意味着数据分析人员认为他们的公司自助服务程度没有他们希望的那么高。这里的变化不大,但值得关注。
好消息是我们可以通知您是否发生了变化!填写下面的调查表,帮助我们了解情况。