‧
阅读时间:3 分钟
您不需要数据仓库
Metabase 团队
‧ 3 分钟阅读
分享本文
即使您没有数据仓库,也可以开始从数据中获取洞察。事实上,一开始就建立数据仓库是一个糟糕的主意。
别误会我们的意思:数据仓库很棒。我们非常喜欢。但我们更喜欢立即行动,而不是等待一个完美的情况。因为任何数据都比没有数据好。即使您拥有的数据不完美或不全面,**任何**数据可能都会比没有数据更能指引您走向正确的方向。
我们有一篇关于您应该使用哪个数据仓库的文章,其中详细介绍了随着组织的发展,如何考虑数据仓库。但本文重点强调一个单一的公共服务公告:**立即开始查询您的生产数据库**。
尽早开始查询您的生产数据库
我们假设您是一家初创公司,并且已经构建了某种软件或程序,该软件使用数据库来跟踪其操作。在这个阶段,您可能会看到一些增长,人们开始使用您的应用程序或服务,而您想更清楚地了解实际情况。
在投资专用数据仓库之前,请选择一个商业智能工具——最好是免费或低成本的——它可以让您查询和可视化数据,并将其连接到您的生产数据库。
换句话说,这意味着
真实生活中原型化是建模数据仓库的最佳方式
设置数据仓库是一项艰巨的工作。我们看到发生的情况是,那些过快地投入数据仓库的公司发现,他们建模数据**的方式**未能解决他们想要回答的问题。这意味着他们只是将原型设计阶段推迟了,而且使该阶段的成本大大增加。
您可以使用 Metabase 或 Superset 之类的工具,甚至可以使用 Microsoft Excel、Google Sheets 或 LibreOffice Calc 等电子表格软件来原型化数据建模。通过以这种低保真度的方式,利用您的应用程序中已有的数据进行操作,您将学会
- 您正在处理哪种数据
- 您对其中哪些数据真正感兴趣
- 这些数据在任何方面是否准确或反映了现实生活中的情况
- 您可能应该开始收集哪些数据
提问和提取数据的过程将帮助您对数据进行建模,这样,当您真正**需要**数据仓库时,您将能够更好地掌握如何构建它。
何时升级到数据仓库
最终,当您有大量用户使用您的应用程序时,您将有更多的数据需要筛选。您将开始对生产数据库运行大量大型分析查询,并且您会发现自己对着加载动画发呆。
即使**那样**,您也可以通过复制生产数据库并添加一些物化视图来使数据更易于查询。这样,您就可以分析数据,而不会让生产数据库因长时间运行的分析查询而停滞。
与此同时,您开始积累更多的工具来管理日常业务运营任务。这意味着更多的数据,您可能希望将其与应用程序数据一起存储,以建立单一事实来源。这时,您就应该开始考虑数据仓库了。