‧
阅读时间:3 分钟
您不需要数据仓库
Metabase 团队
‧ 3 分钟阅读

分享本文
您不需要数据仓库就可以从数据中获取洞察力。事实上,从数据仓库开始是一个糟糕的主意。
别误会:数据仓库很棒。我们是忠实粉丝。但我们更喜欢立即行动,而不是等待完美的情况。因为有数据总比没有数据好。即使您的数据不完美或不全面,任何数据都可能会让您走向比完全没有数据更好的方向。
我们有一篇文章您应该使用哪个数据仓库,详细介绍了随着组织发展如何考虑数据仓库,但本文侧重于一个单一的公共服务公告:立即开始查询您的生产数据库。
尽快开始查询您的生产数据库
我们假设您是一家初创公司,您已经构建了某种软件或程序,并且该软件使用数据库来跟踪其操作。在这个阶段,您可能正在看到一些增长,人们开始使用您的应用程序或服务,并且您希望更好地了解实际情况。
在您投资专用数据仓库之前,请选择一个商业智能工具——最好是免费或低成本的——它允许您查询和可视化数据,并将其连接到您的生产数据库。
这也可以说
对数据仓库建模的最佳方式是在实际中进行原型设计
设置数据仓库需要大量工作。我们看到的情况是,过快地投入数据仓库的公司发现他们建模数据的方式并不能解决他们想要答案的问题。这意味着他们只是推迟了原型设计阶段,并使该阶段变得更加昂贵。
您可以使用 Metabase 或 Superset,甚至 Microsoft Excel、Google Sheets 或 LibreOffice Calc 等电子表格软件来原型化数据建模。通过这种低保真方式处理应用程序中存在的数据,您将学习
- 您正在处理什么类型的数据
- 您实际感兴趣的是哪些数据
- 这些数据是否准确或反映了现实生活中的情况
- 您可能应该开始收集哪些数据
提问和提取数据的过程将帮助您对数据进行建模,这样,当您真正需要数据仓库时,您将更好地了解如何构建它。
何时升级到数据仓库
最终,如果您的应用程序有很多人使用,您将有更多数据需要筛选。您将开始对生产数据库运行大量大型分析查询,然后会发现自己茫然地看着加载动画。
即便如此,您也可以通过复制生产数据库并添加一些物化视图来简化数据查询。这样,您可以分析数据,而无需将生产数据库与长时间运行的分析查询绑定。
然而,与此同时,您正在开始积累更多工具来管理日常业务任务。这意味着更多数据,您可能希望将其与应用程序数据一起存储,以建立单一事实来源。这时您就需要开始考虑数据仓库。