‧
3 分钟阅读
您不需要数据仓库
Metabase 团队
‧ 3 分钟阅读

分享此文章
您不需要数据仓库就能开始从数据中获取洞察。事实上,一开始就使用数据仓库是个糟糕的主意。
别误会:数据仓库很棒。我们是忠实粉丝。但我们更倾向于“现在就做”而不是“等待完美情况”。因为有数据总比没有数据好。即使您的数据不完美或不全面,任何数据都可能比完全没有数据更能指引您走向更好的方向。
我们有一篇关于您应该使用哪种数据仓库的文章,其中详细介绍了随着组织成长如何考虑数据仓库,但本文着重强调一个公共服务公告:立即开始查询您的生产数据库。
尽快开始查询您的生产数据库
我们假设您是一家初创公司,您已经构建了某种软件或程序,并且该软件使用数据库来跟踪其操作。在这个阶段,您可能正在经历一些增长,人们开始使用您的应用程序或服务,您希望更好地了解实际情况。
在投资专用数据仓库之前,请选择一个商业智能工具——最好是免费或低成本的——它允许您查询和可视化数据,并将其连接到您的生产数据库。
换句话说就是
建模数据仓库的最佳方法是在实际中进行原型设计
设置数据仓库是一项繁重的工作。我们看到的情况是,那些过快投入数据仓库的公司发现,他们建模数据的方式并不能解决他们想要回答的问题。这意味着他们只是推迟了原型设计阶段,并使该阶段的成本大大增加。
您可以使用 Metabase 或 Superset,甚至 Microsoft Excel、Google Sheets 或 LibreOffice Calc 等电子表格软件来原型设计数据建模。通过这种低成本的方式,在数据实际存在于您的应用程序中的情况下进行操作,您将了解到
- 您正在处理哪种数据
- 您实际对哪些数据感兴趣
- 这些数据是否准确或真实地反映了现实情况
- 您应该开始收集哪些数据
提问和拉取数据的过程将帮助您建模数据,以便当您真正需要数据仓库时,您将更好地掌握如何构建它。
何时升级到数据仓库
最终,如果您的应用程序有大量用户使用,您将需要筛选更多数据。您将开始对生产数据库运行大量大型分析查询,然后您会发现自己茫然地盯着加载动画。
即使那样,您也可以通过复制生产数据库并添加一些物化视图来简化数据查询。这样,您可以分析数据,而不会让生产数据库被长时间运行的分析查询占用。
同时,您正在积累更多工具来管理日常业务任务。这意味着更多数据,您可能希望将这些数据与您的应用程序数据一起存储,以建立单一事实来源。这时您就需要开始考虑数据仓库了。