‧
3 分钟阅读
你不需要数据仓库
Metabase 团队
‧ 3 分钟阅读

分享这篇文章
你不需要数据仓库就能开始从你的数据中获得洞见。事实上,一开始就使用数据仓库是个坏主意。
不要误解我们:数据仓库很棒。我们是忠实粉丝。但我们更推崇现在就行动,而不是等待完美的情况。因为有数据总比没数据好。即使你的数据不完美或不全面,任何数据都可能比完全没有数据更能为你指明方向。
我们有一篇关于 你应该使用哪个数据仓库 的文章,详细介绍了如何在你组织发展壮大时考虑数据仓库,但本文的重点是强调一项公共服务公告:马上开始查询你的生产数据库。
尽快开始查询你的生产数据库
我们假设你是一家初创公司,并且你已经构建了一些软件或程序,这些软件使用数据库来跟踪其操作。大概在这个阶段你看到了一些增长,人们开始使用你的应用或服务,并且你想更好地了解事情的实际进展情况。
在你投资专用数据仓库之前,先选择一个商业智能工具——最好是免费或低成本的——它可以让你查询和可视化你的数据,并将其连接到你的生产数据库。
这是另一种说法,即
建模数据仓库的最佳方式是在实际应用中进行原型设计
设置数据仓库需要大量工作。我们看到的情况是,过快投入数据仓库的公司发现,他们建模数据的方式无法解决他们想要回答的各种问题。这意味着他们只是推迟了原型设计阶段,并使该阶段的成本更高。
你可以使用像 Metabase 或 Superset 这样的工具,甚至像 Microsoft Excel、Google Sheets 或 LibreOffice Calc 这样的电子表格软件来原型化数据建模。通过以这种简陋的方式处理应用程序中存在的数据,你将了解:
- 你正在处理哪种数据
- 你实际对哪些数据感兴趣
- 这些数据在任何方面是否准确或反映了现实生活中的事物
- 你可能应该开始收集哪些数据
提出问题和提取数据的练习将帮助你建模你的数据,以便在真正需要数据仓库时,你能够更好地掌握如何构建它。
何时升级到数据仓库
最终,如果你有很多人使用你的应用程序,你将有更多数据需要筛选。你将开始对你的生产数据库运行许多大型分析查询,并且你会发现自己茫然地盯着加载动画。
即使那样,你也可以通过复制你的生产数据库并添加一些物化视图来使数据更易于查询。这样,你就可以分析你的数据,而不会让你的生产数据库被长时间运行的分析查询占用。
与此同时,你开始积累更多工具来管理运营业务所涉及的日常任务。这意味着更多的数据,你可能希望将这些数据与你的应用程序数据一起存储,以建立单一的事实来源。而那时你才应该开始考虑 数据仓库。