‧
阅读时间:3分钟
您不需要数据仓库
Metabase 团队
‧ 阅读时间:3分钟
分享这篇文章
你不需要数据仓库就可以开始从数据中获得洞察。事实上,一开始就使用数据仓库是个糟糕的想法。
请别误会:数据仓库很棒。我们是忠实粉丝。但我们更支持现在就开始做,而不是等待完美的时机。因为有些数据比没有数据好。即使你的数据不完美或不全面,任何数据都可能比你没有任何数据时指明更好的方向。
我们有一篇文章介绍哪些数据仓库你应该使用,详细介绍了随着组织的发展如何思考数据仓库,但本文重点是一个单一的服务公告:开始查询你的生产数据库。
尽快开始查询你的生产数据库
我们假设你是一家初创公司,你已经开发了一些软件或程序,该软件使用数据库来跟踪其功能。在这个阶段,你可能已经看到了一些增长,人们开始使用你的应用或服务,你想要更好地了解实际情况。
在你投资专用的数据仓库之前,选择一个业务智能工具——最好是免费或低成本——让你可以查询和可视化你的数据,并将其连接到你的生产数据库。
这又是另一种说法
将您的数据仓库在现实中进行原型设计是建模的最佳方式
建立数据仓库是一项大量工作。我们所看到的是,那些急于建立数据仓库的公司发现,他们建模数据的方式并没有解决他们想要解决的问题。这意味着他们只是推迟了原型设计阶段,使这一阶段变得更加昂贵。
您可以使用Metabase或Superset之类的工具进行数据建模原型设计,或者甚至使用Microsoft Excel、Google Sheets或LibreOffice Calc之类的电子表格软件。通过以这种方式在低品质的数据中摸索,正如它存在于您的应用程序中那样,您将学会
- 您正在处理什么类型的数据
- 您对哪些数据真正感兴趣
- 这些数据是否以任何方式准确或反映了现实生活中的事物
- 您可能需要开始收集哪些数据
提问和提取数据的练习将帮助您建模数据,这样当真正需要数据仓库的时候,您将对如何构建它有一个更好的掌握。
何时升级到数据仓库
最终,如果您有很多人使用您的应用程序,您将需要处理更多的数据。您将开始对生产数据库进行大量的大数据分析查询,并发现自己开始对着加载动画发呆。
即使在这种情况下,您也可以通过复制生产数据库并添加一些物化视图来简化数据查询。这样,您就可以分析数据,而不会因为长时间运行的查询而占用生产数据库。
然而,与此同时,您开始积累更多的工具来管理运营业务中涉及到的日常任务。这意味着更多的数据,您可能希望将它们存储在应用程序数据旁边,以建立一个单一的真实来源。这就是您开始考虑数据仓库的时候。