2023 年 5 月 18 日在 分析与商业智能

3 分钟阅读

你不需要数据仓库

The Metabase Team Portrait
Metabase 团队
‧ 2023 年 5 月 18 日在 分析与商业智能

‧ 3 分钟阅读

You don't need a data warehouse Image
分享这篇文章

你不需要数据仓库就能开始从你的数据中获得洞见。事实上,一开始就使用数据仓库是个坏主意。

不要误解我们:数据仓库很棒。我们是忠实粉丝。但我们更推崇现在就行动,而不是等待完美的情况。因为有数据总比没数据好。即使你的数据不完美或不全面,任何数据都可能比完全没有数据更能为你指明方向。

我们有一篇关于 你应该使用哪个数据仓库 的文章,详细介绍了如何在你组织发展壮大时考虑数据仓库,但本文的重点是强调一项公共服务公告:马上开始查询你的生产数据库。

尽快开始查询你的生产数据库

我们假设你是一家初创公司,并且你已经构建了一些软件或程序,这些软件使用数据库来跟踪其操作。大概在这个阶段你看到了一些增长,人们开始使用你的应用或服务,并且你想更好地了解事情的实际进展情况。

在你投资专用数据仓库之前,先选择一个商业智能工具——最好是免费或低成本的——它可以让你查询和可视化你的数据,并将其连接到你的生产数据库。

这是另一种说法,即

建模数据仓库的最佳方式是在实际应用中进行原型设计

设置数据仓库需要大量工作。我们看到的情况是,过快投入数据仓库的公司发现,他们建模数据的方式无法解决他们想要回答的各种问题。这意味着他们只是推迟了原型设计阶段,并使该阶段的成本更高。

你可以使用像 Metabase 或 Superset 这样的工具,甚至像 Microsoft Excel、Google Sheets 或 LibreOffice Calc 这样的电子表格软件来原型化数据建模。通过以这种简陋的方式处理应用程序中存在的数据,你将了解:

  • 你正在处理哪种数据
  • 你实际对哪些数据感兴趣
  • 这些数据在任何方面是否准确或反映了现实生活中的事物
  • 你可能应该开始收集哪些数据

提出问题和提取数据的练习将帮助你建模你的数据,以便在真正需要数据仓库时,你能够更好地掌握如何构建它。

何时升级到数据仓库

最终,如果你有很多人使用你的应用程序,你将有更多数据需要筛选。你将开始对你的生产数据库运行许多大型分析查询,并且你会发现自己茫然地盯着加载动画。

即使那样,你也可以通过复制你的生产数据库并添加一些物化视图来使数据更易于查询。这样,你就可以分析你的数据,而不会让你的生产数据库被长时间运行的分析查询占用。

与此同时,你开始积累更多工具来管理运营业务所涉及的日常任务。这意味着更多的数据,你可能希望将这些数据与你的应用程序数据一起存储,以建立单一的事实来源。而那时你才应该开始考虑 数据仓库

您可能也喜欢

所有文章
地图数据可视化:最佳实践 图片 2024 年 12 月 19 日在 分析与商业智能

地图数据可视化:最佳实践

学习如何创建有影响力的地图数据可视化,其中包含使用点地图、网格地图和区域地图突出显示模式并做出数据驱动决策的技巧。

Alex Yarosh Portrait
Alex Yarosh

6 分钟阅读

如何可视化时间序列数据:最佳实践 图片 2024 年 11 月 20 日在 分析与商业智能

如何可视化时间序列数据:最佳实践

了解关于时间序列数据以及如何可视化它。包含最佳实践和一个方便的备忘单。

Alex Yarosh Portrait
Alex Yarosh

3 分钟阅读

所有文章
Close Form Button

订阅我们的新闻通讯

随时了解 Metabase 的更新和新闻。绝不发送垃圾邮件。