什么是数据仓库?
数据仓库是一种用于分析的数据库。它可以是标准的关联数据库,也可以是专门为分析设计的、依赖于列式存储的数据库。分析部分在你组织使用的任何 BI 工具中进行,但该 BI 工具必须从某个地方提取数据——这个“某个地方”就是你的数据仓库。
数据仓库通常存储来自多个源(如你组织使用的不同运营数据库)的信息,这些原始数据源通过 数据管道中的 ETL 进入你的数据仓库,通常由数据工程师构建。与 数据湖 不同,数据仓库中存储的信息是结构化的,因此当你用 BI 工具查询时,数据已经准备好进行分析。这些结构化(或转换)过程是发生在数据仓库内部(ELT)还是外部(ETL)取决于你的数据管道如何配置以及你正在使用的转换工具。