什么是数据仓库?
**数据仓库**是用于分析的数据库。它可以是标准的关联式数据库,也可以是专门为分析而设计的、依赖于列式存储的数据库。分析部分在您的组织使用的任何 BI 工具中进行,但该 BI 工具必须从某个地方提取数据——这个“某个地方”就是您的数据仓库。
数据仓库通常存储来自多个源(例如您的组织使用的不同操作数据库)的信息,这些原始数据源通过数据管道中的 ETL 进入数据仓库,通常由数据工程师构建。与数据湖不同,您存储在数据仓库中的信息是结构化的,因此当您使用 BI 工具查询时,它已准备好进行分析。这种结构化(或转换)过程是发生在数据仓库内部(ELT)还是外部(ETL)取决于您的管道配置方式以及您使用的转换工具。