什么是数据仓库?
数据仓库是用于分析的数据库。这可以是一个标准的关联式数据库,也可以是专门为分析而设计的、依赖于列式存储的数据库。分析部分发生在您组织使用的任何 BI 工具中,但该 BI 工具必须从某个地方提取数据 — 那个“某个地方”就是您的数据仓库。
数据仓库通常存储来自多个来源的信息(例如您的组织使用的不同操作数据库),这些原始数据源通过数据管道中的 ETL(通常由数据工程师构建)进入您的数据仓库。与数据湖不同,您存储在数据仓库中的信息是结构化的,因此当您使用 BI 工具查询它时,它已准备好进行分析。这种结构化(或转换)过程是发生在数据仓库内部(ELT)还是外部(ETL)取决于您的管道配置以及您使用的转换工具。