数据仓库
什么是数据仓库?
数据仓库是用于分析的数据库。这可以是标准的关系数据库,也可以是专门为分析而设计的数据库,依赖于列式存储。分析部分发生在贵组织使用的任何 BI 工具中,但 BI 工具必须从某处提取其数据——“某处”就是您的数据仓库。
数据仓库通常存储来自多个来源的信息(例如贵组织使用的不同操作数据库),这些原始数据源通过数据管道中的 ETL 进入您的数据仓库,通常由数据工程师构建。与数据湖不同,您存储在数据仓库中的信息是结构化的,因此当您使用 BI 工具查询时,它已准备好进行分析。这种结构化(或转换)过程是在数据仓库内部 (ELT) 还是外部 (ETL) 发生,取决于您的管道配置以及您使用的转换工具。