数据仓库
什么是数据仓库?
数据仓库是一个用于分析的数据库。这可能是一个标准的关联数据库,或者一个专门为分析设计的数据库,它依赖于列式存储。分析部分发生在您的组织使用的任何BI工具中,但该BI工具必须从某个地方获取其数据——那个“某个地方”就是您的数据仓库。
数据仓库通常存储来自多个来源的信息(例如,您组织使用的不同操作数据库),这些原始数据源通过数据管道中的ETL过程进入您的数据仓库,通常由数据工程师构建。与数据湖不同,您存储在数据仓库中的信息是有结构的,因此当您使用BI工具查询时,它已经准备好进行分析。这种结构化(或转换)过程是在数据仓库内部(ELT)还是外部(ETL)进行,取决于您管道的配置以及您使用的转换工具。