BI 层和现代数据堆栈
作为 Data Culture 的数据主管以及 dbt Nigeria 聚会的组织者,我一直在为尼日利亚数据生态系统的人们提供有关现代数据堆栈的知识。我经常强调,现代数据堆栈不仅仅是一个在数据领域迅速发展的新流行语。它是解决组织在实现数据驱动过程中面临的许多挑战的方案。
现代数据堆栈主要是一个工具套件,旨在促进数据集成。
现代数据堆栈的优势在于它如何赋能数据专业人员——数据分析师、数据科学家、数据工程师,甚至是非技术用户,使他们能够分析业务数据并主动获取影响业务的见解。
设置 BI 分析软件
在设置现代数据堆栈时,最重要的部分之一是商业智能 (BI) 层。它为组织用于决策的重要业务指标提供可见性。
市面上有许多不同的 BI 工具。然而,随着数据格局的当前转变被大规模并行处理 (MPP) 数据仓库和基于 SQL 通用语言构建的列式数据存储所颠覆,选择一款完美契合这种范式转变的 BI 工具非常重要。
将 Metabase 设置为 BI 和数据可视化工具的 6 个步骤
设置任何数据堆栈通常需要规划和理解业务需求。在构建数据堆栈时,我采用了以下最佳实践
- 将 Metabase 连接到数据仓库中转换后的非规范化数据,这使得最终用户可以轻松查询;
- 在数据仓库中创建一个单独的数据模型,并将其暴露给 Metabase。第一个数据模型为所有仪表板提供支持并跟踪重要的业务指标。另一个数据模型是组织中不同部门所需的转换后的非规范化数据源;
- 通过基于部门(财务、增长、产品等)创建不同的集合和组来强制执行权限,并适当地授予对各个组的访问权限;
- 利用 Metabase 过滤器小部件 和 日期过滤器 为利益相关者创建交互式仪表板,以便进行切片和切块;
- 将不同的问题分组到类别中,以便于编目和供以后使用;
- 通过为自助式分析目的进行基本的 Metabase 演练,来赋能那些使用仪表板的人。