数据和商业智能词汇表术语

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
V
W
X

什么是元数据?

元数据是描述数据的信息,旨在让数据更容易查找、操作和使用。

元数据示例

想象一下您计算机上的一个文件,比如一张数字图片或文本文档。除了许多其他属性外,该文件还有名称、文件类型、扩展名、大小以及记录创建、上次打开和上次修改时间的时间戳。这些都是元数据——这些属性本身都不是文件本身,但它们确实告诉您关于该文件的一些重要信息。理解并跟踪这些元数据可以告诉您和您的计算机该文件应如何排序和处理,例如指示您的计算机在打开该文件时应使用什么软件。

元数据存在于分析领域之外,几乎无处不在。它在各种行业中都很重要,从摄影到图书馆再到广播电视,因为任何处理或生成数据的组织都需要能够查找和组织数据。元数据有时是人类可读的(例如书名或数据库中的字段名),但也可以是机器可读的,例如XML或JSON文件。

关系数据库和数据仓库中的元数据

在关系数据库中,元数据包括构成该数据库模式的所有信息,如下所示:

  • 表名
  • 字段名
  • 实体键
  • 外键
  • 数据类型
  • 视图
  • 完整性约束

然而,数据库元数据不仅仅是其模式。用户信息、业务定义、表和字段描述、数据库大小和存储信息也都是重要的元数据。根据您的数据库配置方式,您可能会将一些元数据存储在数据库本身中(例如表名和字段名),或者存储在包含数据库所有元数据的单独文件或一组文件中。这被称为数据字典

数据仓库中,元数据就像索引或目录一样,定义了存储在该数据仓库中的所有对象,以及有关操作数据以使其对需要者有用的各种ETL作业的信息。

关于ETL的元数据可能包括作业名称、目的、运行时间和频率、作业使用的数据以及数据最终存储位置。如果该作业用足够多的有用元数据进行了正确标注,那么您或同事就更容易准确理解该作业的功能和原因。

在Metabase中使用元数据

元数据在Metabase中扮演着重要角色!例如,指定列的字段类型(本身就是一种元数据形式)可以让Metabase了解该字段的实际含义,从而Metabase知道如何格式化该字段或向您显示哪种可视化。

模型也利用元数据。在创建模型时用描述来标注列,对于帮助人们更好地理解您的数据大有裨益。图1展示了在模型中将鼠标悬停在列上时这些描述的显示方式。

<em>Fig. 1</em>. Viewing the <strong>Products</strong> table's metadata in the data reference section.
图1. 在数据参考部分查看产品表的元数据。

最后,您始终可以在Metabase数据浏览器数据参考部分查看表元数据。图2展示了示例数据库Products表的显示方式。如您所见,此视图提供了有用的信息,例如列名、描述、字段类型和数据类型。

<em>Fig. 2</em>. Viewing the <strong>Products</strong> table's metadata in the data reference section.
图2. 在数据参考部分查看产品表的元数据。

相关术语

拓展阅读

© . All rights reserved.