元数据
什么是元数据?
元数据是描述数据的信息,使其更易于查找、操作和使用。
元数据示例
想想您计算机上的一个文件,例如数字图像或文本文档。在许多其他属性中,该文件具有名称、文件类型、扩展名、大小和时间戳,记录了其创建、上次打开和上次修改的时间。这些都是元数据——这些属性都不是文件本身,但它们确实告诉您有关该文件的重要信息。理解和跟踪这些元数据会告诉您和您的计算机如何对该文件进行排序和处理,例如指示您的计算机在打开该文件时使用什么软件。
元数据不仅存在于分析领域,而且几乎无处不在。它在从摄影到图书馆到广播电视等各行各业都很重要,因为任何处理或生成数据的组织都需要能够查找和组织数据。元数据有时是人类可读的(例如书名或数据库中的字段名称),但也可能是机器可读的,例如 XML 或 JSON 文件。
关系数据库和数据仓库中的元数据
在关系数据库中,元数据包括构成该数据库模式的所有信息,如下所示
- 表名
- 字段名
- 实体键
- 外键
- 数据类型
- 视图
- 完整性约束
但是,数据库元数据不仅仅是其模式。用户信息、业务定义、表和字段描述、数据库大小和存储信息也都是重要的元数据。根据数据库的配置方式,您可能会将一些元数据存储在数据库本身中(例如表名和字段名),或者存储在单独的文件或一组文件中,其中包含数据库的所有元数据。这被称为数据字典。
在数据仓库中,元数据就像索引或目录,定义了存储在该数据仓库中的所有对象,以及有关各种ETL作业的信息,这些作业操作数据,使其对需要它的人有用。
有关 ETL 的元数据可能包括作业的名称、其目的、运行时间和频率、作业使用的数据以及数据最终的去向。如果该作业使用大量有用的元数据进行了正确注释,那么您或同事就更容易理解该作业的具体作用和原因。
在 Metabase 中使用元数据
元数据在 Metabase 中扮演着重要角色!例如,指定列的字段类型(本身就是一种元数据形式)让 Metabase 了解该字段的实际含义,因此 Metabase 可以知道如何格式化该字段或显示哪种类型的可视化效果给您。
模型也使用元数据。在创建模型时使用描述注释列,可以大大帮助人们更好地理解您的数据。图 1 显示了当鼠标悬停在该模型中的列上时,这些描述是如何显示的

最后,您可以随时在 Metabase 的数据浏览器的数据参考部分中查看表元数据。图 2 显示了 示例数据库的 Products
表的外观。正如您所见,此视图提供了有用的信息,例如列名、描述、字段类型和数据类型
