什么是数据字典?
数据字典是一份描述数据库中的表、字段和其他元素,并解释其含义和来源的文档。数据字典是数据库元数据的存储库,其中存储了人们理解和使用这些数据所需的管理信息。可以将其想象成一本普通字典,但数据字典中包含的是关于构成数据库的对象(而不是语言中的每个单词)的定义。
一个最新且全面的数据字典有助于确保每个人对特定字段或表的实际含义保持一致的理解。数据字典还可以帮助确保不同部门在使用这些术语时保持一致。
数据字典通常是与它们描述的数据库一起存储的单独文件或文件集。虽然您数据库数据字典的某些方面(例如每个人都需要知道的重要描述)可能对所有数据库用户都可用,但其他部分可能只能由数据库管理员查看(例如关于数据库物理实现的详细技术信息)。
Metabase 中的数据字典
在 Metabase 中,数据参考部分充当数据字典。
数据字典包含什么?
数据字典收集并存储与数据库相关的元数据,通常包括以下信息:
- 表和字段描述
- 数据类型
- 完整性约束
- 命名约定
- 文件位置
虽然数据字典的确切格式将取决于您的组织和数据集的复杂性,但数据字典通常会格式化为表格或一系列表格,其中包含元数据字段,如字段名称、描述、数据类型、字符长度以及是否允许空值。您可以使用简单的电子表格、在关系数据库软件中,甚至作为文本文档来创建数据目录。
数据字典 vs. 模式 vs. 数据目录
这里与数据库的模式(schema)有一些重叠,但总的来说,模式定义了数据库的结构以及表及其字段如何组合在一起,而数据字典则提供了关于该数据的上下文信息。
您可能也听说过数据目录(data catalog),这是另一个类似的概念。一些组织使用数据目录来更好地促进其数据的发现和分析;它们就像带有附加功能和特性的数据字典,比传统的基于文档的数据字典更进一步。