数据字典
什么是数据字典?
数据字典 是一份文档,描述了数据库中的表、字段和其他元素,并解释了它们的含义和来源。数据字典是数据库 元数据 的存储库,存储了人们理解和使用这些数据所需的管理信息。可以将其视为典型的字典,但数据字典包含的不是语言中的每个单词,而是构成数据库的对象的定义和信息。
一份最新且全面的数据字典有助于确保每个人都对特定字段或表在实践中的含义保持一致的理解。数据字典还可以帮助确保不同的部门都一致地使用这些术语。
数据字典通常是与它们描述的数据库一起存储的单独文件或文件集。虽然数据库数据字典的某些方面可能对所有数据库用户都可访问(例如每个人都需要知道的重要描述),但其他部分可能只能由数据库管理员查看(例如有关数据库物理实现的技术细节)。
Metabase 中的数据字典
在 Metabase 中,数据参考 部分充当数据字典。
数据字典中包含什么?
数据字典收集和存储与数据库关联的元数据,通常是以下信息:
- 表和字段描述
- 数据类型
- 完整性约束
- 命名约定
- 文件位置
虽然数据字典的确切格式将取决于您的组织和数据集的复杂性,但数据字典通常格式化为表格或一系列表格,其中包含诸如字段名称、描述、数据类型、字符长度以及是否允许空值等元数据字段。您可以使用简单的电子表格、关系数据库 软件甚至文本文件来创建数据目录。
数据字典 vs. 模式 vs. 数据目录
数据库的模式在这里有一些重叠,但总的来说,模式定义了数据库的结构以及表及其字段如何组合在一起,而数据字典则提供了有关该数据的上下文信息。
您可能也听说过数据目录,这是另一个类似的概念。一些组织利用数据目录来更好地促进其数据的发现和分析;它们就像数据字典,具有一些附加功能,比传统的基于文档的数据字典更进一步。