数据和商业智能术语表

A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
V
W
X

数据模型

什么是数据模型?

术语“数据模型”用于描述任何组织和标签信息的模式。人们将“数据模型”用作通用的方式来指代诸如模式派生表(视图)ERD等概念。

一个好的数据模型有助于人们更快地找到所需信息。例如,商场目录是一个组织商场中商店信息的模型。它按类别或位置对商店进行分组和标签化,并通过地图显示它们之间的关系。这种模型使人们更容易找到要去的地方,比独自在商场里乱逛或阅读随机的商店名单要容易得多。

数据建模示例

在数据建模过程中进行决策时,最好是首先弄清楚人们想要寻找什么,以及为什么。比如说,我们想创建一个用于存储电影信息的模型,以帮助人们寻找观看新事物。

您可以将此数据模型视为一个模板,可用于填充任何电影的信息。该模板应完成以下两项任务:

  1. 代表有助于查找特定电影的电影组成部分。例如,人们可能会通过标题、导演、类型或演员来搜索他们想观看的电影。

  2. 描述各部分之间的关系,以便根据另一组信息轻松查找一组信息。例如,模板应确保任何电影标题都至少与一位导演相关联。

最简单类型的数据模型将相关部分组合到一个模板中,并包含一些有关如何填写的信息。例如,以下模板可以用作任何电影的数据模型。

电影

  • 标题:任何文本(必填)。
  • 导演:名称列表(必填)。
  • 类型:任何文本(可选)。
  • 演员:名称列表(可选)。

可以通过添加更多与电影相关的部分(例如上映年份运行时间)来扩展此模型。我们还可以根据查找信息的有用性扩展现有部分。例如,人们可能希望通过演员的具体信息来搜索电影,例如他们所获得的任何表演奖项。由于演员只跟踪演员名称,我们可以将奖项信息拆分到新的数据模型中。

表演奖项

  • 奖项:表演奖项名称(必填)。
  • 获奖年份:年份(必填)。
  • 演员:姓名(可选)。

由于演员名称在两个模型中(或者在演员下,或者在演员下)出现,因此存在连接电影模型和表演奖项模型的关系。当两个模板都填写了真实的电影和奖项信息时,人们将能够通过特定奖项查找电影。

上述书面模板是思考分解信息以构建数据模型的基本方法,但根据用例,您还可以遵循许多最佳实践。您可以在下一节中找到常见数据模型格式的示例。

常见数据模型

模式

模式是一种概念性数据模型。数据库工作人员使用它。

  1. 信息通过命名的数据类型来表示。
  2. 关系通过诸如JSON对象的结构来描述。

ERD

ERD是一种视觉数据模型。信息管理者和架构师使用ERD。

  1. 信息通过不同的形状表示,例如矩形或菱形。
  2. 关系通过不同的线条描述,例如箭头或虚线。

元数据模型

一个元数据模型是一个可以创建并从问题或SQL查询保存的数据模型。

  1. 信息通过命名的列和任何相关的元数据表示。
  2. 关系通过问题或SQL查询中使用的逻辑来描述。

人们实际上是如何使用数据模型这个术语的

您可能会发现不同的团队不正式地将“数据模型”一词用于表示不同的事物

  • 编写SQL的人可能会用它来指派派生表或视图。
  • 程序员可能会用它来指派模式或ERD。

Metabase中的数据模型

如果您是Metabase管理员,您将能够访问Metabase中的数据模型页面。您在这里所做的更改将影响Metabase中数据的外观。

数据模型页面与Metabase模型之间的区别是什么?

  • 数据模型位于连接到Metabase的原始数据仓库表之上。它是您组织可以使用的建模层,用于清理组织可见的表格。您可以将它视为一种在数据世界和业务世界之间“翻译”信息的方式,通过分配可读性强的名称并保存指标的常见定义。

  • Metabase模型位于数据模型之上。任何有权使用底层数据库表的权限的人都可以创建它们。

相关术语

进一步阅读