数据类型和元数据

为什么数据类型很重要以及元数据如何帮助您更好地理解数据。

“数据类型”告诉您的数据库,它应该在每个列中期望什么样的数据。将数据类型视为字段的分类——每个字段只能有一种数据类型,并且该数据类型可能是一种数字、文本、布尔值或时间戳。

不同的数据库支持不同的数据类型集——本指南涵盖了一些最常见的数据类型。

数据类型示例

  • 字符串类型 (TEXT, CHAR, VCHAR 等) - 在技术世界中,文本片段被称为“字符串”。(您可能以前听说过“一串文本”。) 字符串除了字母外,还可以包含数字和特殊字符。这些字段存储姓名、地址或任何其他文本类型的数据。

  • 数值类型 (Integer, Float, DoubleFloat, Decimal 等) - 这些字段存储数字。整数是整数;浮点数和十进制数是存储带小数的数字的方式。数值类型存储年龄、银行账户余额、成本、纬度和经度等数据。

  • 时间类型 (Timestamp, Date, Time 等) - 这些字段是一种特殊的格式,用于存储日期和时间(或两者),称为“时间戳”。有时时间戳存储为整数,称为 Epoch UNIX 时间戳。

  • 布尔类型 - 这些字段中的值可以是两种选项之一,通常是 TRUEFALSE。并非所有数据库都支持布尔类型。

如果字段完全没有值,则可能返回 nullNull 并不意味着值是零,而是表示它未知且未列出。

在 Metabase 中,您可以通过导航到数据浏览器,选择表格旁边灰色的书籍图标以访问数据参考页面,然后单击左侧边栏中的此表格中的字段来查看字段的数据类型。每个字段的数据类型列在第三列中。

Viewing data types in Metabase.

关于 ID 的说明

您的数据库很可能有一个或多个 ID 字段,它们充当连接表的主键外键。虽然这些字段很重要,“ID”本身并不是一种数据类型。

例如,您的 PRODUCT_ID 字段可以是整数或字符串,因为它可能由数字或数字和字母的组合组成。

元数据

顾名思义,“元数据”是描述其他数据的数据。换句话说,它是告诉您数据库中数据的信息。例如,我们可以将看起来只是一堆数字的列标记为“纬度”,这将赋予该列额外的含义和上下文。

在 Metabase 中,管理员可以编辑字段的显示名称、描述和语义类型(也称为字段类型),以为用户提供关于每个字段用途的额外上下文,并指示 Metabase 如何解释不同的字段。

语义类型

虽然数据类型告诉您的数据库字段中预期什么类型的值,但语义类型指示字段的含义。您的数据库中可能有几个数据类型为type/text的字段,但并非所有文本字段都具有相同的含义或用途。语义类型对于建立表之间的关系至关重要。

在 Metabase 中,语义类型被称为字段类型,它们在告诉 Metabase 如何解释每个列方面发挥着重要作用。正确分类字段类型可以使 Metabase 确定要向您显示的图表类型,根据位置信息创建地图,或将 URL 显示为链接。

这有帮助吗?

感谢您的反馈!
分析师每周技巧
获取可行的见解
关于 AI 和数据的资讯,直接发送到您的收件箱
© . This site is unofficial and not affiliated with Metabase, Inc.