Databricks
要添加数据库连接,请单击右上角的齿轮图标,然后导航至管理设置 > 数据库 > 添加数据库。然后选择 Databricks。
您可以随时编辑这些设置。请记住保存您的更改。
显示名称
数据库在 Metabase 界面中显示的名称。
主机
您数据库的 IP 地址或域名 (例如,xxxxxxxxxx.cloud.databricks.com
或 adb-xxxxx.azuredatabricks.net
)。这是您的 Databricks 计算资源的服务器主机名的值。
HTTP 路径
这是 Databricks 计算资源的 HTTP 路径值。此值通常是 SQL 仓库端点,格式为 /sql/1.0/endpoints/abcdef1234567890
。请参阅连接到 SQL 仓库。
此外,请参阅Databricks JDBC 驱动程序的计算设置。
身份验证
有两种方法可以对 Databricks 进行身份验证。您可以使用个人访问令牌 (PAT) 或使用 OAuth (OAuth M2M) 的服务主体。
Databricks 驱动程序同时支持这两种选项。使用切换按钮选择您要使用的身份验证方法。
个人访问令牌身份验证
请参阅个人访问令牌 (PAT)。
使用 OAuth(OAuth M2M)通过服务主体验证访问权限
目录
目前,您只能选择一个目录。Metabase 不支持多目录连接。如果您想在 Metabase 中使用多个目录,您可以设置多个连接,每个连接选择不同的目录。
但是,您无法同步 Databricks 的旧目录,包括 samples
或 hive_metastore
目录。
模式
您可以指定要同步和扫描的模式。选项包括
- 全部
- 仅限这些…
- 除这些之外的所有…
对于仅限这些和除这些之外的所有选项,您可以输入逗号分隔的值列表,以告知 Metabase 您要包含(或排除)的模式。例如
foo,bar,baz
您可以使用 *
通配符来匹配多个模式。
假设您有三个模式:foo、bar 和 baz。
- 如果您设置了仅限这些…,并输入字符串
b*
,您将与 bar 和 baz 同步。 - 如果您设置了除这些之外的所有…,并输入字符串
b*
,您将仅同步 foo。
请注意,仅支持 *
通配符;您不能使用其他特殊字符或正则表达式。
其他 JDBC 连接字符串选项
您可以将选项附加到 Metabase 用于连接到数据库的连接字符串。例如:IgnoreTransactions=0
。
重新运行简单探索的查询
如果人们希望在查询构建器中应用任何汇总或过滤器之前单击运行(播放按钮),请将此选项设置为关闭。
默认情况下,当您从汇总菜单中选择分组选项或从下钻菜单中选择过滤器条件时,Metabase 将立即执行查询。如果您的数据库速度较慢,您可能需要禁用重新运行以避免每次单击都加载数据。
选择 Metabase 同步和扫描的时间
将此选项设置为开启以管理 Metabase 用于与数据库保持同步的查询。有关更多信息,请参阅同步和扫描数据库。
数据库同步
如果您选择了选择同步和扫描发生的时间 > 开启,您将能够设置
- 同步的频率:每小时(默认)或每天。
- 运行同步的时间,以运行 Metabase 应用程序的服务器的时区为准。
扫描过滤器值
Metabase 可以扫描此数据库中每个字段中存在的值,以在仪表盘和问题中启用复选框过滤器。这可能是一个资源密集型的过程,特别是当您拥有非常大的数据库时。
如果您选择了选择同步和扫描发生的时间 > 开启,您将在扫描过滤器值下看到以下选项
- 定期,按计划允许您以与数据库更改率匹配的频率运行扫描查询。时间以运行 Metabase 应用程序的服务器的时区设置为准。对于小型数据库或经常更新的不同值表,这是最佳选择。
- 如果您希望按需运行扫描查询,仅在添加新的过滤器小组件时是一个不错的选择。将此选项设置为开启意味着 Metabase 将仅扫描和缓存在向仪表盘或 SQL 问题添加新过滤器时使用的字段值。
- 从不,如果需要,我会手动执行此操作是用于数据库非常大或从未真正添加新值的数据库的选项。使用立即重新扫描字段值按钮运行手动扫描并将过滤器值更新为最新。
定期重新指纹识别表
定期重新指纹识别将增加数据库的负载。
将此选项设置为开启,以便在 Metabase 每次运行同步时扫描值样本。
指纹识别查询会检查每列的前 10,000 行,并使用该数据来猜测每列有多少个唯一值,数字列和时间戳列的最小值和最大值是多少等等。如果您将此选项设置为关闭,Metabase 将仅在设置期间对您的列进行一次指纹识别。
延伸阅读
阅读其他Metabase 版本的文档。