Databricks
要添加数据库连接,请点击右上角的齿轮图标,然后导航到管理设置 > 数据库 > 添加数据库。然后选择Databricks。
您可以随时编辑这些设置。请务必保存您的更改。
编辑连接详情
连接字符串
在此处粘贴连接字符串以预填充以下剩余字段。
显示名称
Metabase 界面中数据库的显示名称。
主机
数据库的 IP 地址或域名(例如 xxxxxxxxxx.cloud.databricks.com 或 adb-xxxxx.azuredatabricks.net)。这是 Databricks 计算资源的 Server Hostname 的值。
请参阅 Databricks JDBC 驱动程序的计算设置。
HTTP 路径
这是 Databricks 计算资源的 HTTP Path 值。此值通常是 SQL warehouse endpoint,格式为 /sql/1.0/endpoints/abcdef1234567890。请参阅 连接到 SQL warehouse。
另外,请参阅 Databricks JDBC 驱动程序的计算设置。
身份验证
有两种方法可以与 Databricks 进行身份验证。您可以使用个人访问令牌 (PAT) 或使用 OAuth (OAuth M2M) 的服务主体。
Databricks 驱动程序支持这两种选项。使用切换按钮选择您想使用的身份验证方法。
个人访问令牌身份验证
请参阅 个人访问令牌 (PAT)。
使用 OAuth (OAuth M2M) 的服务主体进行身份验证
请参阅 使用 OAuth 的服务主体进行身份验证。
启用多个 catalog
切换为开启以同步多个 catalog。如果启用此选项,您将能够 指定要同步的 catalog。
默认 catalog
必填。您必须指定一个默认 catalog(这样您就不必在原生查询中处理 catalog 限定符)。
您无法同步 Databricks 的旧版 catalog,包括 samples 或 hive_metastore catalog。
Catalog 和 schema
您可以指定要同步和扫描的 catalog 和 schema。选项包括:
- 所有
- 仅限这些…
- 除了这些…
对于仅这些和全部排除选项,您可以输入逗号分隔的值列表,以告知 Metabase 要包含(或排除)哪些 catalog 和 schema。例如:
foo,bar,baz
您可以使用 * 通配符来匹配多个 schema。
假设您有三个 schema:foo、bar 和 baz。
- 如果您设置了**仅这些…**,并输入字符串
b*,则会同步 bar 和 baz。 - 如果您设置了**除这些之外的所有…**,并输入字符串
b*,则只会同步 foo。
请注意,只支持 * 通配符;您不能使用其他特殊字符或正则表达式。
附加 JDBC 连接字符串选项
您可以将选项添加到 Metabase 用来连接到数据库的连接字符串中。例如 IgnoreTransactions=0。
请参阅 Databricks JDBC 驱动程序的计算设置。
重新运行简单探索的查询
如果用户希望在应用任何汇总或筛选器之前点击运行(播放按钮),请将此选项关闭。
默认情况下,Metabase 会在您从“汇总”菜单中选择一个分组选项,或从下钻菜单中选择一个筛选条件后立即执行查询。如果您的数据库速度较慢,您可能希望禁用重新运行,以避免每次单击时加载数据。
选择同步和扫描发生的时间
请参阅同步和扫描。
定期重新指纹识别表
定期重新指纹识别将增加数据库的负载。
将此选项打开,以便在 Metabase 每次运行同步时扫描值的样本。
指纹查询会检查每列的前 10,000 行,并使用该数据来估算每列的唯一值数量、数字和时间戳列的最小值和最大值等。如果将此选项设置为关闭,Metabase 将仅在设置过程中对您的列进行一次指纹识别。
模型功能
Databricks 目前(尚)没有可用的模型功能。
数据库路由
通过数据库路由,管理员可以使用一个数据库构建一次问题,然后根据查看问题的用户,该问题将在具有相同数据结构(schema)的不同数据库上运行查询。
当未启用多 catalog时,您可以在同一主机之间路由。如果启用了多 catalog,则只能在不同主机之间路由。
请参阅 数据库路由。
危险区
请参阅危险区。
延伸阅读
阅读其他版本的 Metabase 的文档。