Databricks
要添加数据库连接,请点击右上角的**齿轮**图标,然后导航到**管理设置** > **数据库** > **添加数据库**。然后选择 **Databricks**。
您可以随时编辑这些设置。请务必保存您的更改。
编辑连接详情
连接字符串
在此处粘贴连接字符串以预填充以下剩余字段。
显示名称
Metabase 界面中数据库的显示名称。
主机
您的数据库的 IP 地址或其域名(例如,xxxxxxxxxx.cloud.databricks.com
或 adb-xxxxx.azuredatabricks.net
)。这是您的 Databricks 计算资源的服务器主机名值。
请参阅 Databricks JDBC 驱动程序的计算设置。
HTTP 路径
这是 Databricks 计算资源的 HTTP 路径值。此值通常是 SQL 仓库端点,格式为 /sql/1.0/endpoints/abcdef1234567890
。请参阅 连接到 SQL 仓库。
此外,请参阅 Databricks JDBC 驱动程序的计算设置。
身份验证
有两种方式通过 Databricks 进行身份验证。您可以使用个人访问令牌 (PAT) 或使用 OAuth(OAuth M2M)的服务主体。
Databricks 驱动程序支持这两种选项。使用开关选择您要使用的身份验证方法。
个人访问令牌身份验证
请参阅 个人访问令牌 (PAT)。
使用 OAuth(OAuth M2M)的服务主体进行身份验证
请参阅 使用 OAuth 的服务主体进行身份验证。
启用多个目录
打开此开关以同步多个目录。如果启用此选项,您将能够指定要同步的目录。
默认目录
必填。您必须指定一个默认目录(这样您就不必在原生查询中处理目录限定)。
但是,您无法同步 Databricks 的旧版目录,包括 samples
或 hive_metastore
目录。
目录和模式
您可以指定要同步和扫描的目录和模式。选项为
- 所有
- 仅限这些…
- 除了这些…
对于**仅这些**和**除了**选项,您可以输入一个逗号分隔的值列表,以告诉 Metabase 您要包含(或排除)哪些目录和模式。例如
foo,bar,baz
您可以使用 *
通配符来匹配多个 schema。
假设您有三个 schema:foo、bar 和 baz。
- 如果您设置了**仅这些…**,并输入字符串
b*
,则会同步 bar 和 baz。 - 如果您设置了**除这些之外的所有…**,并输入字符串
b*
,则只会同步 foo。
请注意,只支持 *
通配符;您不能使用其他特殊字符或正则表达式。
附加 JDBC 连接字符串选项
您可以向 Metabase 用于连接到数据库的连接字符串追加选项。例如,IgnoreTransactions=0
。
请参阅 Databricks JDBC 驱动程序的计算设置。
重新运行简单探索的查询
如果用户希望在应用查询构建器中的任何汇总或筛选器之前点击**运行**(播放按钮),请将此选项**关闭**。
默认情况下,Metabase 会在您从**汇总**菜单中选择分组选项或从钻取菜单中选择筛选条件后立即执行查询。如果您的数据库速度较慢,您可能希望禁用重新运行,以避免每次点击都加载数据。
选择同步和扫描发生的时间
请参阅同步和扫描。
定期重新指纹识别表
定期重新指纹识别将增加数据库的负载。
将此选项打开,以便在 Metabase 每次运行同步时扫描值的样本。
指纹查询会检查每列的前 10,000 行,并利用这些数据估算每列的唯一值数量、数字和时间戳列的最小值和最大值等。如果您将此选项**关闭**,Metabase 将只在设置过程中对您的列进行一次指纹识别。
模型功能
Databricks 尚无(目前)可用的模型功能。
数据库路由
通过数据库路由,管理员可以使用一个数据库构建一次问题,然后根据查看问题的用户,该问题将在具有相同数据结构(schema)的不同数据库上运行查询。
当**未启用多目录**时,您可以在同一主机上的目录之间进行路由。如果启用了多目录,则只能在不同主机上的数据库之间进行路由。
请参阅 数据库路由。
危险区
请参阅危险区。
延伸阅读
阅读其他版本的 Metabase 的文档。