什么是分箱?
也称为
分箱
分桶
**分箱**是用于在图表中对值进行分组的单个连续值范围。对数据进行分箱有助于简化数据可视化,从而让人们了解数据的分布并轻松发现异常值。您最常在直方图中看到分箱的应用,但它们并非直方图独有,也可用于其他可视化,例如折线图或饼图。
如果数据集中的度量包含大量唯一值,在图表上绘制每个独立数据点可能会显得杂乱,并且可能无法最佳地表示您的数据。对数据进行分箱时,这些值将分组到大小相等的区间(例如1-10、11-20、21-30等),您生成的图表将显示每个分箱中的值计数。
数据分箱示例
图1显示了Metabase示例数据库中产品的价格,以直方图形式显示。

此处的分箱是价格范围;我们可以看到在$37.50–50.00价格范围内的产品数量多于其他任何范围。
Metabase自动对这些值进行了分箱,但我们也可以选择所需的分箱数量(10、50或100)来进一步调整此图表。如果分箱大小太小,分箱数量会过多,可能会导致难以解释的可视化效果。然而,如果分箱数量太少,则会给出数据分布的不完整或过度压缩的视图,因此请多尝试,找出最适合您数据的方法。