发现数据中的趋势
了解如何辨别嘈杂数据中的真正趋势。
趋势显示指标是在上升、下降还是保持平稳,但现实世界中的数据常常让趋势难以捉摸。
在下面的每个图表中,您能发现长期趋势吗?

在实际的仪表板中,模式并非总是显而易见的。每日数值会波动,每周总数可能会激增或骤降,甚至月度视图也可能包含不规则性。趋势可能会被噪声以及重复或季节性模式所掩盖。
本指南将引导您了解更清晰地查看趋势的各种方法
- 选择与数据相符的时间粒度:日、周或月。
- 使用移动平均值来平滑数据中的噪声,使趋势更加清晰。
- 添加趋势线,以便快速了解整体方向。
- 寻找重叠趋势,通过检查比率并将结果细分。
- 检查不完整周期,避免将缺失数据误认为是实际下降。
选择正确的时间粒度来组织您的数据
粒度是指时间轴上的详细程度:每小时、每天、每周、每月、每季度、每年,或者您的数据所支持的任何级别。以下是一个月销售数据的示例,显示了每天相当大的差异。

然而,如果我们看更长的时间,我们可以看到总体趋势是相当平坦的(下图顶部)。按周平均我们的销售额可以澄清平坦的趋势。

选择的时间粒度会改变您看到的内容。
- 更细的粒度(如每小时或每天):如果您关心短期效应,例如系统事件或营销活动启动,则非常有用。但更细的粒度也可能使小的日常波动模糊了更大的图景。在上面的图像所示的周视图中,周末、假期或缺失的条目会很显眼。
- 更粗的粒度(每周、每月、每季度):使总体趋势更容易看到,这对于跟踪更大目标的进展非常有用。权衡是,粒度会隐藏短期变化。
这里没有“正确”的答案。正确的粒度取决于您的数据(您是否有每小时或每天的值?)以及您的任务(您是在应对今天发生的事件,还是在回顾上个季度?)。
移动平均值通过平滑噪声来阐明趋势
即使在将数据聚合到更大的时间段(如周或月)后,指标在短期内仍可能出现波动,使趋势难以看清。移动平均值(或滑动平均值)可以在保持原始时间尺度的同时,平滑这些波动。

移动平均值还避免了新的一周或一个月开始时出现的剧烈跳跃,因为平均值是逐天向前滑动,而不是在日历边界重置。
它是如何工作的:移动平均值查看一个时间窗口(例如十天),计算该窗口内所有天的平均值,然后将这个十天的窗口向上滑动一天。时间窗口重叠,形成一个随着数据移动的滑动窗口。
调整窗口大小以适应数据
窗口的大小决定了您获得的平滑程度
- 要减少短期峰值,请使用短窗口(10天)。它们能快速响应变化,但仍会显示一些波动。
- 要阐明长期趋势,请使用长窗口(30-90天)。它们会平滑得多,但显示真实变化的速度较慢。
注意:移动窗口会产生滞后
移动平均值有助于揭示潜在的方向,但它们也会滞后于现实。如果情况突然发生变化,这种变化需要一段时间才能在移动平均值中显现。
趋势线对周期的长度很敏感
趋势线是拟合在数据上以显示总体斜率的一条线。大多数工具会为数据拟合一条直线(线性回归),但有些也提供曲线拟合来处理更复杂的模式。

趋势线很有用,因为它们为仍有短期波动的嘈杂数据增加了长期背景。与移动平均值类似,您可以一目了然地看到整体方向,而不会被每个峰值和低谷分心。
但是,趋势线对您选择的时间窗口很敏感。30天的趋势线可能向下倾斜,而同一指标在12个月内的趋势线可能向上倾斜。始终根据您正在做出的决定来匹配窗口,并检查更长期的视图以获得背景。
重叠趋势可能讲述不同的故事
有时一个数字本身看起来不错,但当与其他数据结合时,却讲述了一个不同的故事。例如,收入可能在上涨,但每单位的平均价格却在下跌。
示例:销售额与销量
假设总销售收入正在增长。仅凭这一点,看起来是积极的(下图中的线条)。但是,当您添加销售的单位(条形图)时,您会看到

这里的趋势是什么?收入增加了,但销量增加得更多。销售额的增长速度慢于销量,这意味着平均单位价格正在下降。增长来自于销售更多低价商品,而不是来自对高价商品更强的需求。
当我们绘制每周单位价格时,趋势就更加清晰了。

以原始价格来看,产品需求减弱是否是一个问题,取决于我们的目标。如果我们主要关注总销售额,这不成问题。但如果这意味着我们的业务正在向低端市场发展,我们可能需要考虑我们的销售和营销策略。
重叠趋势可能令人困惑
- 总数可能会隐藏细节。如果收入增加,您不知道是由于价格上涨、销量增加,还是两者兼而有之。
- 比率(例如,收入/客户、销售额/销量、潜在客户/访问者)显示一个指标如何与另一个指标相关,并揭示了驱动变化的原因。
- 细分(例如,按地区、产品线或客户群)可以显示一个领域的增长是否掩盖了另一个领域的下降。
在审查总数时,请始终问:“这个数字背后是什么?”寻找相关数据并检查比率,或者将数据分解为细分,以更好地了解完整的故事。
不完整数据:避免不完整的周期
另一个常见陷阱是将未完成的时间段视为已完成。图表可能显示您数据的下降趋势,但实际上该时段尚未完成。例如,您可能在12月10日查看您的月度数据,这意味着您错过了该月的2/3。您的图表可能看起来像这样。

这个例子显示了由于数据不完整而导致的明显下降,但在实际分析中,人们常常将不完整的时间段误认为是最近的下降趋势。为避免此陷阱,请筛选出最后一个不完整的时间段,或在图表中添加关于过分强调最后一个数据点的警告。