如何衡量平均恢复时间

了解平均恢复时间(MTTR),包括如何衡量它,以及如何在 Metabase 的仪表板和可视化中利用它。

什么是平均恢复时间?

平均恢复时间,简称 MTTR,是指从部分或完全故障中恢复的平均时间。该指标专门用于 DevOps,用于了解团队的稳定性和流程。MTTR 涵盖了从故障开始到结束的整个恢复过程,其中“结束”意味着服务已完全恢复运行。使用 MTTR 也是将您的恢复时间与竞争对手进行比较的好方法。虽然计算 MTTR 并不能完全解决故障发生时发生的所有问题,但它对于记录团队处理故障的速度以及整个恢复过程所需的时间非常有用。

开始使用
Graphs of Mean Time to Recovery

如何计算平均恢复时间

您需要知道在特定时间段内,例如一天、一周、一个月等的平均时间内,每次事件的总停机时间。然后,您需要计算该时间段内发生的总事件数。您将总分钟数除以指定时间段内发生的事件数。例如,如果您的服务在一周内总共停机了 2 小时(120 分钟),并且总共有 3 个单独的事件,您将用 120 除以 3。那么您的平均恢复时间将是 40 分钟。

与平均恢复时间相关的其他 KPI

  • 部署频率
  • 变更失败率
  • 停机时间
  • 正常运行时间
  • 在线应用程序性能
  • 平均检测时间
  • 变更交付周期
  • 错误率
  • 自动化测试通过率

为什么要为平均恢复时间构建仪表板?

Sales per source graph

一切尽在一处

通过将您最重要的指标汇集到单一视图中,让每个人都保持信息同步。

Sales per source graph

分享您的观点

将您的数据嵌入到内部维基、网站和内容中,让数据无处不在。

eCommerce orders filter

开启探索

赋能您的团队,让他们衡量自己的进展,并探索实现目标的新途径。

如何使用 Metabase 衡量平均恢复时间

Get started

第 1 步。
无需定制报价

没错,无需销售电话——只需注册,5 分钟内即可开始使用。

types of databases

第 2 步。
接入您的数据库

我们连接到最流行的生产数据库和数据仓库。

dashboard example

第 3 步。
构建您的 KPI 仪表板

邀请您的团队并开始构建仪表盘——无需 SQL。

开始使用 Metabase

  • 免费、无承诺试用
  • 人人都能轻松上手——无需 SQL
  • 5 分钟内即可启动并运行
© . This site is unofficial and not affiliated with Metabase, Inc.