数据科学项目管理与 CUA 因素

数据科学项目管理的难点

作为高级数据科学家，我的大部分工作是创建流程和环境，以实现顺畅的项目规划和执行。项目管理是一项重要的任务。我们尝试了不同的项目管理框架，但结果仍然不尽如人意。

直到我们研究了数据科学团队和项目的独特需求，我们才意识到大多数“已建立”的项目管理框架被用于制造、开发等领域，在这些领域我们可以假设任务具有合理的可见性。

然而，这种假设通常不适用于数据科学项目，这使得这些框架不适合我们面临的问题。

那么，数据科学项目管理有哪些独特的特点呢？

我认为高 CUA 因素（即 复杂性、不确定性 和 模糊性）是关键特征。

主要后果是项目规划效果不佳，因为我们没有设定目标和时间估计的良好参考，在某些情况下，我们甚至不知道解决方案是否真的存在（考虑到约束条件）。

因此，数据科学项目（特别是研究项目）依赖于提问、调查、反馈和迭代。这自然不适合“计划-执行”模式。相反，项目控制的关键在于“决策”。从计划到决策的重点转变使团队能够对其发现做出反应，这对研究项目至关重要。

应用数据科学项目管理框架

在改进决策的想法中，我们最喜欢的是 Heath 和 Heath (2013) 提出的 WRAP 模型。WRAP 代表拓宽你的选择 (Widen Your Options)、现实检验你的假设 (Reality-Test Your Assumptions)、在决定前保持距离 (Attain Distance Before Deciding) 和准备犯错 (Prepare to Be Wrong)。

我们实际上创建了一个以 WRAP 为指导原则的清单，然后在每个检查点，我们将运行该清单以做出决策，例如继续原始想法，更改假设/范围/方法等，或者如果我们发现继续不是最佳决策，则将其搁置或停止项目。

即使没有严格的项目规划作为控制，但通过建立可靠的决策流程，各个利益相关者都确信团队正在从事最佳任务，并且通常比制定最终毫无结果的项目计划更满意。

商业智能

嵌入式分析

文档

学习

数据科学项目管理的难点

那么，数据科学项目管理有哪些独特的特点呢？

应用数据科学项目管理框架