数据科学项目管理困难
作为高级数据科学家,我的工作很大一部分是创建流程和环境,以便于项目规划和执行顺利进行。项目管理是一个非平凡的任务。我们尝试了不同的项目管理框架,但结果仍然不尽如人意。
直到我们深入了解数据科学团队和项目的独特需求,我们才意识到大多数“既定”的项目管理框架都应用于制造业、开发等领域,在这些领域我们可以假设任务具有合理的可见性。
然而,这种假设通常不适用于数据科学项目,这使得框架不适合我们面临的问题。
那么数据科学项目管理有哪些独特特征呢?
我认为高 CUA 因素(即 Complexity,复杂性;Uncertainty,不确定性;Ambiguity,模糊性)是关键特征。
主要后果是项目规划不太顺利,因为我们没有好的目标设定和时间估算的参考,在某些情况下,我们甚至不知道解决方案是否真的存在(给定约束条件)。
因此,数据科学项目(尤其是研究项目)依赖于提问、调查、反馈和迭代。这并不自然地符合“计划-执行”范式。相反,项目控制的关键在于“决策”。从规划到决策的转变使团队能够对其发现做出反应,这对于研究项目至关重要。
应用数据科学项目管理框架
在众多提高决策能力的方案中,我们最喜欢的就是Heath和Heath(2013年)提出的WRAP模型。WRAP代表的是:拓宽你的选项、检验你的假设、在决策前保持距离,以及准备好接受错误。
实际上,我们已经创建了一个清单,以WRAP作为指导原则,然后在每个检查点,我们将运行清单以做出决策,例如继续原始想法、更改假设/范围/方法论等,或者如果发现继续不是最佳决策,则将其搁置或停止项目。
在建立了稳健的决策流程后,即使没有严格的项目规划作为控制,各种利益相关者也相信团队正在执行最佳任务,通常比有计划但无法达成的项目规划更满意。