数据科学项目管理的难点
作为高级数据科学家,我的大部分工作是创建流程和环境,以实现顺畅的项目规划和执行。项目管理是一项重要的任务。我们尝试了不同的项目管理框架,但结果仍然不尽如人意。
直到我们研究了数据科学团队和项目的独特需求,我们才意识到大多数“已建立”的项目管理框架被用于制造、开发等领域,在这些领域我们可以假设任务具有合理的可见性。
然而,这种假设通常不适用于数据科学项目,这使得这些框架不适合我们面临的问题。
那么,数据科学项目管理有哪些独特的特点呢?
我认为高 CUA 因素(即 复杂性、不确定性 和 模糊性)是关键特征。
主要后果是项目规划效果不佳,因为我们没有设定目标和时间估计的良好参考,在某些情况下,我们甚至不知道解决方案是否真的存在(考虑到约束条件)。
因此,数据科学项目(特别是研究项目)依赖于提问、调查、反馈和迭代。这自然不适合“计划-执行”模式。相反,项目控制的关键在于“决策”。从计划到决策的重点转变使团队能够对其发现做出反应,这对研究项目至关重要。
应用数据科学项目管理框架
在改进决策的想法中,我们最喜欢的是 Heath 和 Heath (2013) 提出的 WRAP 模型。WRAP 代表拓宽你的选择 (Widen Your Options)、现实检验你的假设 (Reality-Test Your Assumptions)、在决定前保持距离 (Attain Distance Before Deciding) 和准备犯错 (Prepare to Be Wrong)。
我们实际上创建了一个以 WRAP 为指导原则的清单,然后在每个检查点,我们将运行该清单以做出决策,例如继续原始想法,更改假设/范围/方法等,或者如果我们发现继续不是最佳决策,则将其搁置或停止项目。
即使没有严格的项目规划作为控制,但通过建立可靠的决策流程,各个利益相关者都确信团队正在从事最佳任务,并且通常比制定最终毫无结果的项目计划更满意。