决策科学是企业数据科学中最有趣的领域之一,但它需要成为组织所构建的数据科学生态系统的一部分。
数字化转型的共同目标之一通常被描述为“成为一家数据驱动型公司”。无论是商业智能、预测分析还是机器学习,使用客观数据而不是直觉来驱动决策都是企业越来越多谈论的话题。
挑战很多。并不是所有的大型组织都足够灵活地充分利用数据驱动的决策,或者足够熟练地大规模收集可靠数据并提出正确的问题。在年度NewVantage Partners大数据研究中,大多数高管都希望通过数据做出更好的决策,但只有三分之一的高管认为他们的公司拥有数据驱动的文化。
数据并不能解决所有问题。你的数据可能不会告诉你一个成功的产品可能会更好,因为数据会表明它已经成功了。
做出数据驱动的决策就是提出正确的问题,并拥有正确的数据来获得答案。下面你将全面了解所谓“决策科学”(或“决策智能”)。
Google决策智能负责人Cassie Kozyrkov将决策科学描述为:将以前孤立的学科中的工具和观点结合起来,并将其应用于选项之间进行选择的各个方面,以减少基于事实,做出更高质量决策所需的行动。她写道:“它将应用数据科学、社会科学和管理科学的精华整合到一个统一的领域,来帮助人们使用数据改善生活、业务以及周围的世界。”
这与行为经济学(behavior economics)和计算机科学(computer science)与经济学(economics)的交叉领域EconCS有相似之处,前者是预测市场行为并使用激励机制来改变市场,后者是Microsoft用来设计Bing广告拍卖、Azure云定价和Xbox游戏营销的。
但是决策科学并没有那么广泛的关注点;它是通过预测决策的结果,用数据和算法来解决特定的业务问题。
预测决策结果的这一方面是决策科学和数据科学之间的一个关键区别。
Microsoft高级首席研究员Greg Lewis解释说:“决策科学是将理论和数据结合起来,预测个人或组织做出改变环境的决策后会发生什么。”它是帮助决策者找到正确选择的水晶球。
Lewis说,另一方面,数据科学是预测如果你不采取任何措施来改变系统,接下来会发生什么。“例如,数据科学可能被用来计算出,以目前的速度,一家商店的存货即将耗尽;但是决策科学将有助于决定是购买更多的存货并保持价格不变,还是提高价格以使目前的存货充足。”
尽管如此,LinkedIn数据科学总监Chi-Yi Kuan指出,决策科学仍然是数据科学的一部分,直到最近他还是公司的决策科学解决方案团队的负责人。他将其概括为“定量分析和用于指导和推动决策的技术”。
“在数据科学领域,我们做了很多工作来理解发生了什么,历史是什么——这就是描述性分析。然后,诊断分析进行深入研究,以了解为什么会发生这种情况。当我们变得更先进时,我们就可以做预测分析:未来会发生什么?在流行术语中,我们称之为人工智能和机器学习的都是关于预测和预测的:规定性分析是关于什么是最好的选择。
数据科学是要从原始数据转变为有意义的数据洞察;决策科学应用于为决策者提供的建议。“数据科学的工作是在生态系统中做出更好的决策,帮助公司成长。在决策科学中,重点只放在决策上,”他说。
决策科学的原则应该为管理人员所熟悉,因为它们已经被用于运营领域。但是从领域专家那里获得业务见解,这些专家根据他们的经验(和有限的数据量)提供建议,速度太慢,成本太高,无法用于每一个决策。Kuan表示,决策科学使利用实时数据的能力民主化。“我们想让它具有可扩展性。我们希望公司的每个人都能做出数据驱动的决策:这不仅仅是高管的事,而且是一个巨大的改变。”
这意味着不仅仅是拥有一个数据科学团队。这意味着赋予人们使用数据进行决策的权力。Kuan说:“很多公司都有称之为数据科学团队的队伍,但没有赋予他们权力,也不信任他们提出建议。”
他认为,除非你将数据转化为决策,否则数据是无用的。这意味着要授权给那些拥有需要评估的数据和需要解决的业务问题的人们使用数据来帮助他们做出决策。
Kuan提供了一长串适用于决策科学的示例:产品的A/B测试、营销活动绩效评估、销售客户生命周期智能,以及改善客户体验的客户服务机会。
结果可能不是一个单一的选择,而是一系列的选择:“在数字世界中,我们可以做大量的A/B测试,并对结果做出决定,”他说。LinkedIn的几乎每一个产品决策都会作为一个实验交付给一小部分用户,产品团队可以看到这些变化如何影响KPI和其他指标。
LinkedIn广泛应用决策科学,从寻找合适的电子邮件细分成员到客户支持,再到使用文本分析来了解成员反馈,再到新闻提要,它选择确保日常成员获得更多的曝光率,因为评论和喜欢对于他们与平台的接触,比他们对像Bill Gates 和 Richard Branson这样的名人更重要。
员工会进行大量临时分析(ad-hoc analyse),看看是什么推动特定业务指标发生变化;这些都可以通过分析门户网站获得,这样数据科学团队就可以花更多的时间进行由问题和假设驱动的分析,这有助于业务团队做出决策。
Kuan指出,做出决定后,数据科学还没有完成。他说:“做出决策后,数据科学之旅将继续衡量我们所从事的工作所产生的影响,以及我们从所做出的决策中学到的东西,并通过实验不断加以改进。”
这是与决策科学的另一大区别:“按照过去的方式,当你做决定时,它基本上已经完成了;你没有任何机会(在未来)改进,”Kuan说。“跟踪这些数据驱动型决策的影响,使公司有机会从失败中吸取教训并成长。”
但决策科学不仅适用于像LinkedIn这样的数字公司。Lewis解释说,决策科学带给你的是一个更好的决策过程。
他说:“实践中决策科学的一个最好的例子是A/B实验的兴起,在这种实验中,组织系统地尝试两种不同的方法,看看哪种方法对客户的效果更好。”“这里的很多附加价值是,运行A/B实验会迫使团队澄清什么是成功,什么可能是他们现在所做工作的一个好的替代方案,并建立一个持续更新策略的流程。”
这样一来,您就不会陷入困境,即使您无法交付两种版本的产品,您仍然可以做到。Lewis说:“那时,基于现有客户数据的经济学,博弈论和因果机器学习将向前发展,以提供其他方式来预测如果选择了新的方向可能发生的事情。”
决策科学不是你要做的,数据科学才是;它是你如何使用数据科学来指导组织决策的方式,它需要数据科学家和理解决策的人。
OnePath的CTO Patrick Kinsella说:“决策科学是数据科学成果的应用,并与利益相关者行为和问题的业务环境相结合。”实施决策科学需要的不仅仅是采用数据科学工具,这些工具可以从数据中创建模型、得出结论和预测结果。“组织必须确定能够评估决策行为影响的个人团队。这些人通常在通过组织转型、并购整合或重新定义核心价值观进行变革管理方面经验丰富。”
Kuan强调招聘不仅仅是为了数据科学方面的专业知识。LinkedIn的数据科学家需要统计专业知识,这样他们就可以设计实验,知道如何衡量他们是否成功。他们需要知道足够多的机器学习,以便将业务问题形式化为机器学习问题,而不将相关性误认为因果关系。他们需要充分了解数据的业务背景,以便能够对其进行解释、清理并将其转换为可用的内容。他们需要能够展示他们的发现并解释它们是如何被创建的。
“我们的目标是从分析中获得洞察力,并有效地影响关键决策,从而推动业务影响,”Kuan解释道。
Lewis推荐了一个由经济学家、统计学家和数据科学家组成的团队模式。“经济学家找出需要衡量的东西,以便更好地了解下一步会发生什么;统计学家弄清楚如何衡量的方法;数据科学家建立基础设施和工具,以便进行大规模、定期和可靠的衡量。”
SADA的CTO Miles Ward说,也不要忘记基本要素。“如果你的数据来源和质量都没得到验证,不可访问,也不容易查询,那么做出决策将是偶然的。所以,如果你还没到,就从这开始。”