《AI繁荣》 拉维·巴普钠、艾宁德亚·高斯 著
责编| 柒排版| 拾零
第 9073 篇深度好文:5610字 | 15 分钟阅读
随着AI技术在全球的快速发展,众多企业正积极投入智能化转型,期望抢占先机。但技术更新快、战略方向不清晰以及人才不足等问题,让一个核心挑战更加突出:企业要如何规划和有效推进AI商业化战略,才能降低失败风险,实现真正的商业价值?
美国知名的商学院教授拉维·巴普纳与艾宁德亚·高斯在《AI繁荣》中用攀登珠穆朗玛峰的路线作比喻,详尽描绘了企业将AI融入战略与运营的完整路线,并将其划分为四个关键营地。
最终落脚点,在于解答AI时代最核心的问题——如何构建与培养支撑AI时代需要的人才队伍。
他们强调:正如登顶珠峰不仅需要远见的领导者(CEO)和指引方向的董事会,更离不开登山者(转型中的中层管理者)与技术专家(熟练运用AI的职工)的紧密合作。
一、第一营地:数据即新石油
历经25年时间,投资数万亿美元的IT基础设施建设[尤其在企业资源计划(ERP)与客户关系管理(CRM)系统等领域],让全球企业置身于数据的海洋之中。
然而,我们反复听到的一个问题是,企业数据难以转化为具有可操作性的洞见。基于我们的实践经验,企业在数据价值转化过程中,普遍存在三大认知误区。
在每年开展的AI与数据科学咨询项目中,我们总会遇到这样一类企业领导者:他们拥有海量数据,听说AI可将数据转化为商业价值,便要求启动“探宝式”项目,以“看看能不能行得通”。
对此,我们会引导客户聚焦核心业务痛点:哪些问题让他们彻夜难眠?最希望改变的2~3个关键点是什么?如果无法明确这些问题,我们通常会推迟项目,待厘清业务场景、找到关键问题之后再推进。
第二类企业领导者低估了数据治理中存在的组织政治因素。他们并不拥有关键数据,也没有足够的权力或影响力去说服其他利益相关方共享数据。这类项目往往难以产生令人满意的成果。
相比之下,那些能够充分利用机器学习挖掘多个变量交叉影响的项目,比如对员工流失率的预测,更具价值。尽管如此,这类项目仍然值得尝试,因为它们能帮助企业突破学习曲线的起点(大本营),朝着第一、第二营地迈进。虽说距离登顶尚远,但这是必经之路。
第三种情况更加微妙,但也很常见。领导者并不像第一种情况那样毫无头绪,他们清楚要解决何种业务问题,也知道要开展何种AI分析,但他们忽略了对关键输入、预测变量或输出、结果变量所必需的变化的理解,而正是这些变化使分析成为可能。
数据工程实为一项艰苦的工作。过去10年间,我们在纽约大学和明尼苏达大学双城分校培养了数百名数据分析专业人才,发现数据工程是他们最不愿涉足的领域。
然而,我们对过去10年中横跨20多个行业的250多个数据科学项目的分析表明,数据工程的工作量约占数据科学项目总工作量的70%。其工作主要涉及对脏数据进行查询、清洗、格式化和处理,以将其转换为干净、可用的数据集——这正是企业数据科学之旅的大本营。
在攀登珠穆朗玛峰的征途中,最危险的路段之一是穿越昆布冰瀑。由于海拔相对较低,且冰川不断移动,随时都有可能出现巨大的裂缝,给登山者带来极大的生命威胁。
这一情形,恰似企业从数据混沌(大本营)走向初步秩序(第一营地)的过程。企业在大本营开展的所有规划和准备工作,最终将对其能否成功登顶产生决定性影响。
二、第二营地:
充分利用AI的“四大支柱”
如果企业已经成功收集到必要的数据和工具,顺利抵达大本营,甚至第一营地,那就意味着它具备了向AI巅峰快速挺进的条件。此时,企业已准备好运用描述性、预测性、因果性与规范性分析四大支柱所支撑的应用场景。
然而,根据我们的实际经验,企业和政府在推进AI项目时,往往会遇到两大难题:
一是他们不知道从何入手。
二是他们被市场上的AI相关的夸张宣传干扰,难以制定清晰的推进路径。
描述性和预测性分析是AI在现代商业领域的核心应用,分别利用无监督学习和监督学习来为企业提供数据洞察。这些分析方法构成了机器学习(即弱AI)的技术基础,并被广泛应用于各行各业。
因此,AI是一项广泛适用于日常生活的通用技术,绝非简单地交给IT部门处理的普通任务。
机器学习通常被视作引领第四次工业革命的关键技术,其重要性与前三次工业革命中的蒸汽机、电力和计算机等量齐观。要想理解机器学习的通用性,只需关注不同行业的公司如何迈出AI转型的第一步——他们最先摘取的是哪些“低垂的果实”。
选择AI转型的切入点,这一过程更像一门艺术而非科学,需要业务主管与数据科学家反复磋商。对于那些拥有多年IT系统积累的海量数据,却不知从何下手的传统企业而言,描述性和预测性机器学习是最佳的起点。
从旅游业用客户分群优化营销策略,到服务业用员工流失分析辅助HR决策,我们的实战案例证明,这两类机器学习已成为新时代的“通用技术”。
接下来,面对日益复杂的商业环境,企业需要借助因果分析来应对挑战。这种方法依赖于实验与学习文化,鼓励企业采用科学实验的方法来探索因果关系。其核心目的在于,帮助企业领导者和管理者基于科学原理理解因和果之间的内在联系。
这种方法在学术界早已广泛应用,并且一直用于高风险决策场景(如制药公司决定是否推出新药)。如今,因果分析正被广泛应用于各类商业决策,也是“产品思维”驱动的软件化数字化转型的重要基石。
许多企业已经在不同程度上采用因果推理方法(行业内通常称之为“A/B测试”),来决定应该投放哪种广告、推出哪些功能、设置何种激励机制,以引导用户采取特定行为。
需要明确的是,正如我们之前所讨论的,虽然描述性和预测性机器学习具有极高的商业价值和社会价值,但它们的本质仍然基于相关性,而非因果性。
这些方法大致可以归为两种类型:一是模式挖掘,即发现数据中的有趣关联或异常点;二是相关性映射,即将输入变量与输出变量关联起来,以进行预测或打分。
然而,两者都不能证明因果关系。混淆相关性和因果性,是大多数职场人士常犯的关键错误,甚至许多受过数据科学和分析训练的专业人士也难以避免。
同样需要强调的是,使用因果分析方法(如公认的“黄金标准”双盲随机对照试验),在道德层面或智力层面,并不优于使用具有高度相关性的预测性深度学习模型。
例如,如果一个深度学习模型在检测早产儿视网膜疾病方面,能够比经验更为丰富的眼科专家团队更为准确,那么它就是一种有效的工具。因果分析与预测性分析只是针对不同挑战所采用的不同工具,并无优劣之分。
此外,这两种方法在执行过程中,所涉及的数据分析生命周期也完全不同,从数据工程、分析方法,到结果解读与沟通方式,都存在显著差异。
因此,我们的目标在于帮助企业领导者理解这些方法的核心逻辑,以便他们能够根据实际问题,选择最适合的分析方法。
举例来说,本书的一位作者曾受邀为一家大型医疗设备制造商的商业洞察团队提供咨询服务,协助其快速增长的业务部门厘清一个问题:公司在举办医生学术会议和行业活动方面投入的时间、资金与精力,与医生最终开具该公司设备处方的概率之间,究竟存在怎样的关联?
这本质上是一个典型的ROI问题,数十年来始终困扰着营销从业者。近年来,随着量化手段的不断进步,看似有更多数据可以追踪不同营销活动的效果,许多企业认为能够直接建立起营销投入与业务成果之间的联系。
然而,这种认知可能只是一种错觉,其中存在诸多陷阱,而真正的答案在于能否正确使用因果分析。
该业务部门的总裁提出了一个关键问题:“我们如何知道,如果没有举办这些学术会议,医生是否仍然会开具这些处方?或者说,可能只有一半的处方会被开出?换句话说,我们是否在学术会议方面投入过多,而在其他营销渠道上投入不足?”
在数据科学的术语中,这位总裁实际上是在追问反事实推断(counterfactual)。
最后,我们来讨论规范性分析。在这一阶段,企业能够将人类智慧与机器智能进行最佳结合,充分发挥各自优势,同时减少其局限性。
规范性分析建立在描述性分析、预测性分析和因果分析的基础之上,并在此基础之上进行优化。这种状态难以实现,且在现实中较为少见,但无疑是值得追求的目标。
三、第三营地:
借助AI应对复杂用例与数据难题
当企业在处理常规的数值型或表格型数据以及开发相关应用场景方面越发得心应手后,便可以拓宽视野,尝试从更丰富也更具非结构化特性的数据,如图像、音频、视频和自然语言中挖掘商业价值。
在本书中,我们已经详细讨论了深度学习、强化学习以及生成式AI在这方面的应用。
例如,我们的一位客户需要对某分析咨询公司提出的方案进行评估,该方案称可以基于音频数据高精度预测客户流失率。
然而,客户面临的主要难题在于:如何在不共享私人通话数据的情况下,快速评估该模型的可行性?因为共享这些音频数据需要历经多个法律审批流程,周期较长。
我们给出的解决方案是,利用生成式AI创建具有相同统计特性的合成数据集,使用这些数据来评估该供应商的模型,同时还对另外两家竞争对手的方案一并进行评估,而整个过程中无须泄露任何真实的私人数据。
再比如,一家公司希望检测放射影像中的特定病理模式,但该企业自身拥有的训练数据极其有限。通常情况下,这种情况会成为深度学习模型的一大瓶颈,因为像卷积神经网络(CNN)这类模型,一般需要大量训练数据才能呈现良好的效果。
对此,我们建议该企业采用迁移学习的方法:借助现有的大规模开源模型,直接继承其中95%的预训练参数,仅对模型的最后几层进行针对性微调,用有限的数据集进行训练。这样,即便在数据量受限的情况下,该企业仍能获得高精度的放射影像分析模型。
四、第四营地:攀登AI价值高峰,
构建强效领导力与组织协同体系
四号营地位于珠穆朗玛峰与洛子峰之间的南坳隘口。此处的地貌特征与前后路段截然不同。强劲的侧风从北部的西藏高原一路直贯南部的尼泊尔昆布地区,即使在海拔26000英尺的高处,也难有积雪堆积。
这恰似企业试图从依赖直觉、经验与主观判断的传统决策模式,向数据驱动、测试-学习文化转型时所面临的“险峻地带”。从四号营地向珠穆朗玛峰之巅所迈出的每一步都愈发艰难。
1978年,奥地利登山家莱茵霍尔德·梅斯纳尔与彼得·哈贝勒首次实现无氧登顶,梅斯纳尔如此描述濒临极限时的感受:“在精神超脱的状态下,我仿佛脱离了肉身与视觉,化作漂浮在云雾与峰峦之上、孤独喘息的一叶肺。”
然而,他们的这一壮举堪称史诗级的突破,如同英国运动员罗杰·班尼斯特打破四分钟一英里的纪录,为后来者开辟了一条曾被视为不可逾越的道路。
在企业迈向AI之巅的旅程中,所面临的“南坳级”挑战主要体现为在组织内部培育AI领导力,以及管理AI增强决策所引发的文化变革。
举例来说,通过实验来进行决策,让许多企业管理者感到望而生畏,越来越多的研究也表明,这种“实验规避”现象普遍存在。4然而,当微软摒弃了“高薪人士的意见”模式,转而采用“A/B测试”时,所有为此付出的努力都是值得的。
任何极具挑战性的事务,都需要来自领导层的有力推动。企业领导者必须深谙第一章中所提及的“AI之屋”的各个要素,熟悉不同类型AI的应用场景,并有意识地培养管理团队对AI潜力的认知。这能够帮助组织积蓄实力,确保优先事项与整体战略保持一致。
随后,要为项目融资,聘用主管和执行人员,并组建由业务领袖、数据科学家和数据工程师组成的团队,力求在AI领域取得早期成果。
五、构建AI人才战略至关重要
如果说具有远见卓识的首席执行官是大本营的指挥者,前瞻性的董事会担任向导,那么最终实现登顶的关键,则在于一支由登山者和夏尔巴人(Sherpas)组成的团队,他们团结协作,共攀高峰。
夏尔巴人来自尼泊尔昆布地区,他们肩负着勘探路线、架设安全绳以及承担物资运输等重任。在我们看来,他们才是助力登顶的真正英雄。
在非科技企业中,从部门领导到副总裁级别的知识型员工,正面临着巨大的变革,我们将其称为“混乱的中间层”。
随着AI将更多认知性工作自动化,人们不禁深思:银行是否还需要人工审贷员?还是说,通过学习过去数十万个案例(无论好坏)的专业知识和智慧而训练的算法,能更好地满足银行的需求?
然而,如果没有一支实干家的队伍,即那些擅长运用最先进的AI、机器学习和高级分析技术,在各个行业和职能领域提供创造性解决方案的夏尔巴人(登山中真正的英雄),这幅图景便是不完整的。
作为全球顶尖商业分析硕士项目的前任(拉维)和现任(艾宁德亚)主任,我们在培养优秀AI人才方面拥有第一手经验:
第一,要求人才具备高度的商业敏锐度,能够区分资产负债表和损益表;
第二,拥有顶级的数据工程能力,因为在高级分析项目中,70%的时间都用于清洗、聚合、整合和处理数据;
第三,需要深入理解AI分析的四大支柱:描述性分析、预测性分析、因果分析、规范性分析;
第四,具备丰富的实践经验,能够向企业不同层级的利益相关者清晰传达AI分析的价值。
与许多新的数据科学研究生项目不同,我们的项目并不是对大学已开设课程进行“新瓶装旧酒”式的简单包装,而是基于我们提出的“AI之屋”框架,并深度结合企业高管的观点和参与,着重培养解决现实问题的分析转化力、数据叙事力以及数据伦理实践力。
在探讨AI时代的人才战略时,我们必须直面一个严峻现实:当前在AI及科学、技术、工程、数学领域(STEM)中,女性、有色人种以及其他少数族裔的代表性严重不足。
我们必须制定积极的策略,使AI优先战略与多样性、公平性、包容性等现代企业核心价值观深度协同。
*文章为作者独立观点,不代表笔记侠立场。