Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

埃森哲前高管分享:六个步骤培养「研究素养」,让AI在企业创造最大价值

图片

近几年AI技术得到了显著发展,但「技术的最后一公里」,即企业运用AI并让其产生价值却滞后了。

本文作者辛迪·戈登(Cindy Gordon)曾担任埃森哲高管,现为AI SaaS公司SalesChoice 创始人兼CEO,在与一些企业高管和业内专家交流后发现,她发现不少公司在投资AI方面仍然缺乏信心。

她会对董事会和首席执行官提问:建立成功的AI战略计划和旅程路线图需要采取哪些步骤,您认为结果如何?您的AI投资在哪里,您是否对它们进行了盘存或审计?计算科学家、数据科学家和AI科学家之间有什么区别?他们的数字素养技能是否足以领导和指导组织前进?

不同企业在运营执行上存在非常大的差距。

她认为,要解锁AI的最后一公里,董事会和首席执行官必须加快建立统一的智囊团(一套根植于数字和AI技术的统一的领导技能),以加快组织现代化进程。

为此,Cindy Gordon在《福布斯》上发布了一系列博客《Building AI Leadership Brain Trust Blog Series》,以董事会和董事CEO为目标读者,详细盘点了企业投资AI所需要的40种技能,分为4个部分:战略技巧、商业技能、情商/社交技能、技术能力。

每篇博客都探讨了一组技能,或者深入探讨了其中一个技能领域。其中「技术能力」部分10个素养包括:研究方法素养;敏捷方法素养;以用户为中心的设计素养;数据分析素养;数字素养(云、SaaS、计算机等);数学素养;统计素养;科学(计算科学、复杂性科学、物理)素养;人工智能(AI)和机器学习(ML)素养;可持续发展素养。

本篇深入探讨了「研究方法素养」。


AI数据科学家最重要的技能之一就是重视研究的严谨性,以建立强大而值得信赖的AI模型。所谓研究方法,就是用于收集数据或证据进行分析以发现新信息或更好地理解主题的策略、过程或技术。研究方法也分为多种类型,使用不同的工具进行数据收集、数据准备、数据建模。

AI设计和开发中存在的一个主要问题是没有外部审阅者通过关键的审阅/检查/质量保证来严格定义操作流程。尽管现在上传数据集并对其应用现成的AI算法相对容易,这并不意味着研究方法中使用的方法/设计是可靠的。

高管需要确保其AI和数据科学团队能够使用优质的实验设计研究方法。

首先,什么是实验设计?

实验设计是指在实验中如何将数据分配给不同的组,设计类型包括重复测量、独立分组和配对设计,AI或数据科学家必须决定如何将其样本分配给不同的实验组。实验设计意味着创建一套程序来测试假设,并且沿着实验设计的工作步骤创建文档是非常重要的。

确保企业具有在AI和数据科学项目中记录的熟练研究方法的必需步骤是什么?

以下是作者基于在为不同行业的众多客户设计和构建复杂的AI模型方面的经验的列表:

第一步定义研究问题列出需要解决的最大问题挑战是什么?

确保研究问题用清晰简洁的业务术语书写,以便被理解。清晰明确地定义解决此问题/挑战的好处/价值,以及如果解决此问题/挑战对您的组织意味着什么?将企业的实践案例固定在客户实践案例中总是投资AI项目的一个很好的入门方法,特别是对于处于AI部署早期阶段的企业。

尽可能多地了解投资回报率(ROI)和成本节省假设,并请一位财务专家来帮助验证业务逻辑。在这一阶段,最重要的目标是确保团队对AI投资有信心,高管的支持对于这一研究至关重要。不要轻视这一点——「人们会支持他们共同创造的东西。」

第二步写下研究假设指导研究实验

写一个好的假设,假设研究变量(数据)之间的预期关系,并清楚地陈述变量(数据)之间的关系。假设应当简短而切合实际,描述研究变量(数据)之间关系的研究假设应尽可能直接和明确。

好的研究假设的关键属性是:具有经验性且易于观察。黑匣子AI的风险之一是无法理解/解释结果,这增加了人类理解观察的风险;普遍性。可以解释普遍现象,而不是单个现象;合理性。不能违背逻辑;确定性。可以确保对概念进行仔细而清晰的定义(换句话说,如果其他研究人员选择了文档,他们将具有足够的知识来继续进行研究实验);可检验性。

第三步:确定实验方法或处理方法,以指导研究

这是人工智能 /数据科学家研究人员最重要的技能之一,因为了解AI的不同方法和应用才能知道它们在解决特定用例中最有价值的地方,再了解不同数据集大小的算法类型,将使得模型开发更加可靠。

通常情况下,机器学习(ML)是最有效的AI方法。有监督和无监督的机器学习方法在解决不同问题上都有其价值。

关键在于,人工智能数据科学家必须了解两者之间的差异,以及如何应用不同的方法,从而实现最有效的结果。常见的情况是,公司选择了一种人工智能方法,而没有探索其他方法。但如果他们建立了次优的人工智能模型,如果在研究和设计过程中更早地参与更多的研究实验和第三方审查,那么就能够减少更多的风险。

为研究提供充足的时间,是人工智能数据科学家高效完成工作的前提条件。这通常与业内相反,比如在北美文化中,追逐速度已经成为一种口号。但是在中国,企业家愿意在一件事情上投入十年以上的时间,更持有长期主义的耐心。

第四步:收集数据,并确保数据经过清洗,不存在数据偏差。

通常做法是,让所在的组织做好准备,确保其拥有强大的数据管理实践能力,这是AI和数据科学团队高效运作的基础。

据行业研究预估,AI数据科学家将六成到八成的时间花在数据准备需求上。这种巨大的时间浪费导致他们没有足够的时间去创建、训练和评估模型,更别说将模型搬到生产上了。

这些挑战是显而易见的,大多数组织根本没有为数据科学家和其他非IT角色建立高级数据分析团队。数据资产往往不容易获得,集成的机器学习软件工具也不容易获得,从而影响了可持续性和成功几率。

依靠传统ETL方法来满足实时需求不再是当下所需,因此需要将所有数据转移到云端,并投资先进的机器学习软件工具。

当中,有三种方法能够帮助高级管理人员加快数据准备操作实践。

一是应用自动化数据流程,以满足数据准备需求。例如,投资于数据集中的自动性别识别、简易数据标签工具包、数据准备工具,以轻松匹配数据或删除重复数据,筛选数据偏差,或数据不足,以预先执行足够的测试。确保数据准备工具包能够实现强大的过滤、剖析、特征识别、搜索以及数据结构化和模型准备。

二是投资支持自助服务协作环境的机器学习软件,以帮助支持跨职能工作团队,共享计划、见解,并改善知识流和不同数据管道的共享性,以加快、验证数据准备和数据审查实践。

三是快速地迁移到云端。为了实现人工智能数据访问,要将战略数据源迁移到云端,以提高分析和决策的访问便利性,否则,高管们必须更有耐心地处理复杂的内部数据存储,而这些数据存储并不在数据湖或云基础设施中。在数据准备方法上花费大量时间本就是一个令人深省的现实。但是,如果高管们希望拥有一个世界级的AI运营基础设施来进行高级分析,就必须在这个领域实现跨越式发展。

第五步选择你的AI方法来执行研究实验。

一旦准备好数据,就需要考虑在数据集上选用哪些合适的AI方法。AI分析技术有很多类型,例如启发式、支持向量机、神经网络、马尔可夫决策过程和自然语言处理(NLP)都是高管们需要了解的AI分析方法类型。

第六步分析解释和展示研究结果

这个技能领域可以说是最重要的沟通基础,其中,「假设」通过清晰的总结观察来实现,提供基于事实的见解来支持所要解决的问题。

在这一步中,关键是要排序和记录所有的模型版本、模型方法,以证明分析方法的严谨性,以找到最优化的模型来预测可靠、可信的结果,并从中做出决策。

当中,数据科学家往往需要业务战略专家和沟通专家的支持,用业务语言写出能引起高级管理人员共鸣的研究结果,以及他们能欣赏、理解和认同的价值实现结果。一个数据科学家往往缺乏商业沟通的写作技巧,所以加强所需的支持技能是确保知识不流失的关键。

总之,确保AI和数据科学团队能够开发成功的实验,并应用迭代方法非常重要。保持研究实验的紧凑性和简单性,将增加维持对AI建模实验持续投资的信心。

没有什么比在可执行操作中测试概念,并通过构建概念验证证明更好的了。关键的是,从一开始就大胆思考,让AI实验能够遵循远见卓识,不断监控实验的发展,推进组织的长期发展愿景。

董事会董事和首席执行官通常不擅长AI研究方法,因此建议他们升级知识,因为AI本身就是高质量的研究实验。这意味着公司必须专注于发展强大的数据文化并投资于现代化的数据管理工具包,以确保他们的组织能够从AI项目中获得安全的结果。

由于很少有公司成功地将AI模型转化为可持续的运营实践,因此董事会和首席执行官更有理由要求第三方对其人工智能和数据科学运营实践进行审查。

就像董事会和首席执行官必须了解供应链管理(SCM)运营实践和客户关系管理(CRM)运营实践一样。是时候让他们加速了解AI分析管理实践(AIAMP)和机器学习实践了。

人工智能的浪潮现在已经到来,它正在迅速冲刷所有的业务流程,当务之急是确保董事会和首席执行官不要被潮流冲昏头脑,也不要被后浪拍打,为巨大的变革做好充分的准备。

Powered by Froala Editor

Powered by Froala Editor

产业SCMSugarCRMAI
暂无评论
暂无评论~