Thomas H. Davenport 、Rudina Seseri作者机器之能编译

如何打造最小可行AI产品?这里有份避坑工程指南

如何打造最小可行AI产品?这里有份避坑工程指南

面向MVP的思维对于任何类型的系统都非常重要,AI也不例外,无论该技术看起来多么令人兴奋。用户可以采用一种MVP的AI产品,而无需花费大量时间或金钱,并且可以通过早期客户的反馈加以改进。就AI产品来说,其MVP产品也有一些特殊要求和特点。

文章作者Thomas H. Davenport是巴布森学院(Babson College)总统的信息技术与管理学杰出教授,牛津大学赛德商学院的客座教授,麻省理工学院数字经济倡议的研究员,德勤(Deloitte)人工智能分析实践方面的高级顾问,还是Glasswing Ventures的顾问。Rudina Seseri是Glasswing Ventures的创始人和管理合伙人,领导该公司从事AI企业软件即服务,云,IT软件和垂直市场的投资。


作者 | Thomas H. Davenport 、Rudina Seseri

编译 | 机器之能


什么是最小可行性产品(MVP,Minimum Viable Product)?

MVP最初由技术专家Frank Robinson定义,也是 Eric Ries 在《精益创业》的核心思想,意思是用最快、最简明的方式建立一个可用的产品原型,通过这个最简单的原型来测试产品是否符合市场预期,并通过不断的快速迭代来修正产品,最终适应市场需求。

简单说,做新产品不要一开始就追求「尽善尽美」,先花最小代价做出「可用」的产品原型,验证其是否有价值、是否可行,再通过迭代完善细节。

那么,MVP的概念对AI意味着什么?这个问题不仅与初创企业有关,而且与大型企业有关。许多公司正在其业务的不同领域开发AI试点项目,他们希望这些试点项目展示AI的潜在价值并最终走向规模化部署。大型组织的MVP概念与试验或概念证明,有很多相似之处。

对于任何追求人工智能的组织来说,了解成功的MVP是由什么组成是很重要的。对于一家主要投资人工智能公司的风投来说(比如Glasswing Ventures,我们都参与了这家公司 ),理解什么是AI产品的 MVP以及如何改善他们同样重要。我们认为,尽管一些IT产品的某些属性是必须的,特别是在其早期阶段更是如此,但是,它们可以经济而且快速地迭代和演化。而就AI产品来说,其早期MVP产品也有一些特殊的要求和特点。

 一 数据和MVP

机器学习是一种常见的AI基础技术,通过大量数据得以改进。到目前为止,监督学习是业务中最常见的类型,需要标记数据。因此,数据可能是AI产品最重要的单一资源,即使在MVP阶段,数据也是必要的。没有数据,就没有训练有素的机器学习算法。

任何尝试创建AI MVP的人都应该能够回答下述问题(投资者或企业发起人应该向他们提问):

  • 训练主要模型需要哪些数据资产?
  • 是否已经有足够数据来训练某种有效的模型?
  • 训练模型的数据专有性( proprietary)如何?
  • 能用于训练模型之前,还需要对这些数据进行多少数据集成,清理和其他活动?
  • 某些时候,是否可以使用其他数据来改进模型?

机器学习算法或模型本身已变得商品化。自动化机器学习软件的提供者之一DataRobot宣传说,它已经创建了十亿多个模型(当然,并不是所有模型都在使用中)。但是,数据仍然是更具挑战性的资源,可能需要大量的精力来清理,集成并将其转换为可用的格式。如果AI的MVP所使用的数据源广泛可用(例如ImageNet数据库),则不可能提供很大的竞争优势。

Glasswing投资的一家初创公司Armored Things拥有的数据就具有专属性,非常有价值。Armored Things的客户主要包括活动场所和校园,帮助提高这些场所的人身安全以及设施和运营管理。该公司将来自现有视频、Wi-Fi、智能门锁和其他传感器的数据组合到「空间情报层」中,构建实时人群情报AI平台。对于提高人们如何使用和移动物理空间的可见性来说,这套独特、专有的数据集至关重要,也有助于将这家年轻公司的产品推向MVP阶段。

洛杉矶足球俱乐部(Los Angeles Football Club)的职业足球队正在使用这家初创公司的产品实时了解球迷流量,并对该俱乐部22,000个座位的场馆的人群密度、卫生和安全做出更明智的决定。该场馆是职业体育运动中最高科技的设施之一。在COVID-19造成中断后,球迷开始重返体育赛事之际,此类技术至关重要, 快速的数据分析和行动对于建立信任和优化安全体验是不可或缺的。

 二 数据和算法之外,MVP还需要什么?

即便有干净的专有数据,仅凭机器学习(尤其是深度学习)通常也不足以创建有效的AI。对于涉及到感知(语音、视觉),控制(机器人)和预测(客户需求计划)的问题,机器学习解决方案的可处理性和复杂性差异很大。

要实现MVP,早期的AI产品需要关注如下四个问题:

1. 复杂的混合模型

在处理模拟人类对话等复杂问题时,由于可用信息数量有限会产生数据稀疏的问题,不可能用大量的数据去处理。

在这种情况下,在构建MVP时,将深度学习先验知识建模和基于一定规则的逻辑推理结合起来,可能会更加实际。

这些人工智能解决方案不像深度学习那么复杂,需要的数据也更少,透明度更大。不过,这样的混合算法很少是现成的,研究人员必须要自己去探索。

比如情绪检测公司Cogito使用AI检测呼叫中心约200种言语和非言语特征,以改善服务质量,包括人声的音量、强度、一致性、音调、语气、张力等。

这种软件会实时向工作人员报告检测结果,引导他们进行更加自信和富有同情心的对话,以更高水平的完成工作。

正如Cogito首席执行官Joshua Feast所说,该软件「帮助人们在交谈中变得更有魅力」,这意味着更高的净推荐人分数(据一项研究,高出28%),更短的平均通话时间,以及更少的客户升级致电经理的情况。

机器学习结合自然语言处理和社会信号探测,可以比单独使用这两种技术提供更好的推荐。

2.要对业务进行整合

大多数企业不想使用单独的AI应用程序,所以很多解决方案都是提供接口,让AI程序可以插入现有数据记录中,并与系统结合,使用更方便。

Glasswing投资的另一家公司Zylotech将这一原理应用于其可自主学习的B2B客户数据平台。该公司整合了跨现有平台的客户数据,包括客户在其他地方浏览和购买记录。为市场、销售等团队制定政策提出针对性意见。它是专门为直接补充客户现有的软件套件而设计的,最大限度地减少采用摩擦。

另一个案例是库存管理企业Verusen,考虑到市场上存在着大型的企业资源规划参与者,平台必须与这样的系统集成。它收集现有的库存数据,并在用户行为没有显著改变的情况下,用AI对如何连接数据和如何预测库存提出建议。

3. 必须有领域知识

AI解决方案和行业知识结合是绝对关键的。比如,在很多情况下,一些不错的医疗AI应用(如诊断助手)最终都被束之高阁,因为它们无法与医生的日常工作配合。

MVP需要解决特定的业务或消费者问题,因此拥有相关领域知识非常重要。气象情报中心ClimaCell是一个典型案例。

ClimaCell的团队已经从卫星、无线信号、飞机、街头摄像头、联网汽车、无人机和其他电子资源中获取信息,可以提前6个小时逐街逐分钟地提供天气预报(或者提前6天提供时间上不太明确的天气预报)。

它的按需「微型天气预报」已经为Uber,Ford,National Grid和New England Patriots足球队等各种客户提供了服务。

4.从「第0天」开始交付价值

AI应用程序通常需要不断更新数据以迭代自身。然而,在开发AI MVP时,重要的是要考虑第一个客户以及如何从一开始(第0天)起就交付价值。

这可能需要一开始就专注于清理客户数据,以构建可提供给AI产品的数据集,并在早期使用公共数据集来训练模型,采用人为套环的方法来以较低的置信度来验证早期响应,或者采用基于规则的技术。MVP开发人员需要确保最初的客户将成为公司的最大拥护者。

 三 MVP的目标:最低可行性

同样重要的是要考虑到另一个MVP——最小可行性。给定目标任务,产品必须执行得多好才能算有用?

答案取决于相关业务标准和所需性能水平。在某些应用中,如果在第一天就取得80%的成功,就意味着能大幅提高成本,但在一些其他应用中可能完全不够,比如语音识别系统。

MVP的目标是超越最低的标准,而不是打败全世界。衡量AI的作用只需要一个简单的问题,「一个最小可行的AI产品是否能改进现状?」

即使是大型软件公司也需要问这个问题。Salesforce的AI产品开发的首批工具之一是预测客户的销售倾向模型。这种工具很简单,因为所有数据都在Salesforce云里,销售人员对预测性机器学习模型也比较熟悉。即便预测结果不太完美,可能也比销售人员凭直觉做事更好。

对于AI MVP来说,从最容易实现的目标(low-hanging fruit)开始做起或许是不错的选择。在Verusen的案例中,AI主要用于零部件库存管理。通过构建和改进这一流程,Verusen能够为每个早期客户节省数百万美元。

以MVP为导向的思维对任何类型的系统都很重要,AI也不例外——不管这项技术本身看起来多么令人兴奋。用户无需花费大量时间或金钱就可以使用最低限度可行的AI产品,并通过早期客户的反馈进行改进。

有了这种思想,产品和内部应用程序可以顺利地从有用的基础性功能进行转型。

参考链接:

https://sloanreview.mit.edu/article/what-is-a-minimum-viable-ai-product/?use_credit=8e9ad9bcfb35ee3c8f13e524dc7d8e98

产业AI 基础设施通用人工智能数字经济云计算
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

先验知识技术

先验(apriori ;也译作 先天)在拉丁文中指“来自先前的东西”,或稍稍引申指“在经验之前”。近代西方传统中,认为先验指无需经验或先于经验获得的知识。先验知识不依赖于经验,比如,数学式子2+2=4;恒真命题“所有的单身汉一定没有结婚”;以及来自纯粹理性的推断“本体论证明”

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

数据集成技术

数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。在企业数据集成领域,已经有了很多成熟的框架可以利用。目前通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统,这些技术在不同的着重点和应用上解决数据共享和为企业提供决策支持。

自动化机器学习技术

机器学习最近在许多应用领域取得了长足的进步,这促成了对机器学习系统的不断增长的需求,并希望机器学习系统可以被新手快速地熟悉并使用。相应地,越来越多的商业企业推出产品旨在满足这种需求。这些服务需要解决的核心问题是:在给定数据集上使用哪种机器学习算法、是否以及如何预处理其特征以及如何设置所有超参数。这即是自动化学习(AutoML)企图解决的问题。

DataRobot机构

DataRobot 是一家位于美国波士顿的机器学习平台公司,其提供的机器学习平台可让任何水平的数据科学家「只需一点时间就能开发和部署准确的预测模型」。该公司于2017年3月完成了 C 轮融资,获得了由 New Enterprise Associates 领投的 5400 万美元资金。据 Crunchbase 统计,截至目前该公司已经完成了 5 轮融资,共获得了 1.11 亿美元投资。 DataRobot 由数据科学家 Jeremy Achin 和 Thomas DeGodoy 于 2012 年创立。据报道,DataRobot 平台上有数百个开源机器学习算法,能帮助数据科学家将原本需要数周乃至数月的开发过程大幅缩短。该公司的 COO Chris Devaney 介绍说:「数据科学家可以带着他们已有的模型,进入有很多开源模型的 DataRobot,看他们的模型的排名。因为只需要几分钟就能找到最佳的模型,你可以运行和重新运行这样的比较,从而每天或每周都能找到最准确的模型,这依赖于你自己的业务变化。」到目前为止,DataRobot 已经创造了超过 1.5 亿个预测模型,客户范围涵盖体育、银行、保险和医疗等领域。

http://datarobot.com/
相关技术
推荐文章
暂无评论
暂无评论~