比起 iPhone 7,我们更关心苹果的人工智能「大脑」

苹果发布会在即,「机器之心」独家整理了近年来苹果在人工智能领域的布局与突破。在竞争愈演愈烈的人工智能领域,看似迟到的苹果是否真的被低估?在下一轮竞争到来之前,苹果是否能迎来新机会?

当地时间 9 月 7 日上午 10 点(北京时间 9 月 8 日凌晨 1 点),苹果将在美国旧金山 Bill Graham Civic Auditorium 举办今年的秋季发布会。全世界果粉翘首以盼的 iPhone 7/iPhone 7 Plus 有望在这次发布会上正式发布。

而除了这些备受期待的硬件产品,苹果在人工智能上的布局似乎更容易让人忽略。事实上,除了众所周知的 Siri,人工智能正在苹果的产品和服务中扮演着无处不在的「大脑」角色。

无处不在的「苹果大脑」

在去年的谷歌年度媒体会议上,谷歌前 CEO Eric Schmidt 曾表示,谷歌在机器学习上的应用已经在邮件、图片及语音识别上为用户体验带来了极大的提升,其中,Gmail 甚至已经能识别出 99% 的垃圾邮件。但绝大多数用户却感觉不到这种体验提升的存在:

「即便有,也只是在搜索服务中能够明显感觉到。」

苹果也面临着同样的问题。虽然 iPhone 的用户能明显感觉到手机性能上用户体验的提升,但与绝大多数人认知相反的是,苹果的机器学习远不止应用在 Siri 上。

2.jpg

识别陌生来电、在解锁后列出你最常使用的应用,或者在提醒事项中标记了一个约会,以及自动显示附近标记的酒店,这些在苹果全面应用机器学习及神经网络后,都能处理得游刃有余。

在某些层面,苹果人工智能有关的发布,很大程度借鉴了微软的 Cortana。苹果高管表示,Siri 正走向桌面:不久,用户就可以和苹果电脑对话,就像和手机对话一样。

和 Cortana 类似,Siri 也能扫描用户的通讯情况并给出建议。假如系统发现两位用户正在通过文本信息讨论约会事宜,系统会自动弹出一个台历图示,这样,用户就可以在文本线程中实现会面安排。苹果也会推荐相关的对话 emoji,在新的操作系统中,这一功能会变得更加有趣。

3.jpg

而和谷歌类似的是,苹果现在可以用面部识别技术扫描你的照片,给相册中的人物分类。假如祖父照片散落在相册各处,面部识别技术可以帮你找出祖父照片,并将它们分组集中起来,如此以来,整理回忆,你无需亲自动手。而脸书的自动面部识别技术已经面世好几年了。

值得一提的是,通过让用户在单一应用中尽可能完成更多的任务,苹果也在尽力减轻用户的应用程序疲劳症——无需离开文本信息对话就叫 Uber,在 iMessage 中就可以完成这一任务。想从电脑给某人发文本信息?

现在,你可以告诉 Siri 这么做。公司也试着减轻用户的密码疲劳症,你可以用苹果手表登陆电脑,这样就不用再输入一次密码。而且,苹果支付市场也会进一步得到扩展,现在可以在桌面上使用 Apple Pay,而且对象涉及很多商业网站。这也意味着,那些偏爱使用苹果的用户在面对一大串商户时,不用再费力地进入并保存信息用卡信息。

而除了在 Mac 的桌面系统上加入 Siri 外,苹果还允许开发者在自己的 App 中接入 Siri 的语音功能。苹果用户不久后就能通过直接与 Siri 对话,使用 Slack、Uber 或者 Skype 了。

此外,苹果也在其新的战略产品 Apple Watch 上深度应用了机器学习,包括在 iPhone 上早已应用的用户行为检测和相机人脸识别功能。

总体而言,越来越多的用户正在与技术对话:谷歌最近说,大约 20% 的谷歌询问来自语音,而不是键盘输入。虽然一年多以前,Cortana 已经赋予用户与台式电脑对话的能力,但是,苹果的优势是能够将这一流行移动工具整合到桌面,实现不同设备间的无缝对接。而这些的最终目标是实现用智能助手连接一切服务,这也是谷歌和 Facebook 纷纷开源 bots 平台的原因。

在未来,以 Siri 为代表的苹果人工智能技术和可能会成为帮用户连接服务的「大脑」。

苹果这些年都收购了哪些人工智能公司?

近些年来,苹果渐渐赢得了世界上最不差钱的公司的称号,今年年初时曾有报道称苹果的现金储备超过 2000 亿美元。这么多钱怎么花呢?收购创业公司来增强自己的技术似乎是个不错的选择。和谷歌、Facebook、微软等巨头一样,苹果也在最近人工智能热度暴增的这几年收购了一些相关的创业公司。

但和谷歌、Facebook、微软等有公开的专门的人工智能技术科研机构的公司不一样,苹果的收购似乎都是为了增强自身已有业务或即将实现的业务,而对长远规划的关注则相对较少——不过苹果也可能只是秘而不宣;就像苹果自己说的那样:「苹果时不时会收购一些小型技术公司,而我们通常不会讨论我们的目的或规划。」

这里我们简单盘点一下苹果近两年来与人工智能相关的 10 笔收购。

2015 年 3 月,苹果收购网络应用数据库技术公司 FoundationDB。这家公司由 David Rosenthal、Nick Lavezzo 和 Dave Scherer 联合创立于 2009 年,该公司的产品 FoundationDB 是一种 noSQL 数据库,非常适合低成本的 Web 应用。

2015 年 4 月,苹果收购以色列的摄像头技术公司 LinX,据《华尔街日报》报道交易金额大约为 2000 万美元。这家公司设计的摄像头模组具有背景焦点模糊、视差图像和 3D 图像拍摄等功能。今年年初时,有多家媒体都报道了即将推出的 iPhone7 Plus 手机所配置的双摄像头就使用了 LinX 的摄像头技术。

2015 年 5 月,苹果公司收购了全球定位系统(GPS)创业公司 Coherent Navigation,这家公司的高管也加入了苹果公司的地图团队。Coherent Navigation 的主要研究方向是基于卫星技术的商用高精度导航服务。

2015 年 9 月,苹果悄然收购了旧金山地图数据分析和可视化创业公司 Mapsense,这笔交易的价格据称在 2500 万美元至 3000 万 美元之间。Mapsense 称该公司的基于云端的高速地图系统可为开发者提供重要数据分析和工具;客户可以向其服务上传 TB 级的位置标记数据,然后该公司可通过强大的搜索和过滤工具创建定制可视化信息以提供给开发者分析。

同月,苹果还收购了来自瑞士的脸部动画生成技术公司 Faceshift,该公司是一家专注实时动作捕捉技术的公司,专利是无标记(markerless)面部动作捕捉技术。该公司还经常和游戏、动画工作室合作,通过 3D 传感器实现快速、准确的面部表情捕捉。

4.jpg

使用 Faceshift 的实时动作捕捉

2015 年 10 月,英国自然语言处理创业公司 Vocal IQ 被苹果收购,苹果收购 Vocal IQ 的目的可能是强化其语音助手 Siri。同月,苹果还收购了创业公司 Perceptio,该公司的技术可以帮助企业客户在智能手机上运行先进的人工智能系统,该公司的负责人 Nicholas Pinto 和 Zak Stone 都是知名的人工智能研究者,研究领域主要是基于深度学习技术的图像识别系统。

5.jpg

2016 年 1 月,人工智能创业公司 Emotient 被苹果收购,可利用人工智能技术对人们的面部表情进行分析以解读其情绪。不知道新款 iPhone 上的人脸识别会不会用到这家公司的技术?

同月,苹果公司还确认已收购教育技术初创公司 LearnSprout,这家位于旧金山的软件创业公司成立已有 3 年,其在线数据洞察力可以帮助 K-12(学前教育到中学教育)教育工作者追踪学生的学习情况。

2016 年 8 月,苹果收购了机器学习与人工智能创业公司 Turi。Turi 能让开发者们打造出配有机器学习和人工智能能力以及进行自动调整的应用。它的产品——包括 Turi 机器学习平台、GraphLab Create、Turi Distributed 和 Turi 预测服务——多半旨在帮助大大小小的组织更好地感知数据。使用案例包括推荐引擎、欺诈检测、预测客户流失、情绪分析以及客户细分。

此外,苹果还在 8 月份宣布已经收购了创业公司 Gliimpse,该公司的业务是使用机器学习技术帮助人们安全地管理和共享个人医疗信息。据了解,这项交易在今年早些时候就已经完成,但苹果公司一直以来都没有公布这项交易。Gliimpse 于 2013 年由 Anil Sethi 和 Karthik Hariharan 创立于硅谷,提供了一个独特的服务平台,让用户可以将不同来源的医疗和健康数据整合到一起,并按照需要与第三方(包括医生)共享。

苹果究竟想用人工智能做什么?

从上面的苹果在人工智能上的收购也可以看出一些苹果在人工智能技术上的计划,具体集中在数据管理、智能助手、计算机视觉、地图服务、教育和医疗健康领域。

今年 8 月份,Backchannel 主编 Steven Levy 发表了一篇重磅长文《The iBrain is Here》,其中谈到了许多苹果在人工智能上的「大计划」(包括一些并未得到苹果确认的传言)。同样,就像前面谈到的那样,苹果的已经公开的计划更加关注实际的应用。

苹果互联网软件及服务部高级副总裁 Eddy Cue 在上述文章中说道,「人工智能与以往改变人机交互的各种媒介并无本质区别」,苹果对于机器是否将取代人类这样老生常谈的讨论也并无兴趣。

苹果互联网软件及服务部高级副总裁 Eddy Cue 在上述文章中说的那样:「人工智能与以往改变人机交互的各种媒介并无本质区别」,苹果对于机器是否将取代人类这样老生常谈的讨论也并无兴趣。

汽车应用与自动驾驶

对于苹果设计制造自动驾驶汽车的传言已经由来已久(甚至已经有了 iCar 的说法),但苹果对此从来没有正面做出过评论。现在谷歌、Uber 和百度等互联网公司以及特斯拉外加一众传统汽车制造商正纷纷向自动驾驶领域进军,而苹果的汽车计划一直处于秘而不宣的状态。

去年 12 月,福特汽车和苹果公司宣布一项新合作。福特 2011 年后出产的搭载 SYNC 功能的汽车都可以升级到苹果的 CarPlay,这也意味着你可以用 Siri 来给你的爱车发命令。

据报道,这次合作将使得苹果的 Siri 安装到福特的 500 多万汽车上。另据了解,那时候苹果公司就已和超过 30 多家汽车厂商达成了合作,进一步推广 CarPlay。

而虽然苹果从未口头上承认过自动驾驶研发计划的存在,但苹果在相关领域的招人挖角上一直动作频频。

据《华尔街日报》去年援引多名消息人士的话报道,苹果首席执行官 Tim Cook 大约 2 年多以前批准了汽车研发项目,并指定分管产品设计的副总裁 Steve Zadesky 领导研发,授权他组建一个最多 1000 人的研发团队,在距离苹果公司总部数公里的一个基地工作,主要研究方向是机器人技术以及和汽车制造相关的金属和材料分析等。

苹果今年初还聘请了原黑莓旗下 QNX 汽车软件业务部门的 CEO Dan Dodge 加入苹果汽车业务团队,Dodge 将和苹果汽车计划(Project Titan)负责人 Bob Mansfield 一起发展自动驾驶汽车技术。

据传言称,苹果公司的目标是 2020 年左右发布一款苹果汽车。但是该计划可能受到一些高层的离职、技术推迟以及公司政策方向的变化等因素影响。

教育与医疗健康

由于在教育市场面临谷歌母公司 Alphabet 施加的竞争压力,苹果开始全面发力教育市场,甚至为美国上百所学校免费提供 iPad,还派驻专员帮助他们解决各种问题,甚至连高管都亲自出面一对一帮扶各所学校。

苹果的这些付出并不是没有回报的。随着其所积累的用户数据越来越多与在线教育的兴起,苹果有望通过这些历史所积累的数据发展自己的个性化教育方案,从而占据学生群体这一未来增长的动力源泉。

6.jpg

而医疗的智能化也是科技巨头们看上的一块未来「大蛋糕」,谷歌、IBM、微软和苹果等都已入场。2014 年 WWDC 上,苹果推出了全新的健康平台 Healthkit。凭借苹果公司遍布全球的数亿 iPhone 用户,苹果可以获得来自手机/手表传感器和大量第三方配件的健康数据,这也构成了苹果在医疗健康领域内野心的数据基础。

今年五月份,苹果还聘请了 Nest 前首席技术官 Yoky Matsuoka 加入该公司的健康产品团队。Yoky Matsuoka 的来头可谓不小,她曾是 Google X 实验室的共同创办人,后来又于 2010 年加入智能家居公司 Nest 担任技术负责人。

音乐与多场景

早年凭借着 iTunes 和 iPod 等应用和设备,苹果就已经在音乐市场占据了不可忽视的一席之地。而拥有数亿用户的 iOS 平台上的 Apple Music 的发布(尽管苹果也推出了 Apple Music 的安卓版本,但安卓用户对此兴趣不大)更是帮助苹果几乎瞬间就成长了音乐市场的庞然大物。

为了和 Pandora 与 Spotify 等音乐服务提供商竞争,靠手机预装当然是不够的。为了为用户提供个性化的服务,帮助用户找到他们所喜欢的音乐。据了解,和 Pandora 等较小的公司所采用的纯算法的推荐方式不同,苹果采用了半人工操作的解决方案。

正如谷歌在原始地图里面添加元数据(比如街道名称、单行线/双行线、公司名称等等)一样,苹果也在音乐播放列表里面手工添加音乐的元数据信息。之后,苹果公司会针对一个用户筛选出他们喜欢的数据,然后推荐 10 个、20 个或是 30 个音乐播放列表。

除此之外,苹果的触角也已经伸入了虚拟/增强现实(已经收购了多家相关的公司)、物联网等领域,但相关领域还没有什么成型的产品(甚至传言都很少),此处便不再过多涉及了。

群雄争霸的人工智能领域,迟到的苹果还有机会吗?

自 2009 年以来,人工智能已经吸引了超过 170 亿美元的投资。过去四年间,人工智能领域的民间投资以平均每年 62% 的增长速率增加,这一速率预计还会持续下去。

在群雄争霸的人工智能领域,苹果给人的感觉似乎是保守而缓慢的,而其他对手间的竞争却日趋白热化。

在 TensorFlow 之后,谷歌开源了其最精确自然语言解析器 SyntaxNet;而在开源其人工智能硬件平台 Big Sur 后,Facebook 也开源了其文本分类专用工具 fastText;而比 Facebook 更早,在谷歌宣布开源 TensorFlow 后的一周,微软也将开放人工智能学习系统 CNTK,包括多台服务器上展开训练的模块框架、一个主题建模算法,以及一个进行自然语言处理的文字嵌入算法。谷歌更是把公司战略从」移动优先」转为」人工智能优先」。希望通过人工智能协助用户获取想要的信息,或者帮助他完成各种各样的任务。

但这真的就意味着「迟到」的苹果没有机会了吗?

很多人应该都还记得,在今年苹果 WWDC 上,苹果的高管们公布了许多即将与用户见面的桌面及移动操作系统的新功能,人工智能,或者说,强大计算功能及软件算法的混合物赋予了这些系统强大功能。这种技术让手机及其他设备看起来更加智能,因为它可以预测用户行为。

在苹果看来,更多的人工智能和更多的与第三方服务集成,可以减轻用户疲劳,用户已经被太多的应用程序、设备以及数据搞得不堪重负。最终,后台的人工智能会简化用户操作,从管理用户与日俱增的相片、通信、高效使用网络服务,到减少不同设备间的切换。苹果的这一举动也恰逢其时,如今,科技巨头正与一波新创业公司竞相开发相似的人工智能产品。

将公司平台开放给第三方,对于苹果来说,也是一个让其不太舒服的历史时点,因为这家公司总想控制自身产品的质量及其整合性,这一不可按耐的冲动其实和人工智能趋势不合,后者更多强调的是第三方数据更多地被用来增加单个平台的服务数量。最初的 Siri 的确集成了许多第三方服务,不过,在卖给苹果后,这些第三方服务就被移除了。如今,为了抵抗外部压力,苹果兜了一圈又回到了原地。

在将主要应用开放给第三方过程中,苹果正在肯定硅谷中一个日益得到认同的观点,那就是用户正在寻求替代方案,不想在眼花缭乱的手机应用程序之间频繁切换。比如,不用打开一款应用,就可以叫车。如今,外部开发者可以直接将这些服务接入苹果信息平台。最近,脸书也在颇受欢迎的信息应用中启动了类似的功能。

当苹果的竞争对手们都已经在人工智能上有所行动和投资的时候,苹果的延迟策略是让各种功能和它的产品无缝连接起来,并避免潜在的错误。例如在去年,谷歌发布了一种(通过人脸识别技术)帮用户自动归类照片的工具。但是因为这个工具却错误地将非裔美国人归类为大猩猩。

库克此前的一次采访中展望,他希望苹果能持续进步。如果苹果的数据积累和数据中心建设足够顺利,苹果的人工智能就有希望以更快的速度甩开对手——「就像 9 年前的 iPhone 一样。」

参考文献

资讯 | 苹果 2 亿美元收购机器学习创业公司 Turi

业界 | 苹果 WWDC 的人工智能宣言,预示将迎来重大转型?

业界 | 苹果微软同时下手收购人工智能创业公司,但目的各有不同

业界 | 智能助理 Viv 发布 demo:来看看它有什么过人之处

深度|最强智能助理 Viv 明日发布,Siri 创始团队打造属于自己的人工智能系统

http://www.nytimes.com/2016/06/17/technology/apple-faces-an-artificial-intelligence-challenge.html?_r=0

https://www.technologyreview.com/s/602241/apple-lags-behind-google-and-facebook-on-ai/  

https://backchannel.com/an-exclusive-look-at-how-ai-and-machine-learning-work-at-apple-8dbfb131932b#.6lcvff9rl  


入门苹果人工助理产业硬件自动驾驶