苹果发布机器学习博客,分享公司研究成果

资讯

Google Glass「复活」,面向工业改进硬件


前天,Google Glass 发布了企业版本(Enterprise Edition)Glass EE,并给出了在制造、物流和医疗领域的四家公司的四个用例。这是该团队自 2015 年 1 月宣布停止生产当期版本的 Google Glass 后的第一次重大发布。「我们一直没闲着」Glass 的首页标题如是说。

诞生于谷歌创始人谢尔盖·布林的一个兴趣项目的 Google Glass 原本被定位成一款消费产品,而本次 Glass EE 的更新主要针对如何能让 Google Glass 更好服务于企业级客户。硬件方面的更新包括升级处理器、将相机模块从 500 万像素提升到 800 万像素、提高电池寿命、添加录像指示灯和提高 Wi-Fi 速度。然而最重要的更新还是 Glass EE 模块与集成镜架的完全剥离,这意味着 Glass EE 能够被部署到现有的任何镜架,尤其是工业用护目镜上。

在谷歌给出的企业用例中,拥有 800 余名员工的大型农机制造商 AGCO 用 Glass EE 代替了传统的笔记本电脑,使得员工不需要终止操作流程,走 15 米,看电脑指示,再回来继续工作。Glass EE 能够放大特点部分,告诉工人需要何种螺栓,指定某一种扳手并计算所需的扭矩,工人可以通过扫眼镜边缘或者通过语音指令进入下一步。

苹果发布机器学习博客,分享公司研究成果

以神秘著称的苹果开博了,名为「苹果机器学习期刊」的博客让苹果的工程师来讲述如何将机器学习技术应用在他们的工作中,为全世界成千上万的用户构建创新产品。博客主要面向机器学习研究者、学生、工程师和开发人员。第一篇博文中,技术人员介绍了改善合成图像(synthetic images)质量的方法,合成图像技术主要被用于低成本、高效率的大型标注数据集的构建。

此举被视为苹果获取关注与吸引人才的手段。近来,并没有新「爆款」发布的苹果被普遍视为在人工智能领域「先发后至」,已经落后其竞争对手一个身位。而开放技术博客,定期讨论最前沿的、令人兴奋的新研究无疑是攫取公众注意的好办法。而在新博客首页下方的「向博客提问」、「职位信息」和「开发者项目」三个链接,则展现了苹果不遗余力吸引行业人才与公司进行交流的思路。

联想举办第三届 Tech World,首次公布 AI 战略布局

今天上午,联想集团第三届 Tech World 在上海世博中心举行,首次对外公布了其在人工智能领域的战略和布局。联想集团高级副总裁兼首席技术官芮勇博士表示,未来联想将重点发力在「设备+云」和「设施+云」两大领域,在智能设备、智能云平台和智能服务三个技术方向加强投入。作为技术支持,联想还将在中国北京、美国莫里斯维尔、德国斯图加特三地设立 AI 创新中心。

联想在现场展示了多款基于不同场景的 AI 应用,包括智能心电衣 Smart Vest、智能音箱 SmartCast+、智能眼镜晨星(daystAR)、虚拟智能助手咔哇(CAVA)等。其中 Smart Vest 是全球首款 12 导联的无线智能心电衣,可实现对人体心脏活动的 360 度立体式感知与健康监控。此外,联想还宣布与京东合作打造 AI 大数据平台,与蔚来汽车联合开发智能汽车计算平台。

富士通加入深度学习硬件大军

深度学习热潮里对 GPU 的高需求让英伟达的收入和股价一同飙升,而谷歌的 TPU、英特尔即将公布的 Lake Crest 深度学习专用芯片和 AMD 的 Vega 显卡也纷纷瞄准深度学习发力。日前,日本半导体和电脑制造商富士通也公布了其建立人工智能处理器的计划,正式「跳坑」深度学习硬件。

据悉,富士通将在 2018 财年(2018 年 3 月至 2019 年 3 月)开发名为 DLU(Deep Learning Unit)的人工智能处理器,富士通 AI 平台事业部高级主管丸山称,DLU 芯片将在单位耗电量性能方面提高十倍的提升。


室内自动驾驶机器人公司 Brain Corp 获 1.14 亿美元 C 轮投资

来自圣地亚哥的自动驾驶机器人公司 Brain Corp 获得了软银 Vision 基金领投、高通风投跟投的 1.14 亿美元 C 轮融资。公司的主要产品为 BrainOS 机器人操作系统平台,旨在让开发者能够通过开架的硬件和传感器搭建商用自动驾驶机器人。BrainOS 平台包括专用于室内的自动驾驶 AI 技术和避障模块,平台以 SaaS 的形式销售其平台,客户缴纳订阅费并将技术用于自己的机器人。公司认为,在未来,机器人会「像电脑和手机一样普遍」。


应用


AI 3D 模型绑定:帮动画工程师完成 90% 的工作

3D 动画以耗时和昂贵著称,只有迪斯尼、皮克斯这样的大公司能够支撑足够多动画工程师花费大量时间开发相关系统。开发中最复杂的过程之一叫做「绑定」(rigging),即给一个拥有几百万乃至上千万面的人物模型建立骨骼、控制点,而后进行蒙皮,确定每个控制点对肌肉和骨骼的影响程度,进而通过动作捕捉或人为参数设定控制整个模型的活动。近期,在深度学习,尤其是生成模型方面的进步,给动画创作提供了更多可能性。

例如 Mixamo,一家在 2015 年被 Adobe 收购的公司,开发了一款自动绑定工具,让用户能够上传 3D 模型,打好控制点之后一键进行皮肤参数计算。更进一步,一家由 Absentia 公司开发的,名为 Norah AI 的动画软件连想象与创作的工作都帮你做好了。Norah 的训练集包含了超过 50 万帧动画,学习了各种可以想象到到的动作。而你可以利用「风格转移工具」将已有的动画片断重新组合,生成一段新的,构建一个无限大的片段库。而「AutoRig」则帮助动画工程师从骨骼和肌肉参数开始生成动画——连控制点都不用打。「Motion Editor」让用户可以生成无穷的动作变换,并把原来的帧到帧手动平滑过程交给了机器完成。

简言之,动画设计的视野与流程在深度学习时代都变得不同,随着动画制作的技术壁垒进一步降低,对创意的要求会越来越高。

AI 确诊:你的头疼起因于 20 年前的脑震荡

蒙特利尔大学、麦吉尔大学和 Ludmer 神经信息学研究中心在《欧洲神经科学杂志》上发表了一项研究,旨在用人工智能技术分析心理测试、基因型、结构神经成像、核磁共振扫描图等多种数据,检测脑震荡的长期影响。

美国每年有 160 万至 380 万起脑震荡病历,短期内,医生可以通过脑出血等显性症状进行诊断,然而对于可能持续数年的长期影响,医学上却缺乏将临床症状与脑震荡直接联系起来的方法。因此,科学家们招募了年龄在 51 到 75 岁的前冰球与橄榄球运动员,分成了患病组与对照组,收集了多种数据并建立深度学习模型进行检测,达到了 90% 的准确率。研究人员希望在今后能够扩大样本和检测手段,并与其他神经系统疾病进行对照,找到脑震荡的确切识别标志,以帮助医生进行脑震荡的长期诊断。

观点


AI 对世界战略格局的影响不亚于核武器

科技评论员 Tom Simonite 昨日于 WIRED 发文,列举了人工智能可能对战争产生的影响。他援引了华盛顿特区无党派智囊团 Center for New American Security 的报告,将人工智能技术与一战前被世界各国联名禁止军用的飞机技术,以及至今仍被限制于少数国家的核武器类比,称这是一类「不可抗拒」的技术,并将需要更多的国际条约约束。

无人机、机器黑客、能够生成以假乱真视频的模型都会对国防安全提出新挑战。AI 和相关技术能够让较小的国家与组织能够更轻易地获得威胁超级大国、破坏国际权力平衡的能力。如同核武器一样具有杀伤力的技术正在免费而快速的传播,ISIS 已经开始用商用四旋翼投掷手榴弹了。

另一方面,自动武器的研发则触发了一个道德敏感点:机器是否能够决定人的生死。2015 年,超过 3000 名来自谷歌、微软等公司的科学家和管理人员向奥巴马政府发出了联名信,要求禁止自动武器。美国国防部在 2012 年发布的要求「人必须参与致命武力的使用决定」的临时政策在今年 5 月成为了永久政策。哈佛大学的一份报告建议,国家安全委员会、国防部和国务院等机构从现在开始着手进行国际上的联合人工智能军事条约制定。牛津大学研究人工智能对社会影响的学者 Miles Brundage 认为,以 AI 为内容进行的合作和对话外交将是极为有效的。

自动驾驶行业监管的「钥匙」已落入大公司手中

当地时间 19 号,美国众议院电子商务和消费者保护委员会举行了听证会,审定与自动驾驶相关的一系列法案。这些法案将允许汽车制造商和科技公司无需遵循现行安全标准而部署数十万辆自动驾驶汽车上路。令人惊讶的是民主党和共和党议员对此项政策表现出了难得一致地支持态度。政策分析师、评论家纷纷发声反对,认为这一行为将危害消费者的安全和知情权。

多次在相关听证会上作证的前海军飞行员、杜克大学人类学与自动化实验室负责人 Missy Cummings 表示,「进行自动驾驶研发的公司为安全性做出的投入太少了,这让我十分担忧。」例如,国会正在权衡是否要取消对于自动驾驶车辆事故数据的强制披露,并且将重新审查期定为 5 年。「整整五年时间里,大公司都无需遵守严格的测试要求、质量要求,就能把一百万辆自动驾驶车辆开到公众面前。」

评论家 John Simpson 的观点更为激进:「公共高速公路将成为大公司的私人实验室,我们只能祈祷他们大发慈悲,考虑一下我们的安全。」

自动驾驶汽车的安全性仍有待证明,而在此之前,美国政府机构似乎已经对相关公司敞开怀抱了。

图说


举个例子帮你分清人工智能、机器学习、深度学习

             

ARK 投资公司在一份分析 IBM Watson 技术储备的报告中将人工智能领域经常被提及的技术进行了分类,今天我们借用这张图区分一下「人工智能、机器学习、深度学习」这几个经常被错误混用概念。

简而言之,机器学习是人工智能的子集、深度学习是机器学习的子集。

「人工智能」泛指以机器模拟人的「认知」功能的做法,然而模拟方法不拘于「学习」:在死记硬背了足够多的规则之后,一台渊博的机器也可以在解决特定问题上获得类似人的能力。在「不涉及机器学习的人工智能」这个类别里,知名的例子有击败了国际象棋世界冠军的电脑「深蓝」,它基于规则每秒钟完成 2 亿步棋的搜索。编码了超过 320 万条规则的 Cyc 始于上世纪 80 年代,它可以根据「每棵树都是植物」,「植物最终都会死亡」推断出「树会死亡」。

「机器学习」是「人工智能」的子集,它的「学习」能力体现在不需要严格设定好的静态指令,也可以基于数据寻找规律并进行预测与决策。因此机器学习算法需要进行「训练」过程来寻找这样的规律。传统机器学习寻找规律的方法是人类给出的,常见的方法包括决策树、聚类等等。在「不涉及深度学习的机器学习」这个领域里面的例子有 IBM Watson,它是一个问答系统,当你对它提出一个问题,Watson 首先对自己的知识库进行检索找出一些可能的答案,进而检索证据库对可能的答案进行打分,最后通过整合和排序,给出答案。这个类别中的技术还有谷歌的 PageRank 搜索排序技术、垃圾邮件检测器、Netflix 的推荐系统等。

「深度学习」是「机器学习」的子集,它专指利用了「深度神经网络」的技术,它和传统机器学习最大的区别在于不需要人来告诉机器如何寻找规律,而是给出机器尽可能多的例子让它们自行「找不同」,事实证明,拥有足够强大计算能力的机器在「找不同」事业上确实胜过人。然而完全放手给机器的坏处是,我们虽然可以利用这种能力,却无法理解它——起码现在,科学家们还没找到办法让机器告诉我们「为什么这张图是猫而不是狗」,以及「为什么这步棋要下在这儿」。「深度学习」子集中的典型案例包括下围棋的 AlphaGo、能够找出照片里有哪些人的 Google Photos 以及会跟车也会变道的特斯拉 AutoPilot 等。

入门AIDaily苹果产业谷歌