吴欣整理

微软Build大会:押注更快的芯片并让计算无处不在

在微软的 2018 年度开发者大会演讲的开始,微软 CEO 萨蒂亚·纳德拉搬出了普适计算概念创始人 Mark Weiser 这样一句话:

「最深刻的技术是那些消失的技术,它们融入生活,变成生活。」这就像去年微软 Build 大会上,无处不在的云和 AI 、边缘计算占据了全部重点,到今年,这些策略已经成为实实在在的基础设施正通过不同平台形成从物联网、合作商到开发者的生态。

而「如何将微软关于智能云计算与智能边缘计算的愿景转化为现实」?这既是微软的大会讨论主题,也仍然是接下来需要反复应答的挑战。

让 AI 能力「拆箱即用」

「三年前,我在旧金山举办的 Build 大会上正式发布了微软认知服务。今天,已经有 100 万开发者使用了我们的服务。」微软全球执行副总裁、微软人工智能及微软研究事业部负责人沈向洋表示,「通过认知服务,我们为大家提供了最广泛的、可定制的人工智能技术,而且同时适用于云与边缘计算。」

不言而喻,输出 AI 能力最重要的还是要回到「好用」上,微软各个层面的 AI 技术正被越来越多地「组装整合」,让开发者可以更方便地构建和管理内置人工智能的解决方案。

比如,Azure 认知服务升级中包括了针对语音、对话机器人、搜索,其中与 Azure 搜索的集成是一项新功能。

统一语音服务,是把语音识别、文本到文本到语音转换、定制声音模型和翻译功能放在一起。对开发者而言,只用按需自定义就能方便改造自己的智能化应用。

认知服务和 Bot Framework 则是在功能上满足企业品牌化定位的需求,能和任何代理机器人实现无缝集成的同时,能完成更丰富和个性化的声音定制。从两年前萨提亚在 Build 大会上首次发布 Bot Framework 以来,已经有 30 万开发者参与尝试。

「对话机器人正在成为新的应用,这是一个不容忽视的前景。对于今天的开发者来说,你必须要懂得如何构建、部署和运行一个对话机器人。」沈向洋说,「我们看到了大量来自企业的推动和需求——他们要的不只是像微软小娜这样的智能助理,更需要可以用于人力资源管理、招聘、客户支持和服务等领域的业务机器人。」

除此之外,还有一个针对语音设备的开发工具包,在类似不停车点餐系统、车内或室内语音助手、智能扬声器等场景下,开发者可以通过其中降噪、远场声音识别等技术实现识别准确率

在基础层面,实时的人工智能推算能力至关重要,像是视频流、图像处理都是相当消耗资源的过程,但开发者仍然要面对批尺寸(batch size)和性能之间的矛盾。大会上发布的 Project Brainwave 预览版就是为解决这一问题而来。

Project Brainwave 是用于深层神经网络处理的架构可用于 Azure 与边缘环境,帮助 Azure 提速人工智能的实时运行,并且已经实现与 Azure 机器学习的完全整合。另外,Project Brainwave 预览版支持了英特尔的 FPGA 硬件的同时融合了 ResNet50 的神经网络,这意味着在一片拥抱专用芯片呼声中,微软坚定地站在了 FPGA (可编程门阵列)这一边。

除了工具和产品,微软也把微软研究院和人工智能事业部的资源开放出来。在沈向洋看来,微软始终坚持进行的尖端技术研究最终都要服务于开发者。他公布了一个叫做 AI.lab 的网站,这是向开发者提供人工智能实践的分享社区,任何想要学习人工智能的开发者都可以访问微软 AI School ,免费获得在线课程、指导和资源。

重仓智能边缘计算的机遇

从家庭到商业场合,不同种类的智能设备快速涌现,微软提供了一个预测,到 2020 年,其总数将超过 200 亿台。而这些设备区别于以往的数字化产品,它们甚至无需一直连接云端,就能具备看、听、推理、预测的能力。

「当每个人都在谈论云计算时,最有趣的部分就是云的边缘,」萨提亚曾说,「无论是 IoT行业、汽车行业或零售行业发生了什么,本质上都是在数据生成之处产生的计算,海量的设备,也就是云的边缘,不断产生数据并消耗计算能力。」

而这也意味着,从一个家庭、一个公司的办公室到医院手术室再到生产车间等不同环境下,都布满了智能边缘计算的可能性。

微软则用构建横跨 Azure,Microsoft 365 等平台新型应用的姿态迎接这个新机遇。「计算正变得无处不在,而智能边缘计算将会是下一个关键技术前沿。」微软全球执行副总裁、云计算与企业级事业部负责人Scott Guthrie 说。

Microsoft 365 是 Office 365、Windows 10 和企业移动+安全套件(EMS)的结合体,被微软视为智能边缘计算的关键组成部分。从大会上公布的数据来看,其商业月活跃用户数已经超过 1.35 亿,而联网的 Windows 10 设备有将近 7 亿台。

针对这一庞大人群,微软发布了在 Microsoft 365 使用的智能化开发工具,包括让开发者和组织在 Excel 中自行编制计算公式的 Azure 机器学习和 JavaScript 定制功能,以及能在智能云上开发机器学习模型并实现离线部署在本地以高性能模式运行的 Windows 机器学习平台等。

针对外部用户,微软也推出了帮助他们进入边缘计算领域的服务。

Azure IoT Edge 边缘运算服务是在去年 Build 大会提出来,简单说就是在不用事事都上云端的情况下,把 Azure 服务、定制工具及 AI 服务带向前端物联网装置上,减少资料传输云端往反的延迟时间。

今年,在此基础上,微软开源了 Azure IoTEdge Runtime ,让用户能够对边缘应用进行修改、调试,并拥有更高的透明度和控制能力。在提供的服务方面,主要集中在视觉能力上:

一方面,微软宣布与高通合作,打造运行 Azure IoT Edge 的视觉人工智能开发工具包,为开发基于摄像头的物联网解决方案提供软硬件支持。由此,除了 Azure 机器学习服务,开发者可以用到高通视觉智能平台和人工智能引擎的硬件加速开发应用解决方案。

另一方面,在 Azure IoT Edge 上可以运行定制化的视觉服务,让无人机或工业装备可以在不联网的状态下快速响应。

大会上,微软还宣布了与大疆创新(DJI)的战略合作,为大疆无人机带来先进的人工智能机器学习能力,帮助企业用户更好地驾驭商用无人机与智能边缘云计算。合作主要集中在面向 Windows 10 电脑的全新开发工具包(SDK),向全球 7 亿Windows 10 活跃设备提供完整的飞行控制和实时数据传输功能。作为这项商业合作的组成部分,大疆创新和微软还将利用Azure IOT Edge 和微软人工智能服务合作开发适用于农业、建筑行业、公共安全及更多应用场景的解决方案。

产业微软开发者大会云计算芯片
相关数据
人工智能技术
Artificial Intelligence

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经网络技术
Neural Network

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

无人机技术
Drones

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

图像处理技术
Image processing

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

机器学习技术
Machine Learning

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

机器人学技术
Robotics

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

语音识别技术
Speech Recognition

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

普适计算技术
Ubiquitous computing

普适计算是一个强调和环境融为一体的计算概念,而计算机本身则从人们的视线里消失。在普适计算的模式下,人们能够在任何时间、任何地点、以任何方式进行信息的获取与处理。普适计算是一个涉及研究范围很广的课题,包括分布式计算、移动计算、人机交互、人工智能、嵌入式系统、感知网络以及信息融合等多方面技术的融合。

批次规模技术
batch size

一个批次中的样本数。例如,SGD 的批次规模为 1,而小批次的规模通常介于 10 到 1000 之间。批次规模在训练和推断期间通常是固定的;不过,TensorFlow 允许使用动态批次规模。

物联网技术
Internet of Things

物联网(英语:Internet of Things,缩写IoT)是互联网、传统电信网等信息承载体,让所有能行使独立功能的普通物体实现互联互通的网络。物联网一般为无线网,而由于每个人周围的设备可以达到一千至五千个,所以物联网可能要包含500兆至一千兆个物体。在物联网上,每个人都可以应用电子标签将真实的物体上网联结,在物联网上都可以查出它们的具体位置。通过物联网可以用中心计算机对机器、设备、人员进行集中管理、控制,也可以对家庭设备、汽车进行遥控,以及搜索位置、防止物品被盗等,类似自动化操控系统,同时通过收集这些小事的数据,最后可以聚集成大数据,包含重新设计道路以减少车祸、都市更新、灾害预测与犯罪防治、流行病控制等等社会的重大改变,实现物和物相联。

英特尔机构
Intel

英特尔是计算创新领域的全球领先厂商,致力于拓展科技疆界,让最精彩体验成为可能。英特尔创始于1968年,已拥有近半个世纪产品创新和引领市场的经验。英特尔1971年推出了世界上第一个微处理器,后来又促进了计算机和互联网的革命,改变了整个世界的进程。如今,英特尔正转型成为一家数据公司,制定了清晰的数据战略,凭借云和数据中心、物联网、存储、FPGA以及5G构成的增长良性循环,提供独到价值,驱动日益发展的智能互联世界。英特尔专注于技术创新,同时也积极支持中国的自主创新,与产业伙伴携手推动智能互联的发展。基于明确的数据战略和智能互联全栈实力,英特尔瞄准人工智能、无人驾驶、5G、精准医疗、体育等关键领域,与中国深度合作。面向未来,英特尔致力于做中国高价值合作伙伴,在新科技、新经济、新消费三个方面,着力驱动产业协同创新,为实体经济增值,促进消费升级。

涉及领域
准确率技术
Accuracy

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

云计算技术
Cloud Computing

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

边缘计算技术
Edge Computing

马克·韦泽人物
Mark Weiser

Mark Weiser(马克·韦泽)出生于美国伊利诺斯州。他是Conrad Weiser的后裔。韦泽于1970进入新佛罗里达学院,但并没有留在该学院毕业。他在密歇根大学学习计算机和通信科学,在1977获得硕士学位,1979拿到博士学位。众所周知,他在前往博士学位的路上绕过了学士学位。之后他在马里兰大学计算机科学系教了八年。韦泽被广泛认为是ubiquitous computing(普适计算)之父,这是他在1988创造的一个术语。

推荐文章