云中生智,智领前沿——云端赋能下企业AI落地  

分享在京东智联云基础能力的加持下,以京东AI在各个领域环节的技术创新,积极探索包括产创云平台、 DevOps 开发测试实践、企业智能化供应链建设以及AI模型开发赋能零售场景等在内的多个角度,针对企业AI落地提供可行性建议,并与开发者们展开深入探讨。

当前,大数据、物联网、人工智能云计算等智能技术手段已经逐步成熟,并迎来“核聚变”发展态势,万物互联、万物互通的时代悄然而至,创新驱动发展,“智能+”成了新引擎。

8月17日,“云中升智,探索基于机器学习的AI业务优化实践”京东智联云开发者社区技术沙龙在南京举办,来自京东英特尔的六位技术专家为参会者带来了一场知识盛宴。

本期技术沙龙聚焦“机器学习”与“计算机视觉”,揭秘京东 AI 在智慧零售、智慧物流、智慧金融等领域的生态布局与解决方案,讲解京东拍照购、以图搜图、智能鉴黄等技术的实现原理, Intel如何有效将 AI 部署到边缘端。同时,展示基于容器技术的开发测试流水线的最佳实践。

云中生智慧 

— 探索基于机器学习的AI业务优化实践 —

01

陈勇&马廷卫

探索产创云AI开发服务平台

解读基于 DevOps 的开发测试最佳实践

今年,京东云将智能产业创新聚焦南京,将京东云智能产业华东区域总部落户在南京,并在南京正式发布“产业创新云”。“产业创新云”(以下简称“产创云”)是基于京东自有的人工智能、物联网、云计算等技术能力,围绕容器、开发测试流水线、微服务等云原生技术构建的一站式支撑平台。

来自京东云的高级架构师陈勇及京东云高级架构师马廷卫,现场介绍了产创云平台的价值及支持政策,并为开发者解读产创云容器集群及资源管理,解读基于容器的 DevOps 的开发测试流水线最佳实践。

产创云从全云化的技术架构上提供了IaaS资源、PaaS平台以及SaaS应用,并将京东区块链、AI、IoT相关的技术整合在此,开发者可以基于相关的技术,通过SDK在平台上开发自己的产品。除此之外,产创云围绕产业链的研、采、供、销、服五个阶段,围绕产品创新、产业孵化、产业加速、规模销售,还有持续运营、可循环的几个阶段,助力创新企业发展,打造智能产业集群。

在产创云的平台架构设计上,京东云设计了三个中心,包括数据的接入、技术的接入,中间围绕软件的生命周期,从软件前期的需求、设计再到测试,再到部署。

为了帮助企业节约开发、测试、部署的时间,完成持续集成和部署,京东智联云设计了基于容器的CI/CD的开发测试流水线,借助Kubernetes集群服务,创建以容器为单位的开发测试部署流程,简化了环境搭建的步骤,提高了资源利用效率和开发测试部署的速度,降低了迁移的成本。

02

宗婷婷

打造智能商业体,解读京东 AI 全景图

大数据、区块链人工智能、信息安全以及云计算被认为是数字经济时代的五项核心技术。五大技术相互融合,共同推动数字新经济的高速度高质量发展。在此趋势下,京东作为以技术驱动、数据智能为核心的科技企业,坚定地朝着技术转型,致力于打造一个包括智能零售、智能金融、智能保险、智能城市、智能医疗等在内的全球领先的智能商业体。

京东智联云资深云计算布道师宗婷婷,在现场为开发者解读了京东 AI 在各个产业的生态布局、京东 AI 各类落地场景和解决方案,并提供京东智联云对 AI 开发者的支持方案。

在五项核心技术中,云计算在数字经济时代里面承担了整个产业的操作系统的角色,它是承载一切资源、能力、基础和连接的大的业务平台。而京东超级电商成就了超级云,超级云反过来又辅助超级电商。

在此基础上,依托于京东集团范零售丰富的场景、洞察能力和技术沉淀,京东将具有产业属性的AI能力全盘输出,赋能伙伴,成就客户。

智能零售

智能零售分为两大部分:线上零售和线下零售。线上零售围绕京东商城,包括以图搜图、拍照购、AI审核、智能客服等方案。其中,智能客服作为京东非常成功的线上场景,提供一整套的解决方案,包括客服人工的智能处理,后台的各种客服大脑、大数据分析等一系列的服务。

比如有一个客户想要发起一次客服活动,首先要进行前台的预判,通过描述事情的严重程度和类型,结合客户本身的资料,以及购物的数据,智能客服会进行预判,决定把你分到人工客服还是AI辅助,还是完全AI客户。

image.png

智能供应链是零售企业的核心,决定了企业的竞争能力。传统模式下,采销人员要依靠数据和自身的经验完成商品选择、采购计划制定、价格制定、库存管理等复杂工作。随着电商规模的迅速扩大,如果不能进行精准高效的供应链管理,不仅会降低零售企业的竞争力,更会造成包括上游制造企业在内的行业效率降低。京东从消费者洞察作为原点,借助大数据和人工智能技术的应用,融合过去14年的零售经验积累,与各方合作伙伴一起,打造敏捷、智慧、开放的智能零售供应链。

image.png

智能物流

京东的智物能流是一个完整的体系,无人仓解决进货、拣货、包装等环节,无人车主攻城市环境下的最后一公里配送,无人机则锁定乡村配送。

无人仓作为全新一代智能物流技术,其核心特色体现为数据感知、机器人融入和算法指导生产,可以全面改变目前仓储的运行模式,极大提升效率并降低人力消耗。从商品入库、存储拣货、包装、分拣、装车的环节都无需人力参与,搬运机器人成了无人仓的主角。京东于2017年在上海打造中小型无人仓,单仓的产能超过20万单。2018年进入无人仓设备的常态化和规模化应用的一年,大量的智慧化设备在物流的仓库开始应用。

除此之外,京东拥有多场景无人智能产品,如末端配送机器人、巡检机器人、干支线自动驾驶货车、服务机器人等。作为智慧物流体系的重要一环,末端的京东配送机器人自2017年在人大、清华、浙大、长安几所高校就开始进行配送实验,未来还会在全国各地的封闭式园区、校园,类似于生态城这种开放式的城市道路配送,并迈向普通社会化道路,解决城市配送最后一公里难题。

智能金融

京东智能金融服务将传统的风控体系智能化,依托京东庞大的用户和交易量数据以及关联外部合作伙伴洞察资源,在注册、登录、营销、交易等多个核心场景建立标签和策略,其全魔方产品,能够实现对申请欺诈、信用欺诈、账户盗用、洗钱、羊毛党、虚假交易及黑产等行为的防范。

智能保险

在保险方面, 京东安联已经尝试利用大数据及人工智能,来改变传统核保理赔的方式。另外,京东安联将逐步使用AI机器人替代传统客服,一个机器人的成本相当于人工成本的10分之一,AI技术部署算法越多,它的学习能力越强,成本也就越低。

同时京东安联也正在尝试通过一系列的技术手段,优化保险交易的各个环节,使产品更简单易懂,流程变得更为顺畅。

image.png03

于伟

看得见的AI,计算机视觉的原理及最佳实践

作为人工智能最火热的细分领域之一,无论是智慧零售还是智慧物流,都离不开计算机视觉技术的应用。来自京东人工智能业务部研究员于伟,在现场以京东智慧零售场景为基础,向开发者解读人工智能在视觉领域的技术原理,并介绍了京东拍照购、以图搜图、商品识别、智能鉴黄等计算机视觉技术的最佳实践。

如下图所示,京东现有计算机视觉技术的概览可以分成五部分,由上至下分别为,文字识别、人体、人脸、视频和图像。

image.png

在智慧零售中,依靠领先的视觉算法、海量的有效数据、稳定的服务架构,京东计算机视觉技术在多模态购物、内容审核、创新应用、Neuhub开放平台四个场景中得到了成功的运用案例。

拍照购

首先是多模态购物——拍照购,拍照购的应用场景分为京东云APP及拍照购小程序,作为帮助导购的索引以SDK的形式快速集成到其他的应用当中。

其中,拍照购主要面临商品形变、商品拍摄角度不同、商品包装不同、商品状态不同、商品类别不同等技术挑。计算机视觉技术的目的就是要消除目标商品与拍摄商品的不一致性,将不同场景下的相应商品对应起来。拍照购的框架分为线上及线下两部分,涉及商品主体完整度判别、商品清晰度判别以及优质透底图的判别等步骤。

除此之外,拍照购可自动定位图像的商品主体,给出商品主体框坐标、检测置信度、类别等信息,覆盖裙装、上衣、下衣、鞋子、数码、食品、美妆、图书、药品、绿植等24个品类,并支持多商品主体检测,可输出多个商品主体,区分不同商品主体的显著性。

内容审核

内容审核的出发点主要是为了规避公安系统的风险事件的发生,提高图片质量,提高用户体验,以及降低人工成本。

智能鉴黄,可以自动识别黄图、性感、低俗和正常图片,是图片内容合规审核的重要组成部分,减少人工成本,提高审核效率,具体流程如下图所示.

image.png

依托电商场景海量丰富的数据,京东的智能鉴黄准确率高达99%,可根据业务自身进行配置,自定义阈值,灵活度高,可支持对电商,社交,视频等多场景进行安全审核。

与上述方法类似,京东的内容审核场景还包括特定人物识别、刀具枪支审核、牛皮鲜识别以及不适图识别等场景。

04

张星

人工智能部署到边缘设备

英特尔® Movidius™ VPU全解读

计算机视觉深度学习正在成为我们日常生活中的数十亿设备的标配。让设备具备类似于人类的视觉与智能,是计算领域的下一波重大进步。英特尔® Movidius™ VPU可以有效的将人工智能技术部署到物联网设备边缘端。

来自英特尔物联网事业部VPU平台应用工程师张星,为开发者介绍了Myriad X 和第二代神经计算棒,解读了英特尔® Movidius™ VPU 特性、能力以及应用场景,并分享英特尔边缘计算产品的最佳实践案例。

Myriad X是英特尔Movidius最新一代的VPU,它是一款低功耗的SoC,可以用在高能效图象处理、计算机视觉深度学习的设备里面,包括服务机器人、监控摄像头、可穿戴设备、无人机、AR-VR头盔和智能家居设备等。相比上一代产品Myriad 2,Myriad X多了一个神经计算引擎(Neural Compute Engine),这是一个集成在芯片上的DNN加速器。有了这个加速器,深度学习推断吞吐量可以达到1TOPS,也就是每秒超过1万亿次运算,理论峰值可以达到4TOPS。英特尔Movidius VPU的微小尺寸和优越的每瓦特计算性能极大的满足了广大用户对计算机视觉深度学习在终端设备上的需求。

image.png

当下,大部分开发者已经有了经过训练的网络模型,但是由于推理平台能力有限,只能把网络模型的一部分放到推理平台之上,又或者想要提升终端性能但不知道该如何选型,以及目前使用的人工智能框架不被英特尔的产品支持,无法导入到Movidius或者FPGA平台。

而OpenVINO正是为解决如上问题所推出的,它是一个高性能计算机视觉深度学习视觉应用开发的工具套件,能够支持英特尔平台的各种加速器,包括CPU、GPU、FPGA以及Movidius的VPU等,支持异构计算,并可帮助开发者把已经训练好的网络模型部署到目标平台之上进行推理操作。

随后,张星向开发者介绍了英特尔第二代神经计算棒——NCS2。英特尔NCS2基于英特尔Movidius Myriad X视觉处理单元(VPU),并得到英特尔 OpenVINO工具包的支持,与上一代神经计算棒相比性能更优,能够以可负担的成本加快深度神经网络推理应用的开发。同时,英特尔NCS2支持深度神经网络测试、调整和原型制作,可以帮助开发者进入实际应用的量产阶段。

近年来,京东不断运用深度学习度量学习等 AI 领域知识优化自身电商平台,让其从冷冰冰的系统不断成长为越来越懂用户的智能购物助手。

05

陈东东

基于机器学习的智能营销人货匹配技术

来自京东人工智能业务部算法工程师陈东东,在现场展示了机器学习在人货匹配中的核心应用,包括用户需求预测、用户及商品网络相似度学习,用户商品匹配学习,并对度量学习基本方法及其在电商平台的应用进行介绍。

人货匹配模型

人货匹配模型是指在一个确定场景任务下,计算用户与商品的匹配程度 。经典的应用场景包括智能广告投放、智能客服调度、用户需求预测等。

假设需要预测一位用户是否会购买产品。方案一为利用客户的历史数据做0/1分类,但是该方案没有考虑到商品的特点;方案二在方案一的基础上将用户的历史行为数据结合商品的属性做一个分类,但是该方法在开始的时候就将用户和商品进行了特征的串联,由于用户和商品来自不同的空间,所以直接串联是不太合适的,于是京东AI将方案二进一步优化,在同一个公共子空间计算用户和商品的匹配程度。

如下图所示,假设分别对用户和商品通过两个深度神经网络投影到一个公共子空间下,而后训练数据通过一些简单的距离计算方式判别用户和商品之间的匹配程度。当模型训练过后,把距离通过一个F函数,F函数将距离转化为0到1的概率,用这个值表示用户对商品的购买概率。再基于这个概率构造一个损失函数,这样训练完模型之后,就可以得到对购买概率的一个预测值。

image.png

与前两种方法相比,京东AI的方案可以使得Embedding有意义 ,可以加入商品相似度的信息,利用用户的加购、收藏等更多的标记信息,同时能对新品表示出更好的泛化能力。

那么相似的商品是如何学习的呢?

如下图所示,假设已经事先知道商品X和Y之间是比商品X和Z更相似,也就是X和Y之间的距离比X和Z更小。这种情况下,京东同时把三个商品通过共享权重的深度网络,得到三个向量,然后直接在得到的Embedding的空间去约束它们之间的距离关系。这就要求X和Y相似商品之间的距离至少比X和Z的距离小于Margin β,基于这样的Margin loss去加入到约束里面,更好的学习网络I。

image.png

可能有人会问了,如果我已经知道两个商品是相似的,为什么还要重复的再加一个网络去学习?这里有一个很重要的一点,如果来的是一个新的品类,你并不知道这个新的品类和哪些商品是相似的,如果你学习了这样的网络,把这个新品通过这个网络就可以很好的得到它的Embedding,就可以计算它和原来的相似性。

深度度量学习

度量学习也叫作相似度学习。度量学习旨在学习一个恰当的相似性(距离)度量,使相同类别样本之间的相似度增大(或距离减小),不同类别样本之间的相似度减小(或距离增大),从而实现提高分类器的判别能力、改善匹配及聚类性能等目的。而深度度量学习则是利用深度神经网络去学习距离度量的表示。

深度度量学习主要关注两个问题:损失函数如何设计以及怎样对样本进行采样。

image.png

虽然看起来是比较简单的loss,但是这里面产生了大量的变体。第一类变体主要集中于DIJ怎么去计算,最基本的是用欧式距离计算DIJ,还有曼哈顿距离、余弦距离,或者卡方距离计算DIJ。

Triplet-style loss它的输入是针对三元组,在变换之后的空间里面要求两个相对更近的商品之间的距离,比两个没有那么近的距离小于一个margin α,基于这样的loss去求网络的参数

image.png

在分享最后,陈东东向开发者介绍了当前度量学习的热点——如何更好地扩展度量空间。他认为,一种是生成虚拟样本,虽然没有见过测试集样本,但是可以基于已有的训练集生成更多的样本,可采用生成式的方法生成样本,也可以用几何的方法生成样本;另一种是集成学习的方法,可通过输入数据、输出标记、模型参数生成多样性,扩展度量空间。

此次活动吸引了200名开发者的到场参与,大家从云计算人工智能、IT运维等专业领域,畅谈智能时代的热点和产业趋势,并高度评价此次活动。

京东智联云开发者
京东智联云开发者

京东智联云开发者(JD Cloud & AI Developer)是京东集团旗下为AI、云计算、IoT等相关领域开发者提供技术分享交流的平台。平台将发布产品技术信息、行业技术内容、技术活动及大赛等资讯。拥抱技术,与开发者携手预见未来!

产业智能供应链AI
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

集成学习技术

集成学习是指使用多种兼容的学习算法/模型来执行单个任务的技术,目的是为了得到更佳的预测表现。集成学习的主要方法可归类为三大类: 堆叠(Stacking)、提升(Boosting) 和 装袋(Bagging/bootstrapaggregating)。其中最流行的方法包括随机森林、梯度提升、AdaBoost、梯度提升决策树(GBDT)和XGBoost。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

度量学习技术

即学习一个度量空间,在该空间中的学习异常高效,这种方法多用于小样本分类。直观来看,如果我们的目标是从少量样本图像中学习,那么一个简单的方法就是对比你想进行分类的图像和已有的样本图像。但是,正如你可能想到的那样,在像素空间里进行图像对比的效果并不好。不过,你可以训练一个 Siamese 网络或在学习的度量空间里进行图像对比。与前一个方法类似,元学习通过梯度下降(或者其他神经网络优化器)来进行,而学习者对应对比机制,即在元学习度量空间里对比最近邻。这些方法用于小样本分类时效果很好,不过度量学习方法的效果尚未在回归或强化学习等其他元学习领域中验证。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

卡方技术

卡方常常与卡方分布和卡方检验联系在一起: 卡方分布(chi-square distribution)是常用于概率论和统计检验中的一种概率分布;卡方检验是(chi-square test)是一种基于卡方分布的常用的统计检验,其统计量在原假设(null hypothesis)成立时服从卡方分布。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

推荐文章
暂无评论
暂无评论~