阿里行人重识别(ReID)算法效果刷新业内最好成绩

近日,阿里巴巴机器智能技术实验室在行人重识别(Person Re-identification)算法上获得突破性成果。该技术团队通过最新算法,在不使用任何时序信息的情况下,在行人重识别主流数据库(Market1501,DukeMTMC-reid和CUHK03)上各项指标均取得第一的好成绩,刷新了业内的最好成绩。

其性能的提高主要来源于技术层面的创新:该团队通过局部信息的挖掘,致力于解决行人在识别过程中表观姿态变化剧烈,不容易对齐的问题。一方面,通过人体语义分割得到具有强语义信息的部件,并利用注意力机制在其中寻找最具有区分性的区域。另一方面,使用了基于金字塔的水平分块策略,得到行人固定区域的可辨识信息。在训练中,同时采用两种策略相结合的方式,达到行人图片的对齐,从而实现更精准的匹配识别。通过技术上的改进,该方法在三个公开数据库上的效果均优于之前最好方法,特别是mAP指标,分别提升了2%,1.87%,3.39%。

近年来,行人重识别技术在业内得到了越来越多的关注,仅CVPR2018就有将近30多篇文章专注于行人重识别问题的研究。随着行人重识别技术的日渐成熟,其巨大的应用价值和市场潜力得到了越来越多的关注。

不管是老牌的安防公司如海康威视,浙江大华,还是新晋独角兽旷世科技,商汤科技,还有传统的互联网巨头,BAT,华为等,都对行人重识别非常关注,在算法,数据和人才等各个方面上进行着布局和积累。此次阿里巴巴机器智能技术实验室在行人重识别算法的突破,为其在XXX领域相关技术方案落地奠定了稳固基础。

行人重识别落地应用点:

1、在公共安全领域,行人重识别一方面能够帮助快速筛查可疑人员,建立快速反应安全防控机制、精准重拳打击犯罪,如精准查找黄牛党,预防公共安全事故发生。另一方面,在机场、车站等人流拥挤的公共区域,利用行人重识别技术,可以实现走失儿童和老人的快速查找。对维护人民群众切身利益,营造平安环境有着不可估量的作用。

2、在新零售领域,通过行人重识别技术,可以获取顾客的行为轨迹,获得顾客的数字化信息,帮助商家挖掘更多的商业价值,同时为客户提供定制化服务。可以实现零售场景内的全程无感知体验,并能对各种突发事件做出及时的响应。

除了应用在线下零售解决方案中,行人重识别与人脸识别技术的相结合,可以用来打通线上、线下零售场景,提供“一站式”的消费服务体验。

3、在智能交通领域,利用行人重识别技术,可以实现实现人与人,甚至人与车的联系。帮助智能交通系统一起完成人、车与道路的完整自动调度闭环,这种技术能力对于自动驾驶时代同样适用。

4、同时,行人重识别其本身也是智慧城市的一个重要技术环节。通过行人重识别技术不仅可以实现人流信息的统计,甚至包括全场景的人流轨迹还原及人员比对和查询,方便实时管理和调配各种终端资源,节省了大量人力和物力资源。

两个例子如下:

4.1 通过行人重识别,得到来政府部门办理相关业务的用户的统计信息,帮助政府服务部门更好的调配人力资源,提高办理效率,进一步优化政务服务。形成方便快捷、公平普惠、优质高效的政务服务信息体系,真正意义上完成从被动服务向主动服务、单一服务向综合服务的转变。

4.2 利用行人重识别技术,得到城市旅游景点的人流信息,可以帮助旅游业的发展规划、精准营销、旅游管理、产品线路及旅游服务提供强大的数据支撑,对旅游市场进行细分,更为有效地确定目标受众,制定符合城市定位的旅游发展规划,从而实现精准营销、业态创新和旅游产业的转型升级。

5、最后,行人重识别还可以用于个人居家生活。在家庭机器人和智能管家中嵌入行人重识别技术,可以帮助其更好的识别服务家庭成员。

产业新零售智能交通自动驾驶人脸识别注意力机制语义分割ReID阿里巴巴行人重识别
41
相关数据
海康威视机构

海康威视是以视频为核心的智能物联网解决方案和大数据服务提供商。海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,及云计算、大数据、深度学习等前瞻技术。为PBG(公共服务事业群)、EBG(企事业事业群) 、SMBG(中小企业事业群)三个事业群客户提供专业的细分产品、IVM智能可视化管理解决方案和大数据服务。

http://www1.hikvision.com/cn/index.html?jmode=j1
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商,致力于把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。目前华为有19.4万员工,业务遍及170多个国家和地区,服务30多亿人口。

https://www.huawei.com/cn/
商汤科技机构

作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球总融资额及估值最高的人工智能创新企业。 商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。 商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。

http://www.sensetime.com
智能管家机构

北京智能管家科技有限公司 (ROOBO) 成立于2014年,致力于成为全球领先的人工智能解决方案提供商。ROOBO向家电、汽车、机器人等多个领域提供整套人工智能系统解决方案,为不同行业的智能化升级和发展提供全面坚实的技术服务支持。旗下产品包括人工智能方案平台ROS.AI、智能语音神经网络处理芯片CI1006,以及PUDDING S、PUDDING BEANQ、JELLY、DOMGY、FARNESE等机器人。

http://puddings.roobo.com/en/
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

注意力机制技术

我们可以粗略地把神经注意机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络. 注意力机制最早是由 DeepMind 为图像分类提出的,这让「神经网络在执行预测任务时可以更多关注输入中的相关部分,更少关注不相关的部分」。当解码器生成一个用于构成目标句子的词时,源句子中仅有少部分是相关的;因此,可以应用一个基于内容的注意力机制来根据源句子动态地生成一个(加权的)语境向量(context vector), 然后网络会根据这个语境向量而不是某个固定长度的向量来预测词。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

流数据技术

流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。 阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。 2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。 2018年7月19日,全球同步《财富》世界500强排行榜发布,阿里巴巴集团排名300位。2018年12月,阿里巴巴入围2018世界品牌500强。

https://www.alibabagroup.com/
相关技术
推荐文章
问一下,有文章题目吗
1