阿里行人重识别(ReID)算法效果刷新业内最好成绩

近日,阿里巴巴机器智能技术实验室在行人重识别(Person Re-identification)算法上获得突破性成果。该技术团队通过最新算法,在不使用任何时序信息的情况下,在行人重识别主流数据库(Market1501,DukeMTMC-reid和CUHK03)上各项指标均取得第一的好成绩,刷新了业内的最好成绩。

其性能的提高主要来源于技术层面的创新:该团队通过局部信息的挖掘,致力于解决行人在识别过程中表观姿态变化剧烈,不容易对齐的问题。一方面,通过人体语义分割得到具有强语义信息的部件,并利用注意力机制在其中寻找最具有区分性的区域。另一方面,使用了基于金字塔的水平分块策略,得到行人固定区域的可辨识信息。在训练中,同时采用两种策略相结合的方式,达到行人图片的对齐,从而实现更精准的匹配识别。通过技术上的改进,该方法在三个公开数据库上的效果均优于之前最好方法,特别是mAP指标,分别提升了2%,1.87%,3.39%。

近年来,行人重识别技术在业内得到了越来越多的关注,仅CVPR2018就有将近30多篇文章专注于行人重识别问题的研究。随着行人重识别技术的日渐成熟,其巨大的应用价值和市场潜力得到了越来越多的关注。

不管是老牌的安防公司如海康威视,浙江大华,还是新晋独角兽旷世科技,商汤科技,还有传统的互联网巨头,BAT,华为等,都对行人重识别非常关注,在算法,数据和人才等各个方面上进行着布局和积累。此次阿里巴巴机器智能技术实验室在行人重识别算法的突破,为其在XXX领域相关技术方案落地奠定了稳固基础。

行人重识别落地应用点:

1、在公共安全领域,行人重识别一方面能够帮助快速筛查可疑人员,建立快速反应安全防控机制、精准重拳打击犯罪,如精准查找黄牛党,预防公共安全事故发生。另一方面,在机场、车站等人流拥挤的公共区域,利用行人重识别技术,可以实现走失儿童和老人的快速查找。对维护人民群众切身利益,营造平安环境有着不可估量的作用。

2、在新零售领域,通过行人重识别技术,可以获取顾客的行为轨迹,获得顾客的数字化信息,帮助商家挖掘更多的商业价值,同时为客户提供定制化服务。可以实现零售场景内的全程无感知体验,并能对各种突发事件做出及时的响应。

除了应用在线下零售解决方案中,行人重识别与人脸识别技术的相结合,可以用来打通线上、线下零售场景,提供“一站式”的消费服务体验。

3、在智能交通领域,利用行人重识别技术,可以实现实现人与人,甚至人与车的联系。帮助智能交通系统一起完成人、车与道路的完整自动调度闭环,这种技术能力对于自动驾驶时代同样适用。

4、同时,行人重识别其本身也是智慧城市的一个重要技术环节。通过行人重识别技术不仅可以实现人流信息的统计,甚至包括全场景的人流轨迹还原及人员比对和查询,方便实时管理和调配各种终端资源,节省了大量人力和物力资源。

两个例子如下:

4.1 通过行人重识别,得到来政府部门办理相关业务的用户的统计信息,帮助政府服务部门更好的调配人力资源,提高办理效率,进一步优化政务服务。形成方便快捷、公平普惠、优质高效的政务服务信息体系,真正意义上完成从被动服务向主动服务、单一服务向综合服务的转变。

4.2 利用行人重识别技术,得到城市旅游景点的人流信息,可以帮助旅游业的发展规划、精准营销、旅游管理、产品线路及旅游服务提供强大的数据支撑,对旅游市场进行细分,更为有效地确定目标受众,制定符合城市定位的旅游发展规划,从而实现精准营销、业态创新和旅游产业的转型升级。

5、最后,行人重识别还可以用于个人居家生活。在家庭机器人和智能管家中嵌入行人重识别技术,可以帮助其更好的识别服务家庭成员。

产业新零售智能交通自动驾驶人脸识别注意力机制语义分割ReID阿里巴巴行人重识别
41
相关数据
海康威视机构

海康威视是以视频为核心的物联网解决方案提供商,为全球提供安防、可视化管理和大数据服务。海康威视全球员工超25000人(截止2017年6月30日),其中研发人员超10000人,研发投入占企业销售额的7-8%,绝对数额占据业内前茅。海康威视是博士后科研工作站单位,在国内设有五大研发中心,在海外建立蒙特利尔研发中心和硅谷研究所,海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,及云计算、大数据、深度学习等前瞻技术,针对公安、交通、司法、文教卫、金融、能源和智能楼宇等众多行业提供专业的细分产品、IVM智能可视化管理解决方案和大数据服务。在视频监控行业之外,海康威视基于视频技术,将业务延伸到智能家居、工业自动化和汽车电子等行业,为持续发展打开新的空间。海康威视在中国大陆35个城市设立分公司及售后服务站,在境外,设立香港、荷兰、南非、印度、迪拜、美国、加拿大、巴西、俄罗斯、新加坡、意大利、澳大利亚、法国、西班牙、波兰、英国、韩国、哥伦比亚、哈萨克斯坦和土耳其等33个分支机构。海康威视产品和解决方案应用在150多个国家和地区,在G20杭州峰会、北京奥运会、上海世博会、美国费城平安社区、韩国首尔平安城市、巴西世界杯场馆、意大利米兰国际机场等重大安保项目中发挥了极其重要的作用。海康威视是全球视频监控数字化、网络化、高清智能化的见证者、践行者和重要推动者。连续六年(2011-2016)蝉联iHS全球视频监控市场占有率第1位,硬盘录像机、网络硬盘录像机、监控摄像机第1位 ;连年入选“国家重点软件企业” 、“中国软件收入前百家企业” 、A&S《安全自动化》“中国安防十大民族品牌”、CPS 《中国公共安全》“中国安防百强”(位列榜首);2016-2017年, A&S《安全自动化》公布的“全球安防50强”榜单中,蝉联全球第1位。2010年5月,海康威视在深圳证券交易所中小企业板上市,股票代码:002415,长期位居中小板市值前3位。基于创新的管理模式,良好的经营业绩,公司先后荣获“2016CCTV中国十佳上市公司” 、“中国中小板上市公司价值十强” 、“2016年A股上市公司未来价值排行以及A股最佳上市公司”榜首 、“第六届中国上市公司口碑榜最佳公司治理实践奖” 、“中国中小板上市公司投资者关系最佳董事会” “上市公司金牛投资价值奖”和“最佳投资者关系管理奖” 等重要荣誉。海康威视秉承“专业、厚实、诚信”的经营理念,坚持将“成就客户、价值为本、诚信务实、追求卓越”核心价值观内化为行动准则,不断发展视频技术,服务人类。

www.hikvision.com
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
商汤科技机构

商汤科技成立于 2014 年,专注于计算机视觉和深度学习的原创技术,是中国领先的人工智能头部公司,估值超过 45 亿美金。以「坚持原创,让 AI 引领人类进步」为使命,商汤科技建立了国内顶级的自主研发的深度学习超算中心,并成为中国一流的人工智能算法供应商。商汤科技不仅在技术实力上领跑行业,商业营收亦领先同行业,在多个垂直领域的市场占有率居首位。目前,商汤科技已与国内外多个行业的 400 多家领军企业建立合作,包括 Qualcomm、英伟达、本田、中国移动、银联、万达、苏宁、海航、中央网信办、华为、小米、OPPO、vivo、微博、科大讯飞等知名企业及政府机构,涵盖安防、金融、智能手机、移动互联网、汽车、智慧零售、机器人等诸多行业,为其提供基于人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等技术的完整解决方案。

www.sensetime.com
智能管家机构

北京智能管家科技有限公司 (ROOBO) 成立于2014年,致力于成为全球领先的人工智能解决方案提供商。ROOBO向家电、汽车、机器人等多个领域提供整套人工智能系统解决方案,为不同行业的智能化升级和发展提供全面坚实的技术服务支持。旗下产品包括人工智能方案平台ROS.AI、智能语音神经网络处理芯片CI1006,以及PUDDING S、PUDDING BEANQ、JELLY、DOMGY、FARNESE等机器人。

http://puddings.roobo.com/en/
自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

注意力机制技术

我们可以粗略地把神经注意机制类比成一个可以专注于输入内容的某一子集(或特征)的神经网络. 注意力机制最早是由 DeepMind 为图像分类提出的,这让「神经网络在执行预测任务时可以更多关注输入中的相关部分,更少关注不相关的部分」。当解码器生成一个用于构成目标句子的词时,源句子中仅有少部分是相关的;因此,可以应用一个基于内容的注意力机制来根据源句子动态地生成一个(加权的)语境向量(context vector), 然后网络会根据这个语境向量而不是某个固定长度的向量来预测词。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

流数据技术

流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

语义分割技术

语义分割,简单来说就是给定一张图片,对图片中的每一个像素点进行分类。图像语义分割是AI领域中一个重要的分支,是机器视觉技术中关于图像理解的重要一环。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。 阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。 2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。 2018年7月19日,全球同步《财富》世界500强排行榜发布,阿里巴巴集团排名300位。2018年12月,阿里巴巴入围2018世界品牌500强。

https://www.alibabagroup.com/
推荐文章
问一下,有文章题目吗
1