Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

VIONVISION作者 文安智能来源

官宣:一不小心我们刷了个第一,这次是ReID跨镜跟踪算法

这些年,人工智能视觉技术板块挺火的,而其中的人脸识别技术更是永远占据创投、科技媒体的头条,并在各大科技展会上霸屏。第一年感觉新鲜,第二年觉得套路没变,第三年除了精度提高了以外,似乎没啥新花样了。时至今日,人脸识别领域单纯的刷榜已无意义,AI小伙伴们重要的是沉下心来,在自己选好的领域里,踏踏实实地进一步优化技术,做出能为用户创造实际价值的产品方案来。

那么,接下来想炫技的话,该怎么办呢?强烈推荐ReID,Maybe它将成为AI视觉领域,继人脸识别之后,又一霸屏级存在。

本文由机器之心经授权转载自文安智能(ID:bj-vionvision ),禁止二次转载。

ReID是个啥?

ReID,英文全称Re-identification,中文里的人体重定位、跨镜跟踪、行人再识别都是它,是指通过穿着、体态、发型等在不确定的场景中能够再次识别是同一个人,并以此描绘出个体行进轨迹的AI视觉技术。从概念上,ReID年头不少了,早在2008年,文安智能董事长陶海博士与其学生D.Gray提出世界上第一个广泛使用的ReID数据库VIPeR,并研发出当时全球领先的相关算法。

但是ReID 与人脸识别相比,有着一个最大的不同。人脸的特征一般具有唯一性,而特征的唯一性愈高,单靠这个特征去查找或定义一个人就会更准确,也更容易。ReID 在这一块是完全无法比拟的,也就是难度系数更大。由于图像拍摄的时间、地点随机,且光线、角度、姿态不同,再加上行人容易受到检测精度、遮挡等因素的影响,ReID 的研究工作非常具有挑战性。它最终的目的是要能达到 1-to-1 匹配的状态。

ReID能干啥?

任何能用到人的行动轨迹分析的场景,都有ReID的用武之地,典型的比如安防场景的敏感人群分析,零售场景的消费者行为分析等。

示意图:零售场景下,用ReID技术分析消费者的运动轨迹


这些年,我们将要刷的榜


Public是公开发表的论文里最好的结果

VIONVISION是文安智能的最好结果(均为Reranking之前)

MSMT17、Market1501、DukeMTMC-ReID、CUHK03,ReID界影响力最大的“四大名库”,这次是轮到文安智能出头了。虽然目前没有权威的公开比对,但根据公开数据,四大数据库中,文安智能算法的结果在首位命中率(Rank-1 Accuracy)、平均精度均值(Mean Average Precision,mAP)两个核心指标上,均不同程度的领先于目前公开可见的最好水平。 

为什么可以这么优秀?


研发人员扔给小编同学一张图:

基于人体关键点的多粒度网络结构

PBSAN (Pose-Based Spatial Attention Networks)

这图看得小编是懵@着进来,懵@着出去,但他们的观点是,基于人体关键点的多粒度网络结构,为解决ReID问题提供了一个非常不错的思路。

ReID离落地还有多远?

什么叫离落地还有多远?为了这个问题,研发的小伙伴对小编Diss了半天。研发同学认为,秉承文安智能历来以面向实际应用为出发点的研发思路,我们的研发从来就是场景导向的,我们不是在落地,就是在落地的路上,刷刷榜只是顺带而为。经过他们的解释,在小编粗浅的理解里,ReID的实际应用,与场景内的人群数量级和场景本身的复杂度密切相关。事实上,在文安智能的智慧门店解决方案里面,已经有实际的应用,未来只会是越来越好,越来越靠谱。

欢迎有兴趣的关注哈!

……未来的人工智能无限浩瀚……

关于文安智能

文安智能成立于2005年,是专注于人工智能视觉技术与产品自主研发的先行者,致力于为智慧城市和智慧商业打造端到端解决方案。

文安智能汇聚了由众多来自清华大学、中科院、微软研究院、IBM研究院等相关领域的行业专家组成的强大研发队伍。从人脸识别、行为识别、人群分析、车辆识别与分析等底层算法研发开始,文安智能自主研发了一系列世界领先的AI视觉核心算法、高性能人工智能硬件平台与行业定制化智能解决方案。目前,公司产品与方案已经在国内外广泛应用,受到交通、综治、公安、商业地产、连锁零售等各行业客户的信赖与认可。

本文由机器之心经授权转载自文安智能(ID:bj-vionvision ),禁止二次转载。

原文链接:

https://mp.weixin.qq.com/s/5mdPlM541mjK_MYA_kkulg

工程计算机视觉
相关数据
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~