Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

思 孙茜茜原创

董明珠躺枪「行人闯红灯曝光台」,CV专家来支招

「人在家中坐,违章天上来。」近日,格力董明珠「董小姐」在宁波「被闯红灯」。

「红灯停、绿灯行、遇到黄灯等一等。」

虽然从小就被教育遵守交通规则,但「中国式过马路」的行为仍旧频发、且屡禁不止。

为了规范大家文明过马路,不少城市(深圳、天津、 莆田、新疆库尔勒、广州……)上线了「行人闯红灯曝光台」。顾名思义,闯红灯的行人会被曝光在大屏幕上。

近日,网上流出的一张照片显示:董明珠的照片也出现在了宁波的「行人闯红灯曝光台」上!旁边还展示了她是在何地闯红灯的。

然而,细看照片后却发现:斑马线上并没有人。再仔细看看,原来是该系统把大巴车体上的董明珠广告当成了真人。

这一乌龙事件引起了网友的热议,小编朋友圈有众多 AI 社区人员转发讨论,在新浪微博上搜索「董明珠」,微博已经会自动给你推送「董明珠 闯红灯」的词条了。

有网友调侃,「之后估计李小龙也被显示闯红灯了」。

如何避免「被闯红灯」现象的再次发生?机器之心采访了多家计算机视觉公司,试图了解「行人闯红灯曝光台」背后的技术机制,并寻找解题之道。

背后的技术与难题 

从曝光图看来,模型主要会用 SSDYOLO 等目标检测算法预测人脸检测框,并根据检测框截取人脸图像,最后通过计算人脸图像相似性而判断闯红灯者的身份。虽然过程并不复杂,但还有非常多未解决的问题,在这个案例中,活体检测就成为了重要的缺失环节。

对于曝光平台主要采用的技术,云从科技研究院副院长周翔表示,整体流程可以分为「同步红灯时间——抓拍人脸——后台或前端实时比对——实时发布或人工审核」;其中,同步红灯时间会比较简单,抓取人脸也是比较常见的技术,但既然需要投入到生产中,那么模型大小、稳定性和响应延迟等都需要特殊的设计。

武汉神目总经理黄瑞表示,这一场景主要是抓拍闯红灯的行人,「立一个人像卡口与交通信号灯互动和机动车闯红灯有点类似,不同只是:一个抓人,抓脸与库里人员 1:N 匹配核实真实身份;一个抓车抓车牌,与库里核对得出机动车真实身份。」不过,即使是同样的技术应用到行人与车牌,多彩多样的行人抓取也艰难得多。

尽管闯红灯曝光流程很简洁,在 GitHub 上调用一些预训练实时检测模型就能完成主体功能,但若想减少甚至避免「董明珠闯红灯」这样的误差,还有很多优化的方面。

周翔说,出现这种情况的原因主要有:「(1)底库没有董小姐,所以自动选择最相似的人进行显示;(2)算法没有加入活体检测,在这个距离上目前要判断活体难度还是比较大的;(3)广告当真人的现象目前看来比较正常,这是实际落地的一个妥协方案。」

深瞐科技 CTO 王建辉持相同的态度,他表示:「该事件只能说明该平台的人脸检测算法性能还挺好,但是在产品设计过程中没有考虑广告牌等异常情况的处理,另外反映的是抓拍算法并没有做活体检测,仅仅做的人脸检测。技术难点是在非配合情况下如何做活体检测。」

对于这种行人闯红灯,难点确实在于非配合情况下的活体检测,澎思科技首席研究员 Robert Lorenz 说:「这个案例在红灯状态下只要能捕捉到人脸就判断为闯红灯,缺少了人及动作的判断。难点是人+动作的检测,即抓拍人脸来自于「活体」人且有闯红灯行走的动作。」

不过,黄瑞认为这件事不能算「误判」,类似的事件全国各地每天都在发生。「按照抓拍机目前在国内市场的一般要求,就是只做动态图像识别,不做活体识别。」在他看来,抓拍机和门禁等不一样,判断活体不是刚需。

解决方案 

这些都还是比较明显和大方向上的难题,那么,针对这些难题,又有什么样的解决方案呢?我们能不能不只检测人脸,转而检测人的整个身体及动作来判断是不是闯红灯?

周翔表示,「不考虑语义信息,目前没有什么称得上特别好的解决方案,因为现在用的活体检测算法和硬件主要针对近距离场景,比如 3D 结构光、红外双目、动作、唇语、静默等等,不过可以通过限定抓取人脸尺寸大小范围来一定程度上缓解该问题。」

其实,如果不考虑语义或环境信息,还是能通过一些硬件来解决问题,黄瑞说:「目前,部分南方城市某些地点已有的做法是,额外添加红外摄像头,但因为抓拍机场景通常距离很远,所以要安装的红外摄像头比较大型,各项成本都相对较高。」

考虑语义信息则会有更好的表现,Robert Lorenz 表示,添加人体检测可以在一定程度上解决这一问题。但也有多方面因素需要考虑,比如人脸的大小和身体躯干的比例关系,否则也会出现印在行人衣服或者背包上的偶像人脸被误抓的问题。

加入姿态估计或移动坐标等语义信息确实可以判断是广告还是人,周翔说:「但是这样会导致模型复杂度提升,如果不换用性能更好的硬件,算法速度可能会有一定程度下降,在这个场景的必要性不是很大。」因为对于这种大规模应用,模型参数量、计算力和准确度都有很高的要求,复杂模型很难部署到实际应用中。

Robert Lorenz 最后表示,目前的解决方案主要有以下几种:

  • 加入图像大小的检测,印刷广告上的人脸大小一般情况下会比行人的脸大,所占像素面积也会更大,只需要设定人行横道由远到近可能拍摄人脸的大小,可能很大程度上避免此类情况出现,但衣物等的人脸图像就存在一定的被识别风险;这属于从工程角度杜绝这类问题,而不是算法角度;

  • 图像质量判断,拍摄真人和印刷物产生的照片存在明显差异,比如肤色、纹理等,可以通过模型训练让计算机进行区分;

  • 加入深度信息,比如双目相机和 RGB-D 相机,获取 3D 信息,就可以屏蔽掉印刷物等 2D 图像,但此方案成本太高,不适用于闯红灯;

  • 利用人体骨骼关键点检测,并借助关键点描述人体姿态、预测人体行为。基于人体的骨骼关键点和关键物体分析,还原人体姿态,理解人类的动作。澎思科技拥有的行为检测技术还可以进行异常行为检测(利用高精度的人体关键点,您可以检测出视频中或图片中人体的异常动作),比如针对闯红灯这个情境下,就可以针对行人意外摔倒、行动缓慢人,坐轮椅残疾人进行检测,结合红绿灯控制,就可以真正为人们的生活提供便利。

「误拍是小事,切记文明出行,平安最重要。」今日上午 10 时 15 分,董明珠本人在新浪微博上对此事做了回应。

在小编看来,避免「被闯红灯」的再次发生,需要作出努力的,除了技术方案提供商,还有我们自身。规范自身行为、文明过马路才是解决问题的根本之道。来,跟着念一遍,「红灯停、绿灯行、遇到黄灯等一等。」

产业人脸检测活体检测
2
相关数据
神目科技机构

神目科技由国家千人计划特聘专家,卡内基梅隆大学博士刘靖峰带领来自卡内基梅隆大学,密执安州立大学,俄克拉荷马大学,清华大学,浙江大学等从事人工智能的博士创立的专注计算机视觉的人工智能大数据公司。神目和卡内基梅隆大学联合成立生物识别研究室,是美国国家自然基金(NSF)旗下Big Learning Center 创始会员。神目科技和烽火集团成立控股子公司武汉幻视智能,从事人脸识别,物体识别,车辆识别等人工智能技术在智慧城市和智慧旅游领域的应用。 

https://www.deepcam.cn/index.php
云从科技机构

云从科技孵化于中国科学院,是一家提供高效人机协同操作系统和行业解决方案的人工智能企业,核心团队曾先后7次获得国内外智能感知领域桂冠,并受邀参与了人工智能国家标准、公安部行业标准等26项国家和行业标准制定工作。通过多年技术积累和业务深耕,云从科技在智慧金融、智慧治理、智慧出行、智慧商业领域已逐步实现成熟应用,智慧金融领域已覆盖六大国有银行在内超过400家金融机构,智慧治理领域已服务于全国30个省级行政区,智慧出行领域产品和解决方案已在包括中国十大机场中的九座在内的105座民用枢纽机场部署上线

http://www.cloudwalk.com/
参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

SSD技术

一种计算机视觉模型。论文发表于 2015 年(Wei Liu et al.)

YOLO技术

YOLO 模型最早是由 Joseph Redmon 等人在 2015 年发布的,并在随后的两篇论文中进行了修订。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

推荐文章
暂无评论
暂无评论~