Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

人脸检测榜单WIDER FACE最新排名:创新奇智AInnoFace算法夺冠

近日,世界权威的人脸检测公开评测集WIDER FACE公布最新评测排名。创新奇智(AInnovation)研发的AInnoFace人脸检测算法,超越百度、旷视、腾讯、京东、滴滴、北京邮电大学、中国科学院大学等众多国内外知名人工智能企业和高校人工智能实验室,在WIDER FACE的Easy、Medium和Hard三个评测子集的六项评估结果中, 综合排名第一(六个分项排名中五项第一,一项第二)。

近日,世界权威的人脸检测公开评测集WIDER FACE公布最新评测排名。创新奇智(AInnovation)研发的AInnoFace人脸检测算法,超越百度、旷视、腾讯京东、滴滴、卡耐基梅隆大学、北京邮电大学、中国科学院大学等众多国内外知名人工智能企业和高校人工智能实验室,在WIDER FACEEasyMediumHard三个评测子集的六项评估结果中综合排名第一(六个分项排名中五项第一,一项第二)。

(图片来自于WIDER FACE官网http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html,为方便读者阅读该排行榜,笔者标注了部分人脸检测算法的研发企业和高校)

WIDER FACE人脸检测数据集

人脸检测是计算机视觉领域中非常热门和非常挑战的算法难题。人脸检测也是人工智能算法最重要的商业场景之一。为了提升人工智能算法和对外显示人工智能技术实力,很多AI公司都会选择公开数据集来验证自身的算法能力。在众多数据集中,WIDER FACE是目前业界公开的规模最大、检测难度最高的人脸检测数据集,由香港中文大学于2016年建立。该数据集共包含32,203张图像和393,703个人脸标注。其中40%的数据为训练集(Training),10%的数据为验证集Validation),50%的数据为测试集(Testing)。每个集合中的数据根据人脸检测的难易程度分为“Easy”,“Medium”,“Hard”。

WIDER FACE的数据集识别难度非常大,更加贴近现实的场景,典型例子如下图所示。
从图片中可以看到,该数据集汇集了剧烈变化的人脸尺寸、各种各样的拍照角度、人脸姿态变化,不同程度的人脸遮挡、表情变化,不同类型的光照污染、强弱差异,以及多式多样的化妆风格等多种影响因素,因此该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含CMU等海内外一流高校,京东腾讯百度华为IBM、滴滴、旷视等知名AI公司),在该数据集上一较高下。

创新奇智AInnoFace算法

创新奇智提出的AInnoFace算法以著名的一阶段检测器RetinaNet为起点,采用了IoU损失函数IoU regression loss)进行边框回归使得检测结果的位置更加精准,使用了选择性二阶段回归和分类(Selective Refinement Network)让检测结果的召回率更高并且产生的虚检更少,融合了多种数据増广策略使得最终的检测模型更加鲁棒,借鉴了标签最大化操作(Max-out Label)让分类预测结果更加准确从而降低虚检,利用了改进的多尺度测试策略以更好地检测不同尺度的人脸。经过上述一系列改进,AInnoFace算法对极端尺寸、模糊、遮挡等姿态下的人脸都有很好的检测效果,能有效提升复杂场景下人脸检测召回率及精准度,更好地解决了开放场景人脸检测的技术难题。

AInnoFace人脸检测算法构建在RetinaNet网络的基础上。(a)骨干网络:前馈ResNet-152 网络架构用来提取多尺度特征图。(b)颈部网络:一个6级特征金字塔网络(FPN)用来生成更丰富的多尺度卷积特征金字塔,在这之后,连接两个共享子网,一个子网负责分类目标框,另一个网络负责将目标框回归到真实框。 最后,我们使用focal-loss作为二分类的损失和使用IoU loss 作为框回归的损失。详细信息请参考论文《Accurate Face Detection for High Performancehttps://arxiv.org/pdf/1905.01585.pdf

以曾经有“世界上人数最多的自拍合影”照片为例,从公开消息查询http://tech.ifeng.com/a/20180329/44924067_0.shtml百度的算法PyramidBox在该图片上检测到880张人脸,而AInnoFace算法可以检测出918张人脸,检测精度遥遥领先,来感受一下AInnoFace算法的威力吧!

具体到本次竞赛的各项指标,如下图所示 ,也可以在官方主页中查到(http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html)。在众多知名人工智能企业、高校人工智能实验室中,创新奇智脱颖而出,夺得冠军,令业界印象深刻!

(图片来自于WIDER FACE官网http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html

厚积薄发,快速发展

WIDER FACE竞赛高手大咖云集,成立一年多的创新奇智力压群雄获得第一。这并不是偶然,而是与创新奇智优异的商业化能力和优异的技术研发团队密不可分。

创新奇智成立于20183月,是创新工场AI子公司,以“人工智能赋能商业未来”为使命,致力于用最前沿的人工智能技术为企业提供AI相关产品及商业解决方案。创新奇智CEO徐辉在IT行业拥有20余年的销售、产品、技术、服务、管理经验,历任IBM微软SAP等多家世界500强科技巨头企业高管,对中国市场各个行业发展有着深入了解。创新奇智采用 “技术产品”+“行业场景”双轮驱动模式,商业化速度飞快。

创新奇智拥有优异的技术研发团队,本次WIDER  FACE竞赛夺冠队伍由张发恩、范馨予、艾国、宋剑飞、秦永强和吴佳洪组成。其中团队Leader张发恩现任创新奇智CTO创新工场人工智能工程院首席架构师和宁波诺丁汉大学荣誉教授,他在人工智能工业界和学术界成绩不菲,曾任职MicrosoftGoogle百度,持有多项国内外人工智能算法专利和发表过数篇人工智能顶级会议论文。队伍中其他成员也都有着深厚的人工智能教育背景和从业经历。

创新奇智自成立伊始就瞄准高精尖的人工智能算法在零售、制造、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。心无旁骛,专心突破,自然走得快,走得稳。目前,创新奇智已经打造出业界领先的人工智能数据平台和原创的深度学习支撑平台,并发表了数篇顶级会议论文,但这些成果并不是炫技或者灌水的文章,而是实实在在提升了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了算力资源。

应用为王,商业落地

不仅仅人脸检测算法,从2018年成立以来,创新奇智人工智能视觉算法已经在零售渠道陈列监控的商品识别、智能货柜、工业视觉、智慧园区社区等领域取得行业领头羊的地位。算法领先,产品成熟,率先攻下阵地,占领市场,为客户提供了巨大的商业价值。

 从最新的WIDER FACE排行榜来看,创新奇智已经具备优秀的人工智能技术研发团队,研发出了世界上最先进的人脸检测算法。相信创新奇智把最先进的人工智能算法应用到产业中,一定会创造更大的商业价值,助力企业客户及合作伙伴提升商业效率和价值,为国家的人工智能规划实施添砖加瓦!

创新奇智
创新奇智

人工智能技术创新公司,专注“AI+”商业化落地

https://www.ainnovation.com/
产业人脸检测WIDER FACE创新奇智AInnoFace算法
1
相关数据
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

验证集技术

验证数据集是用于调整分类器超参数(即模型结构)的一组数据集,它有时也被称为开发集(dev set)。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东零售、京东物流、京东科技子集团、印尼&泰国海外合资跨境电商等核心业务。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作。

https://www.jd.com
相关技术
腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
创新工场机构

创新工场由李开复博士创办于2009年9月,作为国内的创业投资机构,创新工场深耕在人工智能&大数据、消费和互联网、B2B&企业升级、教育、医疗等领域,并不断探索与创新,致力于打造集创业平台、资金支持、投后服务等的全方位生态投资服务平台。

http://www.chuangxin.com/
推荐文章
暂无评论
暂无评论~