人脸检测榜单WIDER FACE最新排名:创新奇智AInnoFace算法夺冠

近日,世界权威的人脸检测公开评测集WIDER FACE公布最新评测排名。创新奇智(AInnovation)研发的AInnoFace人脸检测算法,超越百度、旷视、腾讯、京东、滴滴、北京邮电大学、中国科学院大学等众多国内外知名人工智能企业和高校人工智能实验室,在WIDER FACE的Easy、Medium和Hard三个评测子集的六项评估结果中, 综合排名第一(六个分项排名中五项第一,一项第二)。

近日,世界权威的人脸检测公开评测集WIDER FACE公布最新评测排名。创新奇智(AInnovation)研发的AInnoFace人脸检测算法,超越百度、旷视、腾讯京东、滴滴、卡耐基梅隆大学、北京邮电大学、中国科学院大学等众多国内外知名人工智能企业和高校人工智能实验室,在WIDER FACEEasyMediumHard三个评测子集的六项评估结果中综合排名第一(六个分项排名中五项第一,一项第二)。

(图片来自于WIDER FACE官网http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html,为方便读者阅读该排行榜,笔者标注了部分人脸检测算法的研发企业和高校)

WIDER FACE人脸检测数据集

人脸检测是计算机视觉领域中非常热门和非常挑战的算法难题。人脸检测也是人工智能算法最重要的商业场景之一。为了提升人工智能算法和对外显示人工智能技术实力,很多AI公司都会选择公开数据集来验证自身的算法能力。在众多数据集中,WIDER FACE是目前业界公开的规模最大、检测难度最高的人脸检测数据集,由香港中文大学于2016年建立。该数据集共包含32,203张图像和393,703个人脸标注。其中40%的数据为训练集(Training),10%的数据为验证集Validation),50%的数据为测试集(Testing)。每个集合中的数据根据人脸检测的难易程度分为“Easy”,“Medium”,“Hard”。

WIDER FACE的数据集识别难度非常大,更加贴近现实的场景,典型例子如下图所示。
从图片中可以看到,该数据集汇集了剧烈变化的人脸尺寸、各种各样的拍照角度、人脸姿态变化,不同程度的人脸遮挡、表情变化,不同类型的光照污染、强弱差异,以及多式多样的化妆风格等多种影响因素,因此该数据集在全球人脸检测领域极具挑战性,每次评测均会吸引多家国内外科技巨头及高校院所(包含CMU等海内外一流高校,京东腾讯百度华为IBM、滴滴、旷视等知名AI公司),在该数据集上一较高下。

创新奇智AInnoFace算法

创新奇智提出的AInnoFace算法以著名的一阶段检测器RetinaNet为起点,采用了IoU损失函数IoU regression loss)进行边框回归使得检测结果的位置更加精准,使用了选择性二阶段回归和分类(Selective Refinement Network)让检测结果的召回率更高并且产生的虚检更少,融合了多种数据増广策略使得最终的检测模型更加鲁棒,借鉴了标签最大化操作(Max-out Label)让分类预测结果更加准确从而降低虚检,利用了改进的多尺度测试策略以更好地检测不同尺度的人脸。经过上述一系列改进,AInnoFace算法对极端尺寸、模糊、遮挡等姿态下的人脸都有很好的检测效果,能有效提升复杂场景下人脸检测召回率及精准度,更好地解决了开放场景人脸检测的技术难题。

AInnoFace人脸检测算法构建在RetinaNet网络的基础上。(a)骨干网络:前馈ResNet-152 网络架构用来提取多尺度特征图。(b)颈部网络:一个6级特征金字塔网络(FPN)用来生成更丰富的多尺度卷积特征金字塔,在这之后,连接两个共享子网,一个子网负责分类目标框,另一个网络负责将目标框回归到真实框。 最后,我们使用focal-loss作为二分类的损失和使用IoU loss 作为框回归的损失。详细信息请参考论文《Accurate Face Detection for High Performancehttps://arxiv.org/pdf/1905.01585.pdf

以曾经有“世界上人数最多的自拍合影”照片为例,从公开消息查询http://tech.ifeng.com/a/20180329/44924067_0.shtml百度的算法PyramidBox在该图片上检测到880张人脸,而AInnoFace算法可以检测出918张人脸,检测精度遥遥领先,来感受一下AInnoFace算法的威力吧!

具体到本次竞赛的各项指标,如下图所示 ,也可以在官方主页中查到(http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html)。在众多知名人工智能企业、高校人工智能实验室中,创新奇智脱颖而出,夺得冠军,令业界印象深刻!

(图片来自于WIDER FACE官网http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html

厚积薄发,快速发展

WIDER FACE竞赛高手大咖云集,成立一年多的创新奇智力压群雄获得第一。这并不是偶然,而是与创新奇智优异的商业化能力和优异的技术研发团队密不可分。

创新奇智成立于20183月,是创新工场AI子公司,以“人工智能赋能商业未来”为使命,致力于用最前沿的人工智能技术为企业提供AI相关产品及商业解决方案。创新奇智CEO徐辉在IT行业拥有20余年的销售、产品、技术、服务、管理经验,历任IBM微软SAP等多家世界500强科技巨头企业高管,对中国市场各个行业发展有着深入了解。创新奇智采用 “技术产品”+“行业场景”双轮驱动模式,商业化速度飞快。

创新奇智拥有优异的技术研发团队,本次WIDER  FACE竞赛夺冠队伍由张发恩、范馨予、艾国、宋剑飞、秦永强和吴佳洪组成。其中团队Leader张发恩现任创新奇智CTO创新工场人工智能工程院首席架构师和宁波诺丁汉大学荣誉教授,他在人工智能工业界和学术界成绩不菲,曾任职MicrosoftGoogle百度,持有多项国内外人工智能算法专利和发表过数篇人工智能顶级会议论文。队伍中其他成员也都有着深厚的人工智能教育背景和从业经历。

创新奇智自成立伊始就瞄准高精尖的人工智能算法在零售、制造、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。心无旁骛,专心突破,自然走得快,走得稳。目前,创新奇智已经打造出业界领先的人工智能数据平台和原创的深度学习支撑平台,并发表了数篇顶级会议论文,但这些成果并不是炫技或者灌水的文章,而是实实在在提升了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了算力资源。

应用为王,商业落地

不仅仅人脸检测算法,从2018年成立以来,创新奇智人工智能视觉算法已经在零售渠道陈列监控的商品识别、智能货柜、工业视觉、智慧园区社区等领域取得行业领头羊的地位。算法领先,产品成熟,率先攻下阵地,占领市场,为客户提供了巨大的商业价值。

 从最新的WIDER FACE排行榜来看,创新奇智已经具备优秀的人工智能技术研发团队,研发出了世界上最先进的人脸检测算法。相信创新奇智把最先进的人工智能算法应用到产业中,一定会创造更大的商业价值,助力企业客户及合作伙伴提升商业效率和价值,为国家的人工智能规划实施添砖加瓦!

创新奇智
创新奇智

人工智能技术创新公司,专注“AI+”商业化落地

https://www.ainnovation.com/
产业算法AInnoFace创新奇智WIDER FACE人脸检测
1
相关数据
华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

损失函数技术

在数学优化,统计学,计量经济学,决策理论,机器学习和计算神经科学等领域,损失函数或成本函数是将一或多个变量的一个事件或值映射为可以直观地表示某种与之相关“成本”的实数的函数。

验证集技术

验证数据集是用于调整分类器超参数(即模型结构)的一组数据集,它有时也被称为开发集(dev set)。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
创新工场机构

创新工场由李开复博士创办于2009年9月,旨在用全方位的创业服务,帮助中国年轻创业者打造世界级企业。是国内一流的创业投资机构,目前管理超过130亿人民币的双币基金,投资阶段以A-C轮为主。主要关注人工智能、教育、消费升级、B2B企业服务、文化娱乐等领域,并不断探索与创新,致力于打造集创业平台、资金支持、投后服务等的全方位生态投资服务平台。迄今,创新工场参与投资的总项目数量累积超过300个,总部设于北京,在上海、深圳、硅谷设有办公室。

http://www.chuangxin.com/
推荐文章
暂无评论
暂无评论~