Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

多目标检测新突破!创新奇智斩获国际权威测评MOT Challenge冠军

创新奇智提出多目标检测新算法,广泛应用于工业视觉领域

近日,创新奇智(AInnovation)在国际最权威的多目标跟踪挑战赛MOT(Multiple Object Tracking) Challenge,荣获MOT17Det目标检测任务第1名的佳绩,以明显优势领先斯坦福大学、腾讯优图、商汤科技海康威视等几十支强劲的国际企业和科研机构。

本次大赛中,创新奇智夺冠的AInnoDetV2多目标检测算法已应用于创新奇智的工业视觉平台ManuVision。该平台融合多种先进的AI算法,针对工业制造过程中的定位、检测、测量、识别等功能场景,批量支持服装纺织、机动车装配等多个细分应用领域。

自去年以来,创新奇智计算机视觉领域屡获佳绩,不仅短时间内刷新人脸检测竞赛WIDER FACE、物体检测竞赛 PASCAL VOC、图像分割竞赛Cityscapes、多目标跟踪竞赛MOT Challenge等多个世界顶级计算机视觉大赛的全球排行榜,更在IDC 2019 1H 计算机视觉应用市场份额报告中名列前茅,仅次于商汤、旷视、云从、依图、海康威视,充分彰显了创新奇智技术算法创新和商业化落地实力。

来源于:https://motchallenge.net/results/MOT17Det/

关于MOT Challenge

Multiple Object Tracking (MOT) Challenge 是国际多目标跟踪领域最权威的测评平台,由阿德莱德大学、苏黎世联邦理工学院以及达姆施塔特工业大学联合创办,是世界各大AI研究机构及企业较量CV技术实力的地方,迄今参赛者包括NEC 北美研究院、斯坦福大学、纽约州立大学、苏黎世联邦理工学院、悉尼大学、伦敦玛丽皇后大学、马克斯普朗克研究所、海康威视商汤科技腾讯优图等世界知名高校和研究所。

该平台旨在评测多行人对象在复杂场景下同时进行检测及跟踪的算法性能,主要包含 MOT 15、MOT 16、MOT 17 三个测评集。其中,MOT 17Det数据集主要针对多行人的目标检测,具有场景复杂多样、人员遮挡、光照变化、图片模糊等检测难点。创新奇智在这次比赛中击败了众多知名公司和研究机构,以绝对优势获得冠军。

创新奇智的AInnoDetV2算法

创新奇智夺冠的AInnoDetV2多目标检测算法以著名的Cascade R-CNN网络作为基础检测器,采用Resnext101_32X8d作为骨干网络,使用它来提取多维度特征图,颈部网络则采用一个自研的特征金字塔网络(PC Attention FPN),用来生成更加丰富的多尺度卷积特征,后面接两个子网:一个负责分类,一个负责目标框的回归工作。

Cascade R-CNN

看看AInnoDetV2算法在MOT 17Det数据集上的表现:

AInnoDetV2算法在多行人复杂场景下做到无漏检、置信度高

目标检测在工业领域的应用

目标检测计算机视觉领域的重要任务,有着众多的应用场景。创新奇智瞄准潜力巨大的工业视觉市场,打造融合多种领先算法的工业视觉平台ManuVision,围绕定位、检测、测量、识别等功能场景,提供集光(学)、机(械)、电(气)、软(件)、算(法)于一体的自动化整体解决方案,应用于3C装配、机动车装配、服装纺织、冶金铸造、无损探伤、磁性材料等多个细分领域。

创新奇智在工业视觉领域的突出表现获得CCTV在内的多家知名媒体报道,并在钛媒体2019 T-Edge全球创新评选中荣获“年度前沿科技产品”大奖。

创新奇智聚焦AI在制造、零售、金融等领域的商业化落地。未来,创新奇智将探索包括多目标检测在内的计算机视觉技术在更多细分场景的应用落地,助力产业智能化。

关于参赛团队

创新奇智本次MOT竞赛夺冠队伍由张发恩、吴佳洪、杨志铮、曹浩天、汤寅航、宋剑飞、艾国、范馨予、路建飞和徐博组成。其中团队Leader张发恩现任创新奇智CTO、创新工场人工智能工程院首席架构师和宁波诺丁汉大学荣誉教授,他在人工智能工业界和学术界成绩不菲,曾任职Microsoft、Google和百度,持有多项国内外人工智能算法专利和发表过数篇人工智能顶级会议论文。队伍中其他成员也都有着深厚的人工智能教育背景和从业经历。

创新奇智
创新奇智

人工智能技术创新公司,专注“AI+”商业化落地

https://www.ainnovation.com/
产业目标检测创新奇智
2
相关数据
海康威视机构

海康威视是以视频为核心的智能物联网解决方案和大数据服务提供商。海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,及云计算、大数据、深度学习等前瞻技术。为PBG(公共服务事业群)、EBG(企事业事业群) 、SMBG(中小企业事业群)三个事业群客户提供专业的细分产品、IVM智能可视化管理解决方案和大数据服务。

http://www1.hikvision.com/cn/index.html?jmode=j1
商汤科技机构

商汤科技作为全球领先的人工智能平台公司,商汤科技SenseTime是中国科技部指定的“智能视觉”国家新一代人工智能开放创新平台。同时,商汤科技也是全球总融资额及估值最高的人工智能创新企业。 商汤科技以“坚持原创,让AI引领人类进步”为愿景。公司自主研发并建立了全球顶级的深度学习平台和超算中心,推出了一系列领先的人工智能技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。商汤科技已成为亚洲最大的AI算法提供商。 商汤科技在多个垂直领域的市场占有率位居首位,业务涵盖智能手机、互联网娱乐、汽车、智慧城市、以及教育、医疗、零售、广告、金融、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的企业和机构建立合作,包括本田、SNOW、阿里巴巴、苏宁、中国移动、OPPO、vivo、小米、微博、万科、融创等。

http://www.sensetime.com
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
图像分割技术

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

百度机构

百度是全球领先的人工智能平台型公司。百度大脑是中国领先的“软硬一体AI大生产平台”,是百度AI的集大成,对外全方位输出超过270多项核心AI能力,服务230万开发者。飞桨是中国首个全面开源开放、功能完备的产业级深度学习平台,是中国自主研发的“智能时代的操作系统”。百度智能云是百度AI To B 业务的重要承载者和输出者,是产业智能化领导者。小度助手是中国领先的对话式人工智能操作系统,拥有中国市场最繁荣、开放的对话式人工智能生态,今年6月,小度助手语音交互次数超过58亿次。作为全球领先的、最活跃的自动驾驶开放平台,百度Apollo代表中国最强自动驾驶实力,被知名研究公司Navigant Research列为全球四大自动驾驶领域领导者之一。目前聚焦在以自动驾驶、汽车智能化、智能交通为核心的三大赛道。自动驾驶技术方面,超过十项中国第一,实力领跑行业。智能交通方面,百度 “ACE交通引擎”是全球首个车路行融合的全栈式智能交通解决方案。

https://www.baidu.com/
旷视科技机构

旷视成立于2011年,是全球领先的人工智能产品和解决方案公司。深度学习是旷视的核心竞争力,我们打造出自研的AI生产力平台Brain++并开源其核心——深度学习框架“天元”,实现了算法的高效开发与部署。在持续引领技术进步的同时,我们推动AI产业的商业化落地,聚焦个人物联网、城市物联网、供应链物联网三大赛道,为个人用户带来更出色的美学体验与安全保障、让城市空间更有序、并帮助企业实现工业、仓储数字化升级。我们提供包括算法、软件和硬件产品在内的全栈式、一体化解决方案。

https://www.megvii.com
腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。 腾讯希望成为各行各业的数字化助手,助力数字中国建设。在工业、医疗、零售、教育等各个领域,腾讯为传统行业的数字化转型升级提供“数字接口”和“数字工具箱”。我们秉持数字工匠精神,希望用数字创新提升每个人的生活品质。随着“互联网+”战略实施和数字经济的发展,我们通过战略合作与开放平台,与合作伙伴共建数字生态共同体,推进云计算、大数据、人工智能等前沿科技与各行各业的融合发展及创新共赢。多年来,腾讯的开放生态带动社会创业就业人次达数千万,相关创业企业估值已达数千亿元。 腾讯的愿景是成为“最受尊敬的互联网企业”。我们始终坚守“科技向善”的初心,运用科技手段助力公益事业发展,并将社会责任融入每一个产品。2007年,腾讯倡导并发起了中国互联网第一家在民政部注册的全国性非公募基金会——腾讯公益慈善基金会。腾讯公益致力于成为“人人可公益的创连者”,以互联网核心能力推动公益行业的长远发展为己任。腾讯公益联合多方发起了中国首个互联网公益日——99公益日,帮助公益组织和广大爱心网友、企业之间形成良好的公益生态,让透明化的“指尖公益”融入亿万网民的生活。

http://www.tencent.com/
创新工场机构

创新工场由李开复博士创办于2009年9月,作为国内的创业投资机构,创新工场深耕在人工智能&大数据、消费和互联网、B2B&企业升级、教育、医疗等领域,并不断探索与创新,致力于打造集创业平台、资金支持、投后服务等的全方位生态投资服务平台。

http://www.chuangxin.com/
目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

创新奇智机构

创新奇智(AInnovation)成立于 2018 年 3 月,是创新工场 AI 子公司,人工智能独角兽企业。公司以 “人工智能赋能商业价值” 为使命,致力于用最前沿的人工智能技术为企业提供 AI 相关产品及商业解决方案,通过 AI 赋能助力企业客户及合作伙伴提升商业效率和价值,实现数字化转型。创新奇智以 “技术产品”+“行业场景” 双轮驱动模式,为制造、金融、零售、公共服务等行业提供人工智能整体解决方案,已获取中冶赛迪、宗申、中集、宝武钢铁、中铁四局、中纺标、鸿海科技、玛氏、雀巢、嘉士伯、惠氏、邮储银行、光大银行、人保、太保、泰康等多家行业标杆客户。公司成立以来快速成长,在多个城市落地,形成全国性布局。创新奇智的飞速发展广受市场认可,荣获多项国内外大奖,如:MIT 全球最聪明公司 50、英国《金融时报》最具创新企业、2020 CB Insights AI100、《哈佛商业评论》拉姆・查兰管理实践奖、《Fast Company》中国最佳创新公司 50、中国人工智能产业独角兽 Top50、2020 最具登陆科创板潜力企业等。

http://www.ainnovation.com/
人脸检测技术

人脸检测(face detection)是一种在任意数字图像中找到人脸的位置和大小的计算机技术。它可以检测出面部特征,并忽略诸如建筑物、树木和身体等其他任何东西。有时候,人脸检测也负责找到面部的细微特征,如眼睛、鼻子、嘴巴等的精细位置。

推荐文章
暂无评论
暂无评论~