创新奇智荣获Cityscapes实例分割冠军,算法商用价值大

近日,创新奇智(AInnovation)在国际权威图像分割竞赛Cityscapes上获得实例分割评测的第一名,以明显优势刷新实例分割任务世界纪录,超越NVIDIA(英伟达)、Facebook、Uber、香港中文大学、商汤、搜狗科大讯飞等几十支强劲的国际企业和科研机构。

迄今为止,在短短5个月时间内,创新奇智已连续在世界顶级人脸检测竞赛WIDER FACE、物体检测竞赛 PASCAL VOC图像分割竞赛Cityscapes中取得三连冠的佳绩,充分彰显了创新奇智计算机视觉识别领域的技术实力和算法创新能力。

图片来源:Cityscapes官网

Cityscapes 数据集

Cityscapes评测数据集在2015年由奔驰公司推动发布,是目前公认的机器视觉领域内最具权威性和专业性的图像分割数据集之一。在Cityscapes评测数据集之中,共分为像素级分割和实例分割两个子任务,其中相较于像素级分割,实例分割的难度要更大,也是计算机视觉领域最重要、最具挑战的任务之一。

在Cityscapes实例分割任务所对应的数据集中,包含了5000张精细标注的图像和20000张粗略标注的图像,其中包含50个城市的不同场景、不同背景、不同街景,以及30类涵盖地面、建筑、交通标志、自然、天空、人和车辆等的物体标注。该数据集以关注真实场景下的环境理解著称,任务难度更高。

截至目前,Cityscapes评测吸引了近百支队伍参赛,包括Facebook、Uber、香港中文大学、商汤、NVIDIA(英伟达)、搜狗科大讯飞等众多国内外优秀创新企业和顶尖学术机构参加。创新奇智提出的AInnoSegmentation算法在各项指标中均有突破性进展,各项指标均名列第一,综合成绩第一。

创新奇智AInnoSegementation算法

AInnoSegmentation算法是以著名的Mask R-CNN网路架构为基础,骨干网络使用SE-Resnet152网络架构,使用它来提取多尺度特征图,颈部网络采用一个6级特征金字塔网络(FPN),用来生成更加丰富的多尺度卷积特征。然后使用自研的特征融合模块作为特征融合器,后面连接两个共享子网,一个负责分类和框回归,一个负责图像分割

Mask R-CNN网络图

看看AInnoSegementation算法的表现吧:

AInnoSegementation算法在Cityscapes数据集上的表现

实例分割算法的商业价值

创新奇智自成立伊始就瞄准高精尖的人工智能算法在制造、零售、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。目前,创新奇智已经打造出业界领先的自动化机器学习平台和AI工业视觉平台ManuVision,并发表了数篇顶级会议论文。这些成果实实在在提高了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了计算资源。

AInnoSegmentation算法在工业视觉中应用非常广泛,典型场景包括:缺陷检测,定位,识别等复杂场景。例如,创新奇智已将该算法应用于成衣、磁性材料等质检场景下,提高产品的质检精准度。

AInnoSegmentation算法还可以应用于零售业中的渠道陈列和智能货柜等商品识别场景,提高商品识别准确度的同时,帮助客户提升运营效率。

另外,创新奇智还将AInnoSegmentation算法应用于钢铁厂智慧铁水无人机车运输系统上,进一步提高该解决方案的成熟度和技术壁垒。

创新奇智
创新奇智

人工智能技术创新公司,专注“AI+”商业化落地

https://www.ainnovation.com/
产业创新奇智实例分割
3
相关数据
搜狗机构

搜狗是中国互联网领先的搜索、输入法、浏览器和其它互联网产品及服务提供商。从2004年8 月搜狐公司推出全球首个第三代互动式中文搜索引擎——搜狗搜索以来,历经十余载,搜狗搜索已发展成为中国第二大搜索引擎。根据艾瑞咨询2016年12月数据,搜狗PC用户规模达5.28亿,仅次于腾讯,成为中国第二大互联网公司。移动端APP用户仅次于腾讯,成为中国互联网快速发展的标杆性企业。

http://corp.sogou.com/
科大讯飞机构

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市。

http://www.iflytek.com
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
图像分割技术

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

自动化机器学习技术

机器学习最近在许多应用领域取得了长足的进步,这促成了对机器学习系统的不断增长的需求,并希望机器学习系统可以被新手快速地熟悉并使用。相应地,越来越多的商业企业推出产品旨在满足这种需求。这些服务需要解决的核心问题是:在给定数据集上使用哪种机器学习算法、是否以及如何预处理其特征以及如何设置所有超参数。这即是自动化学习(AutoML)企图解决的问题。

百度机构

百度是全球领先的人工智能平台型公司。百度大脑是中国领先的“软硬一体AI大生产平台”,是百度AI的集大成,对外全方位输出超过270多项核心AI能力,服务230万开发者。飞桨是中国首个全面开源开放、功能完备的产业级深度学习平台,是中国自主研发的“智能时代的操作系统”。百度智能云是百度AI To B 业务的重要承载者和输出者,是产业智能化领导者。小度助手是中国领先的对话式人工智能操作系统,拥有中国市场最繁荣、开放的对话式人工智能生态,今年6月,小度助手语音交互次数超过58亿次。作为全球领先的、最活跃的自动驾驶开放平台,百度Apollo代表中国最强自动驾驶实力,被知名研究公司Navigant Research列为全球四大自动驾驶领域领导者之一。目前聚焦在以自动驾驶、汽车智能化、智能交通为核心的三大赛道。自动驾驶技术方面,超过十项中国第一,实力领跑行业。智能交通方面,百度 “ACE交通引擎”是全球首个车路行融合的全栈式智能交通解决方案。

https://www.baidu.com/
腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。 腾讯希望成为各行各业的数字化助手,助力数字中国建设。在工业、医疗、零售、教育等各个领域,腾讯为传统行业的数字化转型升级提供“数字接口”和“数字工具箱”。我们秉持数字工匠精神,希望用数字创新提升每个人的生活品质。随着“互联网+”战略实施和数字经济的发展,我们通过战略合作与开放平台,与合作伙伴共建数字生态共同体,推进云计算、大数据、人工智能等前沿科技与各行各业的融合发展及创新共赢。多年来,腾讯的开放生态带动社会创业就业人次达数千万,相关创业企业估值已达数千亿元。 腾讯的愿景是成为“最受尊敬的互联网企业”。我们始终坚守“科技向善”的初心,运用科技手段助力公益事业发展,并将社会责任融入每一个产品。2007年,腾讯倡导并发起了中国互联网第一家在民政部注册的全国性非公募基金会——腾讯公益慈善基金会。腾讯公益致力于成为“人人可公益的创连者”,以互联网核心能力推动公益行业的长远发展为己任。腾讯公益联合多方发起了中国首个互联网公益日——99公益日,帮助公益组织和广大爱心网友、企业之间形成良好的公益生态,让透明化的“指尖公益”融入亿万网民的生活。

http://www.tencent.com/
创新工场机构

创新工场由李开复博士创办于2009年9月,作为国内的创业投资机构,创新工场深耕在人工智能&大数据、消费和互联网、B2B&企业升级、教育、医疗等领域,并不断探索与创新,致力于打造集创业平台、资金支持、投后服务等的全方位生态投资服务平台。

http://www.chuangxin.com/
奔驰机构

德国汽车品牌,汽车的发明者,被认为是世界上最成功的高档汽车品牌之一,其完美的技术水平、过硬的质量标准、推陈出新的创新能力、以及一系列经典轿跑车款式令人称道。奔驰三叉星已成为世界上最著名的汽车及品牌标志之一。2016年10月,奔驰排2016年全球100大最有价值品牌第9名

相关技术
实例分割技术

实例分割是检测和描绘出现在图像中的每个不同目标物体的任务。

创新奇智机构

创新奇智(AInnovation)成立于 2018 年 3 月,是创新工场 AI 子公司,人工智能独角兽企业。公司以 “人工智能赋能商业价值” 为使命,致力于用最前沿的人工智能技术为企业提供 AI 相关产品及商业解决方案,通过 AI 赋能助力企业客户及合作伙伴提升商业效率和价值,实现数字化转型。创新奇智以 “技术产品”+“行业场景” 双轮驱动模式,为制造、金融、零售、公共服务等行业提供人工智能整体解决方案,已获取中冶赛迪、宗申、中集、宝武钢铁、中铁四局、中纺标、鸿海科技、玛氏、雀巢、嘉士伯、惠氏、邮储银行、光大银行、人保、太保、泰康等多家行业标杆客户。公司成立以来快速成长,在多个城市落地,形成全国性布局。创新奇智的飞速发展广受市场认可,荣获多项国内外大奖,如:MIT 全球最聪明公司 50、英国《金融时报》最具创新企业、2020 CB Insights AI100、《哈佛商业评论》拉姆・查兰管理实践奖、《Fast Company》中国最佳创新公司 50、中国人工智能产业独角兽 Top50、2020 最具登陆科创板潜力企业等。

http://www.ainnovation.com/
人脸检测技术

人脸检测(face detection)是一种在任意数字图像中找到人脸的位置和大小的计算机技术。它可以检测出面部特征,并忽略诸如建筑物、树木和身体等其他任何东西。有时候,人脸检测也负责找到面部的细微特征,如眼睛、鼻子、嘴巴等的精细位置。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

推荐文章
暂无评论
暂无评论~