创新奇智荣获Cityscapes实例分割冠军,算法商用价值大

近日,创新奇智(AInnovation)在国际权威图像分割竞赛Cityscapes上获得实例分割评测的第一名,以明显优势刷新实例分割任务世界纪录,超越NVIDIA(英伟达)、Facebook、Uber、香港中文大学、商汤、搜狗科大讯飞等几十支强劲的国际企业和科研机构。

迄今为止,在短短5个月时间内,创新奇智已连续在世界顶级人脸检测竞赛WIDER FACE、物体检测竞赛 PASCAL VOC图像分割竞赛Cityscapes中取得三连冠的佳绩,充分彰显了创新奇智计算机视觉识别领域的技术实力和算法创新能力。

图片来源:Cityscapes官网

Cityscapes 数据集

Cityscapes评测数据集在2015年由奔驰公司推动发布,是目前公认的机器视觉领域内最具权威性和专业性的图像分割数据集之一。在Cityscapes评测数据集之中,共分为像素级分割和实例分割两个子任务,其中相较于像素级分割,实例分割的难度要更大,也是计算机视觉领域最重要、最具挑战的任务之一。

在Cityscapes实例分割任务所对应的数据集中,包含了5000张精细标注的图像和20000张粗略标注的图像,其中包含50个城市的不同场景、不同背景、不同街景,以及30类涵盖地面、建筑、交通标志、自然、天空、人和车辆等的物体标注。该数据集以关注真实场景下的环境理解著称,任务难度更高。

截至目前,Cityscapes评测吸引了近百支队伍参赛,包括Facebook、Uber、香港中文大学、商汤、NVIDIA(英伟达)、搜狗科大讯飞等众多国内外优秀创新企业和顶尖学术机构参加。创新奇智提出的AInnoSegmentation算法在各项指标中均有突破性进展,各项指标均名列第一,综合成绩第一。

创新奇智AInnoSegementation算法

AInnoSegmentation算法是以著名的Mask R-CNN网路架构为基础,骨干网络使用SE-Resnet152网络架构,使用它来提取多尺度特征图,颈部网络采用一个6级特征金字塔网络(FPN),用来生成更加丰富的多尺度卷积特征。然后使用自研的特征融合模块作为特征融合器,后面连接两个共享子网,一个负责分类和框回归,一个负责图像分割

Mask R-CNN网络图

看看AInnoSegementation算法的表现吧:

AInnoSegementation算法在Cityscapes数据集上的表现

实例分割算法的商业价值

创新奇智自成立伊始就瞄准高精尖的人工智能算法在制造、零售、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。目前,创新奇智已经打造出业界领先的自动化机器学习平台和AI工业视觉平台ManuVision,并发表了数篇顶级会议论文。这些成果实实在在提高了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了计算资源。

AInnoSegmentation算法在工业视觉中应用非常广泛,典型场景包括:缺陷检测,定位,识别等复杂场景。例如,创新奇智已将该算法应用于成衣、磁性材料等质检场景下,提高产品的质检精准度。

AInnoSegmentation算法还可以应用于零售业中的渠道陈列和智能货柜等商品识别场景,提高商品识别准确度的同时,帮助客户提升运营效率。

另外,创新奇智还将AInnoSegmentation算法应用于钢铁厂智慧铁水无人机车运输系统上,进一步提高该解决方案的成熟度和技术壁垒。

创新奇智
创新奇智

人工智能技术创新公司,专注“AI+”商业化落地

https://www.ainnovation.com/
产业实例分割创新奇智
3
相关数据
搜狗机构

搜狗成立于2003年,是中国搜索行业挑战者,AI领域的创新者。目前搜狗月活跃用户数仅次于BAT,是中国用户规模第四大互联网公司。2004年8月,搜狗推出搜狗搜索,现已成为中国第二大搜索引擎。2006年6月,推出搜狗输入法,重新定义了中文输入,目前搜狗输入法覆盖超5亿用户,是国内第一大中文输入法。2017年11月9日,搜狗在美国纽约证券交易所正式挂牌上市,股票交易代码为“SOGO”,开盘价为13.00美元,市值超50亿美元。

http://corp.sogou.com/
科大讯飞机构

科大讯飞股份有限公司(SZ.002230)成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。科大讯飞的语音合成、语音识别、口语评测、机器翻译等智能语音与人工智能核心技术代表了世界最高水平。

http://www.iflytek.com/
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
图像分割技术

图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。从数学角度来看,图像分割是将数字图像划分成互不相交的区域的过程。图像分割的过程也是一个标记过程,即把属于同一区域的像索赋予相同的编号。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

自动化机器学习技术

机器学习最近在许多应用领域取得了长足的进步,这促成了对机器学习系统的不断增长的需求,并希望机器学习系统可以被新手快速地熟悉并使用。相应地,越来越多的商业企业推出产品旨在满足这种需求。这些服务需要解决的核心问题是:在给定数据集上使用哪种机器学习算法、是否以及如何预处理其特征以及如何设置所有超参数。这即是自动化学习(AutoML)企图解决的问题。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
创新工场机构

创新工场由李开复博士创办于2009年9月,旨在用全方位的创业服务,帮助中国年轻创业者打造世界级企业。是国内一流的创业投资机构,目前管理超过130亿人民币的双币基金,投资阶段以A-C轮为主。主要关注人工智能、教育、消费升级、B2B企业服务、文化娱乐等领域,并不断探索与创新,致力于打造集创业平台、资金支持、投后服务等的全方位生态投资服务平台。迄今,创新工场参与投资的总项目数量累积超过300个,总部设于北京,在上海、深圳、硅谷设有办公室。

http://www.chuangxin.com/
奔驰机构

德国汽车品牌,汽车的发明者,被认为是世界上最成功的高档汽车品牌之一,其完美的技术水平、过硬的质量标准、推陈出新的创新能力、以及一系列经典轿跑车款式令人称道。奔驰三叉星已成为世界上最著名的汽车及品牌标志之一。2016年10月,奔驰排2016年全球100大最有价值品牌第9名

实例分割技术

实例分割是检测和描绘出现在图像中的每个不同目标物体的任务。

创新奇智机构

创新奇智(AInnovation)成立于2018年3月,是创新工场AI子公司,以“人工智能赋能商业未来”为使命,致力于用最前沿的人工智能技术为企业提供 AI 相关产品及商业解决方案,通过 AI 赋能助力企业客户及合作伙伴提升商业效率和价值,实现数字化转型。创新奇智已完成总金额逾5亿元的天使轮、A和A+轮融资。 创新奇智聚焦零售、制造、金融三个行业,打造“技术产品”+“行业场景”双轮驱动模式,拥有玛氏、永辉、原麦山丘、嘉士伯、雀巢、鸿海科技、徐工信息、中冶赛迪、香港怡东集团、邮储银行、光大银行、民生银行、太保安联等多家行业标杆客户,并形成以北京为核心,辐射广州、重庆、南京、宁波、合肥、成都、西安、青岛等地的全国性布局。创新奇智的飞速发展广受市场认可,先后获得:2019胡润中国潜力独角兽、中国准独角兽TOP50、2019科创板潜力新兴企业、中国十大最具潜力早期AI公司、中国人工智能明星创业公司TOP50、2019中国零售新锐技术企业奖、2019最佳AI创业企业、2019年度人工智能创新奖、制造业人工智能商业落地奖等奖项。

https://www.ainnovation.com/
人脸检测技术

人脸检测(face detection)是一种在任意数字图像中找到人脸的位置和大小的计算机技术。它可以检测出面部特征,并忽略诸如建筑物、树木和身体等其他任何东西。有时候,人脸检测也负责找到面部的细微特征,如眼睛、鼻子、嘴巴等的精细位置。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

推荐文章
暂无评论
暂无评论~