创新奇智在国际顶级视觉大赛PASCAL VOC夺冠,彰显AI视觉算法实力

近日,在国际顶级的计算机视觉竞赛Pascal VOC挑战赛目标检测comp4赛道上,创新奇智(AInnovation)研发的AInnoDetection 目标检测算法获得综合成绩排名第一的好成绩,超越GoogleMicrosoftCMU(美国卡耐基-梅隆大学)、清华大学、阿里巴巴平安科技搜狗Yi+腾讯优图等众多国内外知名人工智能企业和高校人工智能实验室,在Pascal VOC20项的评测指标中,其中10项指标排名第一,充分体现了创新奇智人工智能算法能力,尤其是AI视觉算法的创新和设计能力。

创新奇智20项评测指标中取得10项指标第一、总分第一的成绩

Pascal VOC 数据集

 目标检测是图像领域三大基本任务之一,同时也是图像领域非常具有挑战的算法难题。Pascal VOC挑战赛是世界最权威的三大计算机视觉挑战赛之一,其数据集标注质量高、场景复杂、目标多样、检测难度大,是快速检验算法有效性的首选。Pascal VOC数据量小但是场景丰富,更加考验人工智能算法的设计和创新能力。ImageNetMSCOCO数据量大,侧重考查人工智能算力的建设能力。

 Pascal VOC是国内外AI公司竞相展开激烈竞争的主赛场。截至目前,Pascal VOC挑战赛吸引了全球近百支专业队伍参赛,包括GoogleMicrosoftCMU(美国卡耐基-梅隆大学)、清华大学、阿里巴巴腾讯搜狗Yi+平安科技等国内外知名图像领域的顶尖团队参与比赛。

 Pascal VOC的数据集包括数十个类别,包括人类、动物、交通工具、室内物体等。创新奇智视觉算法团队参加了Object Detection (Competition4) 子任务,在20类不同的目标检测上获得了10个类别的检测MAP(准确率)第一、总分第一的成绩。

Pascal VOC数据集部分样本

创新奇智AInnoDetection算法

创新奇智提出的AInnoDetection模型算法,使用著名的二阶段检测算法,采用数据增强来扩充训练数据,包括填充小物体和mixup的方法。

通过以上步骤,使检测模型能够对小物体检测效果更好,同时能够使模型预测效果更好,更健壮。

模型选择著名的二阶段检测网络,骨干网络使用ResneXt152网络架构,使用它来提取多尺度特征图,颈部网络采用一个6级特征金字塔网络(FPN),用来生成更丰富的多尺度卷积特征金字。在这之后,连接两个共享子网,一个子网负责分类目标框,另一个网络负责将目标框回归到真实框,最后使用focal-loss作为二分类的损失。同时采用多尺度测试融合,这样能够使网络根据不同的图像尺度来关注不同的目标框信息。

让小图片更加关注大物体,大图片更加关注小物体。

 最后采用多模型融合的方法,输出最优的结果。
目标检测算法的商用价值

创新奇智自成立伊始就瞄准高精尖的人工智能算法在零售、制造、金融等多个领域的商业化产品落地,重点突破人工智能算法的领先性和成熟性,形成具有巨大商业潜力的AI产品和解决方案。目前,创新奇智已经打造出业界领先的机器学习平台和AI工业视觉平台ManuVision,并发表了数篇顶级会议论文。这些成果实实在在提升了算法在实际场景的精度,提升了训练和推理的速度,并极为高效地整合了算力资源。

据悉,创新奇智人工智能视觉算法已经应用在零售渠道陈列监控的商品识别、智能货柜、工业视觉、智慧园区社区等领域,商用效果处于行业领先水平。此次夺冠的目标检测算法在创新奇智的商品检测、工业视觉缺陷检测、渠道陈列监控等产品中已经使用。除了这次Pascal VOC赛事夺冠之外,创新奇智在多个世界顶级人工智能算法大赛上夺冠,比如最近,创新奇智在WIDER FACE人脸检测赛事中夺冠。

关于参赛团队

创新奇智本次Pascal VOC竞赛夺冠队伍由张发恩、吴佳洪、杨志铮、曹浩天、宋剑飞和范馨予组成。其中团队Leader张发恩现任创新奇智CTO、创新工场人工智能工程院首席架构师和宁波诺丁汉大学荣誉教授,他在人工智能工业界和学术界成绩不菲,曾任职Microsoft、Google和百度,持有多项国内外人工智能算法专利和发表过数篇人工智能顶级会议论文。队伍中其他成员也都有着深厚的人工智能教育背景和从业经历。

创新奇智创新工场的AI子公司,以“人工智能赋能商业未来”为使命,致力于用最前沿的人工智能技术为企业提供AI相关产品及商业解决方案。创新奇智CEO徐辉在IT行业拥有20余年的销售、产品、技术、服务、管理经验,历任IBM微软、SAP等多家世界500强科技巨头企业高管,对中国市场各个行业发展有着深入了解。创新奇智采用 “技术产品”+“行业场景”双轮驱动模式,商业化速度飞快。

创新奇智拥有优异的技术研发团队,结合AI技术商业化的特点,制定了科学技术人才三级体系建设方案,三级体系形成一个金字塔结构,从顶到下分别是:“创新奇智科研委员会 — 创新奇智创新研究院 — 创新奇智工程算法研发团队”。其中,“创新奇智科研委员会” 由世界顶级人工智能科学家及知名专家担任,包括前腾讯AI Lab负责人张潼、 百度研究院三维视觉首席科学家杨睿刚、密歇根州立大学教授张弥、创新工场人工智能工程院执行院长王咏刚、创新奇智CTO张发恩。

创新奇智
创新奇智

人工智能技术创新公司,专注“AI+”商业化落地

https://www.ainnovation.com/
产业创新奇智目标检测计算机视觉
相关数据
搜狗机构

搜狗是中国互联网领先的搜索、输入法、浏览器和其它互联网产品及服务提供商。从2004年8 月搜狐公司推出全球首个第三代互动式中文搜索引擎——搜狗搜索以来,历经十余载,搜狗搜索已发展成为中国第二大搜索引擎。根据艾瑞咨询2016年12月数据,搜狗PC用户规模达5.28亿,仅次于腾讯,成为中国第二大互联网公司。移动端APP用户仅次于腾讯,成为中国互联网快速发展的标杆性企业。

http://corp.sogou.com/
Microsoft机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
平安科技机构

平安科技负责开发并运营集团的关键平台和服务,支持集团的保险、银行、投资和互联网业务高效发展,同时还是集团的技术孵化器,在云、人工智能和大数据方面有着强劲的研究和开发能力。平安科技通过“科技+互联网+金融”模式,在技术研究和储备方面,拥有超过18项新技术及全球研究和开发AI内部的能力,包括微表情、图像和语音识别及语义理解。

http://www.cstia.org.cn/
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。 阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。 2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。 2018年7月19日,全球同步《财富》世界500强排行榜发布,阿里巴巴集团排名300位。2018年12月,阿里巴巴入围2018世界品牌500强。

https://www.alibabagroup.com/
相关技术
百度机构

百度是全球领先的人工智能平台型公司。百度大脑是中国领先的“软硬一体AI大生产平台”,是百度AI的集大成,对外全方位输出超过270多项核心AI能力,服务230万开发者。飞桨是中国首个全面开源开放、功能完备的产业级深度学习平台,是中国自主研发的“智能时代的操作系统”。百度智能云是百度AI To B 业务的重要承载者和输出者,是产业智能化领导者。小度助手是中国领先的对话式人工智能操作系统,拥有中国市场最繁荣、开放的对话式人工智能生态,今年6月,小度助手语音交互次数超过58亿次。作为全球领先的、最活跃的自动驾驶开放平台,百度Apollo代表中国最强自动驾驶实力,被知名研究公司Navigant Research列为全球四大自动驾驶领域领导者之一。目前聚焦在以自动驾驶、汽车智能化、智能交通为核心的三大赛道。自动驾驶技术方面,超过十项中国第一,实力领跑行业。智能交通方面,百度 “ACE交通引擎”是全球首个车路行融合的全栈式智能交通解决方案。

https://www.baidu.com/
腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。 腾讯希望成为各行各业的数字化助手,助力数字中国建设。在工业、医疗、零售、教育等各个领域,腾讯为传统行业的数字化转型升级提供“数字接口”和“数字工具箱”。我们秉持数字工匠精神,希望用数字创新提升每个人的生活品质。随着“互联网+”战略实施和数字经济的发展,我们通过战略合作与开放平台,与合作伙伴共建数字生态共同体,推进云计算、大数据、人工智能等前沿科技与各行各业的融合发展及创新共赢。多年来,腾讯的开放生态带动社会创业就业人次达数千万,相关创业企业估值已达数千亿元。 腾讯的愿景是成为“最受尊敬的互联网企业”。我们始终坚守“科技向善”的初心,运用科技手段助力公益事业发展,并将社会责任融入每一个产品。2007年,腾讯倡导并发起了中国互联网第一家在民政部注册的全国性非公募基金会——腾讯公益慈善基金会。腾讯公益致力于成为“人人可公益的创连者”,以互联网核心能力推动公益行业的长远发展为己任。腾讯公益联合多方发起了中国首个互联网公益日——99公益日,帮助公益组织和广大爱心网友、企业之间形成良好的公益生态,让透明化的“指尖公益”融入亿万网民的生活。

http://www.tencent.com/
创新工场机构

创新工场由李开复博士创办于2009年9月,作为国内的创业投资机构,创新工场深耕在人工智能&大数据、消费和互联网、B2B&企业升级、教育、医疗等领域,并不断探索与创新,致力于打造集创业平台、资金支持、投后服务等的全方位生态投资服务平台。

http://www.chuangxin.com/
目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

创新奇智机构

创新奇智(AInnovation)成立于 2018 年 3 月,是创新工场 AI 子公司,人工智能独角兽企业。公司以 “人工智能赋能商业价值” 为使命,致力于用最前沿的人工智能技术为企业提供 AI 相关产品及商业解决方案,通过 AI 赋能助力企业客户及合作伙伴提升商业效率和价值,实现数字化转型。创新奇智以 “技术产品”+“行业场景” 双轮驱动模式,为制造、金融、零售、公共服务等行业提供人工智能整体解决方案,已获取中冶赛迪、宗申、中集、宝武钢铁、中铁四局、中纺标、鸿海科技、玛氏、雀巢、嘉士伯、惠氏、邮储银行、光大银行、人保、太保、泰康等多家行业标杆客户。公司成立以来快速成长,在多个城市落地,形成全国性布局。创新奇智的飞速发展广受市场认可,荣获多项国内外大奖,如:MIT 全球最聪明公司 50、英国《金融时报》最具创新企业、2020 CB Insights AI100、《哈佛商业评论》拉姆・查兰管理实践奖、《Fast Company》中国最佳创新公司 50、中国人工智能产业独角兽 Top50、2020 最具登陆科创板潜力企业等。

http://www.ainnovation.com/
推荐文章
暂无评论
暂无评论~