新一代人工智能产业创新重点任务揭榜工作方案

为贯彻落实《新一代人工智能发展规划》(国发〔2017〕35号)和《促进新一代人工智能产业发展三年行动计划(2018-2020年)》(工信部科〔2017〕315号)要求,加快推动我国新一代人工智能产业创新发展,制定本方案。

一、工作目标

聚焦“培育智能产品、突破核心基础、深化发展智能制造、构建支撑体系”等重点方向,征集并遴选一批掌握关键核心技术、具备较强创新能力的单位集中攻关,重点突破一批技术先进、性能优秀、应用效果好的人工智能标志性产品、平台和服务,为产业界创新发展树立标杆和方向,培育我国人工智能产业创新发展的主力军。

二、揭榜任务和预期目标

一)智能产品

1.智能网联汽车

揭榜任务包括研发自动驾驶芯片、车辆智能算法、自动驾驶系统、车载通信系统等关键技术和产品,打造以车辆智能化计算平台为核心,集软件、硬件、算法、网联通信、信息安全一体化的车辆智能化平台。

预期目标:到2020年,突破自动驾驶智能芯片、车辆智能算法、自动驾驶、车载通信等关键技术,实现智能网联汽车达到有条件自动驾驶等级水平,自动驾驶智能芯片图像处理、信息融合、智能控制等计算能力缩小与国际先进水平差距,车载V2X系统通信能力及其能效比达到国际先进水平,满足车辆有条件自动驾驶等级下智能感知、自主决策、协同控制以及智能信息交换共享等计算和通信技术要求,完成安全、可靠的车辆智能化平台技术与功能验证及应用示范,形成平台相关标准,支撑高度自动驾驶(HA级)。

2.智能服务机器人

揭榜任务包括智能交互、智能操作、多机协作、三维成像定位、智能精准安全操控、人机协作接口等关键技术研发;清洁、老年陪护、康复、助残、儿童教育等家庭服务机器人,以及巡检、导览等公共服务机器人,消防救援机器人等特殊服务机器人研发;手术机器人及其操作系统研发。

预期目标:到2020年,突破智能服务机器人环境感知、自然交互、自主学习、人机协作等关键技术,实现智能家庭服务机器人、智能公共服务机器人的批量生产及应用,实现医疗康复、助老助残、消防救灾等机器人的样机生产,完成技术与功能验证及应用示范。

3.智能无人机

揭榜任务包括智能避障、自动巡航、面向复杂环境的自主飞行、群体作业等关键技术研发与应用,以及新一代通信及定位导航技术在无人机数据传输、链路控制、监控管理等方面的应用;智能飞控系统、高集成度专用芯片等关键部件研制。

预期目标:到2020年,智能消费级无人机三轴机械增稳云台精度达到0.005度,实现360度全向感知避障,实现自动智能强制避让航空管制区域,产品具有较强全球竞争力。

4.医疗影像辅助诊断系统

揭榜任务包括医学影像数据采集标准化与规范化,脑、肺、眼、骨、心脑血管、乳腺等典型疾病领域的医学影像辅助诊断技术研发,医疗影像辅助诊断系统的产品化及临床辅助应用。

预期目标:到2020年,多模态医学影像辅助诊断系统对脑、肺、眼、骨、心脑血管、乳腺等典型疾病的检出率超过95%,假阴性率低于1%,假阳性率低于5%,临床辅助应用逐步扩大。

5.视频图像身份识别系统

揭榜任务包括生物特征识别、视频理解、跨媒体融合等技术创新;人证合一、视频监控、图像搜索、视频摘要等典型应用。

预期目标:到2020年,复杂动态场景下人脸识别有效检出率超过97%,正确识别率超过90%,支持不同地域人脸特征识别,产品达到国际先进水平。

6.智能语音交互系统

揭榜任务包括新一代语音识别框架、口语化语音识别、个性化语音识别、智能对话、音视频融合、语音合成等技术创新及在智能制造、智能家居等重点领域推广应用。

预期目标:到2020年,实现多场景下中文语音识别平均准确率达到96%,5米远场识别率超过92%,用户对话意图识别准确率超过90%,产品达到国际先进水平。

7.智能翻译系统

揭榜任务包括高精准智能翻译系统创新,多语言互译、同声传译等典型场景应用。

预期目标:到2020年,明显突破多语种智能互译,中译英、英译中场景下产品的翻译准确率超过85%,显著提升少数民族语言与汉语的智能互译准确率,产品达到国际先进水平。

8.智能家居产品

揭榜任务包括智能传感、物联网机器学习等技术在智能安防、智能家具、智能照明、智能洁具等产品中的融合应用和智能家居新产品研发。

预期目标:到2020年,显著提升智能安防、智能家电等家居产品智能化水平,产品示范性应用强。

二)核心基础

9.智能传感器

揭榜任务包括微型化及可靠性设计、精密制造、集成开发工具、嵌入式算法等关键技术研发,基于新需求、新材料、新工艺、新原理设计的智能传感器研发及应用;新型生物、气体、压力、流量、惯性、距离、图像、声学等智能传感器研发应用;压电材料、磁性材料、红外辐射材料、金属氧化物等材料技术创新;研发基于微机电系统(MEMS)和互补金属氧化物半导体(CMOS)集成等工艺的新型智能传感器;研发面向新应用场景的基于磁感、超声波、非可见光、生物化学等新原理的智能传感器。

预期目标:到2020年,显著提高压电传感器、磁传感器、红外传感器、气体传感器等的性能,声学传感器信噪比达到70dB、声学过载点达到135dB并实现量产,压力传感器绝对精度100Pa以内、噪音水平0.6Pa以内并实现商用,磁传感器弱磁场分辨率达到1pT并实现量产。在模拟仿真、设计、MEMS工艺、封装及个性化测试技术方面达到国际先进水平。

10.神经网络芯片

揭榜任务包括研发面向机器学习训练应用的云端神经网络芯片、面向终端应用发展适用于机器学习计算的终端神经网络芯片,研发与神经网络芯片配套的编译器、驱动软件、开发环境等产业化支撑工具。

预期目标:到2020年,云端神经网络芯片性能达到128TFLOPS(16位浮点)、能效比超过1TFLOPS/w,终端神经网络芯片能效比超过1T OPS/w(以16位浮点为基准),支持卷积神经网络(CNN)、递归神经网络(RNN)、长短期记忆网络LSTM)等一种或几种主流神经网络算法;在智能终端、自动驾驶、智能安防、智能家居等重点领域实现神经网络芯片的规模化商用。

11.开源开放平台

揭榜任务包括研发面向云端训练和终端执行的开发框架、算法库、工具集等;建设开源开发平台、开放技术网络和开源社区,以及满足复杂训练需求的开放计算服务平台。

预期目标:到2020年,面向云端训练的开源开发平台支持大规模分布式集群、多种硬件平台、多种算法,面向终端执行的开源开发平台具备轻量化、模块化和可靠性等特征。

(三)智能制造关键技术装备

12.智能制造关键技术装备

揭榜任务包括具有自检测、自校正、自适应、自组织能力的工业机器人研发与应用;智能传感器与分散式控制系统(DCS)、可编程逻辑控制器(PLC)、数据采集系统(SCADA)、高性能高可靠嵌入式控制系统等控制装备创新及应用;基于图像识别、深度学习人工智能技术的智能检测装备的研发与应用;以及基于人工智能技术高速分拣机、多层穿梭车、高密度存储穿梭板等物流装备创新应用。

预期目标:到2020年,新一代工业机器人具备人机协调、自然交互、自主学习功能并实现批量生产及应用;智能传感与控制装备在机床、机器人、石油化工、轨道交通等领域实现集成应用;智能检测与装配装备的工业现场视觉识别准确率达到90%,测量精度及速度满足实际生产需求;智能物流与仓储装备智能化水平明显提升,满足精准、柔性、高效的物料配送和无人化智能仓储需求。

(四)支撑体系

13.行业训练资源库 

揭榜任务包括面向语音识别、视觉识别、自然语言处理等重点产品研发,以及工业、医疗、金融、交通等行业应用的高质量人工智能训练资源库、标准测试数据集和云服务平台。

预期目标:到2020年,基础语音、视频图像、文本对话等公共训练数据量大幅提升,在工业、医疗、金融、交通等领域汇集一定规模的行业应用数据,用于支持创业创新。

14.标准测试及知识产权服务平台

揭榜任务包括基础共性、互联互通、安全隐私、行业应用等技术标准在内的人工智能产业标准规范体系,人工智能产品评估测试体系,专利协同运营平台和知识产权服务平台。

预期目标:到2020年,初步建立人工智能产业标准体系,建成第三方试点测试平台并开展评估评测服务;在模式识别、语义理解、自动驾驶、智能机器人等领域建成具有基础支撑能力的知识产权服务平台。

15.智能化网络基础设施

揭榜任务包括高度智能化的下一代互联网、高速率大容量低时延的第五代移动通信(5G)网、快速高精度定位的导航网、泛在融合高效互联的天地一体化信息网,以及工业互联网、车联网等智能化网络基础设施。

预期目标:到2020年,全国90%以上地区的宽带接入速率和时延满足人工智能行业应用需求,在重点企业实现覆盖生产全流程的工业互联网示范建设,在重点区域初步建成车联网网络设施。

16.网络安全保障体系

揭榜任务包括满足智能网联汽车、智能家居等人工智能重点产品或行业应用安全需要,及基于人工智能先进技术的网络安全产品创新。

预期目标:到2020年,形成人工智能安全防控体系框架,初步建成具备人工智能安全态势感知、测试评估、威胁信息共享以及应急处置等基本能力的安全保障平台。

17.其他

人工智能产业发展涉及的其他重要技术、产品、服务和平台等。

三、步骤安排

(一)申请揭榜。从事人工智能技术创新、产品研发、融合应用、支撑服务等活动的相关企业、高校、科研院所等各类法人单位,或者由多个单位组成的联合体可申请成为揭榜单位。申请单位应具有较强的创新能力,对申请揭榜的产品或服务拥有知识产权,技术先进且应用前景良好。申请单位需承诺揭榜后能够在指定期限内完成任务。

(二)单位推荐各省、自治区、直辖市及计划单列市、新疆生产建设兵团工业和信息化主管部门(以下统称各地主管部门)、中央企业集团、人工智能相关行业组织为推荐单位,组织有关企业、高校、科研院所等填写申请材料,并在审核后统一报送推荐表和纸质申请材料。

(三)揭榜单位遴选工业和信息化部组织行业专家和评测机构进行集中评审和现场评估,综合考虑各申请单位的基础水平、创新能力、发展潜力、产品指标及各地区产业布局等因素,择优确定并公布揭榜单位名单(每个细分领域原则上不超过5家)。

(四)揭榜任务实施揭榜单位按照要求组织实施揭榜任务,开展集中攻关工作。期间,工业和信息化部持续跟踪揭榜单位产品创新及应用进展,适时组织行业专家对揭榜任务进行阶段性评估,不断优化揭榜任务实施路径。

(五)发布揭榜成果揭榜单位完成攻关任务后,可申请评价。工业和信息化部视进展情况组织行业专家,委托具备相关资质和检测条件的第三方专业机构开展评价工作。评价工作基于揭榜任务和预期目标,结合产业发展实际进行评估,适时公布评估结果,择优发布攻关成功单位(每个细分领域原则上不超过3家),给予重点推广和支持。

四、工作要求

各地主管部门、各中央企业集团要加强组织领导,充分调动企业、科研院所、相关产业联盟及行业协会的积极性。密切跟踪揭榜单位产品创新及应用进展,适时开展揭榜任务的阶段性评估,有效协调推进揭榜任务攻关组织实施工作。鼓励各地结合本地区人工智能产业发展情况,在相关配套资金、项目等方面优先给予支持,为揭榜单位完成攻关任务创造良好环境。

产业语音识别NLP深度学习工业机器人LSTM神经网络机器学习生物特征人脸识别无人机产业自动驾驶
3
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

图像搜索技术

图像搜索是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。图像搜索方法一般有两种:通过输入与图片名称或内容相似的关键字来进行检索;或者通过上传与搜索结果相似的图片或图片URL进行搜索。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

假阳性技术

假阳性是指模型因为种种原因把不应该分类成特定情况的人/物错误地分类到了该分类的情况。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

噪音技术

噪音是一个随机误差或观测变量的方差。在拟合数据的过程中,我们常见的公式$y=f(x)+\epsilon$中$\epsilon$即为噪音。 数据通常包含噪音,错误,例外或不确定性,或者不完整。 错误和噪音可能会混淆数据挖掘过程,从而导致错误模式的衍生。去除噪音是数据挖掘(data mining)或知识发现(Knowledge Discovery in Database,KDD)的一个重要步骤。

工业机器人技术

工业机器人是面向工业加工制造的可自动控制,多用途,需有三轴及以上可编程的固定或可移动机械手。其系统中包括带有执行机构的机械手以及示教控制器。 它可以依靠自身控制能力来执行预设的轨迹及动作。典型应用包括焊接,刷漆,组装,采集和放置等工作。工业机器人完成工作具有高效性,持久性和准确性。目前常用的工业机器人包括关节机器人,SCARA机器人,并联机器人和直角坐标机器人等。

规范化技术

规范化:将属性数据按比例缩放,使之落入一个小的特定区间,如-1.0 到1.0 或0.0 到1.0。 通过将属性数据按比例缩放,使之落入一个小的特定区间,如0.0到1.0,对属性规范化。对于距离度量分类算法,如涉及神经网络或诸如最临近分类和聚类的分类算法,规范化特别有用。如果使用神经网络后向传播算法进行分类挖掘,对于训练样本属性输入值规范化将有助于加快学习阶段的速度。对于基于距离的方法,规范化可以帮助防止具有较大初始值域的属性与具有较小初始值域的属相相比,权重过大。有许多数据规范化的方法,包括最小-最大规范化、z-score规范化和按小数定标规范化。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

图像处理技术

图像处理是指对图像进行分析、加工和处理,使其满足视觉、心理或其他要求的技术。 图像处理是信号处理在图像领域上的一个应用。 目前大多数的图像均是以数字形式存储,因而图像处理很多情况下指数字图像处理。

假阴性技术

假阳性是指模型因为种种原因将应该分类成特定情况的人/物错误地分类到了其他分类的情况。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

长短期记忆网络技术

长短期记忆(Long Short-Term Memory) 是具有长期记忆能力的一种时间递归神经网络(Recurrent Neural Network)。 其网络结构含有一个或多个具有可遗忘和记忆功能的单元组成。它在1997年被提出用于解决传统RNN(Recurrent Neural Network) 的随时间反向传播中权重消失的问题(vanishing gradient problem over backpropagation-through-time),重要组成部分包括Forget Gate, Input Gate, 和 Output Gate, 分别负责决定当前输入是否被采纳,是否被长期记忆以及决定在记忆中的输入是否在当前被输出。Gated Recurrent Unit 是 LSTM 众多版本中典型的一个。因为它具有记忆性的功能,LSTM经常被用在具有时间序列特性的数据和场景中。

暂无评论
暂无评论~