午一作者

潘云鹤院士:大数据智能是人工智能2.0的核心组成部分

近日,在线上召开的第九届全国社会媒体处理大会(SMP 2020)特别邀请了人工智能领域专家潘云鹤院士为大家做了题为“大数据智能”的精彩演讲。潘院士从大数据智能的起源、发展和应用三个方面对大数据智能进行了全面的介绍,干货满满。

图 潘云鹤院士在讲座中潘云鹤教授于 1997 年当选为中国工程院院士,长期从事计算机图形学、人工智能、CAD 和工业设计等领域的研究,是中国智能 CAD 和计算机美术领域的开拓者之一,共获国家科技进步奖二等奖和省部级科技进步奖 7 项。曾任浙江大学校长、党委常委,中国工程院常务副院长。目前兼任国务院学位委员会委员、国家新一代人工智能战略咨询委员会组长等职。

学术君就潘云鹤院士在论坛中的精彩演讲进行整理,内容略有删改:

一、互联网和大数据孕育了 AI2.0    

2007 年图灵奖得主 Jimy Gray 提出了数据密集型科学研究的第四种范式,2008 年 nature 推出了 BigData 专刊,大数据概念应运而生,大数据虽然至今仍然没有一个统一的定义,但是大数据却具有 “4V”即大量化(volume)、多样化(variety)、快速化(velocity)和价值密度(value)等四个特征。

2014 年人们发现世界正在从传统的二元空间(人类社会空间(H)和物理空间(P))向三元空间,即人类社会空间(H)、物理空间(P)和新增的信息空间(C)的三元空间转变。

图 二维空间向三位空间转变示意图

信息空间(C)是一个正在快速增长的新“空间”维度,近 50 年来信息基本都是从人类社会产出,后来通过互联网进行无限的连接,加上近些年来自于物理世界比如传感器和物联网等非人类社会产生的信息,让人类名副其实的进入了“大数据”时代,大数据时代,必然走向大知识,2020 年疫情的推动将加速三元关系的变化。


传统的二元世界存在两种关系,第一种是人类社会和物理世界的关系,第二种是人类和人类的关系,在进入三元社会之后不管是物理世界和人类社会都将信息空间(C)产生密切的关系,而且这种关系将会越来越强。

图 信息空间与传统二元世界的关系信息空间中的信息流将推动我们现有科技与产业从三个方面发生变化:

·新通道:给科学、技术、经济社会的研究与发展提供了新途径、新方法、新产品和新模式;

·新计算:建立在新老空间的互动 CH、C P之上的 AI;

·新门类:能够从新的视角认识现有的复杂巨路系统,比如城市运行系统、环境生态系统。

信息环境的巨变(超级计算、物联网)、社会新的需求(智慧城市、智能医疗)、AI 基础和目标的巨变(虚拟现实群体智能)等新的变化和需求促使了 2015 年人工智能 2.0 概念的提出。

2017 年中国发布了《新一代人工智能发展规划》,发展规划提出了 AI2.0 的关键理论和技术,并提出了 AI2.0 的应用场景,推动中国人工智能发展迈向新的台阶。

图 新一代AI发展规划内容

二、知识表达将引导大数据智能的发展

潘云鹤院士首先带我们认识了各种形式的知识:
(1)结构化数据就是一种知识,和以往的程序计算数据的方式不同,AI采用的是数据驱动程序的方法;
(2)知识图谱不但能用于搜索和分析,还能用于推理与学习,是另一种知识表达,2012年浙江大学人工智能研究所研发了 KS-studio,提出了将大数据转换为知识图谱的自动生成和关系发现技术;
(3)深度神经网络(DNN)本质上也是一种知识表达,深度神经网络可用于识别图像、声音,但是缺点是解释性差,对机器友好,对人不友好的但是好用的一种知识表达;
(4)视觉知识(VK),是对视觉形象进行操作的一种知识表达,未来期望通过VK来模拟人的形象思维,提高形象相关工作的效率。

图 四种知识表达的数据形式、特色应用

数据形式与应用目标不同,形成了不同的知识表达类型,随着非结构化数据的细分和应用,将不断的推动新的知识表达技术的诞生,同时不同的知识表达有自己擅长的领域,多种知识的协同使用,将能提高系统的智能水平,比如深度神经网络(DNN)和视觉知识结合能在实际应用中就能提高识别率,DNN 类似于人类的短期记忆,擅长感知识别,视觉知识类似于人类的长期记忆,善于推理、变化等迁移应用,两者“长短”结合,能有效的提高识别率,海康威视研究院基于视觉概念学习的自主目标检测就是该方法的典型应用。

海康威视研究院基于视觉概念学习的自主目标检测

三、大数据智能的应用广泛而深入

随着大数据的广泛应用,数据已经不仅仅是数据,而是一座待开发的矿山,各行各业的人都希望能在自己积累的数据当中发掘出有价值、有意义的“金矿”。中国通信院对制造业智能应用进行了一次调研,从影响因素和复杂度两个维度对人工智能的应用范围进行了划分,从图中可以看出那些本身流程和操作比较机械化,同时复杂度低的工作比较适合机器学习的应用,而那些复杂的质检、指标软测量等工作比较合适合于深度学习的应用。

图 制造业智能应用总体图

人工能智能能够辅助政府实现对经济运行的智能治理,人工智能能通过对经济指标的提取,实现对问题原因的多维度分析和预警预测,通过与可视化终端的交互(手机 APP),帮助政府更快、更准确的了解区域经济运行的状况,从而有利于政府根据具体情况进行“精准施策”。

同时绘制产业链地图,动态展示产业链上企业的发展情况,结合区域经济的优势和短板,快速识别问题、反馈问题,辅助有关部门制定针对该问题的相关对策。

人工智能辅助政府进行经济治理

还能根据产业的发展情况,结合企业的实际情况,企业的实际需求,帮助企业从产业、项目、人才角度进行整体规划,根据现有产业的发展状况,辅助企业实现招商引资,人才引入和产业布局。

此外潘云鹤院士还制作了智能金融的鸟瞰图,从大数据智能、群体智能、跨媒体智能、人机融合增强智能和自动智能系统五大 AI 技术出发,绘制出了 AI 技术在金融领域应用的图谱,让 AI 技术能在客户服务、风险控制、精准营销、资产管理和金融监管等领域发挥更大的作用。

图 智能金融鸟瞰图

演讲的最后潘云鹤院士提出大数据智能及其新技术是富饶的无人区,希望不断的人能在这个领域进行新的探索,成为勇闯这个领域的“新英雄”。

学术君真心希望目前已经投身和未来即将从事 AI 事业的各位学者都能在将来成为AI领域的“新英雄”!!

AMiner学术头条
AMiner学术头条

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业潘云鹤
相关数据
海康威视机构

海康威视是以视频为核心的智能物联网解决方案和大数据服务提供商。海康威视拥有视音频编解码、视频图像处理、视音频数据存储等核心技术,及云计算、大数据、深度学习等前瞻技术。为PBG(公共服务事业群)、EBG(企事业事业群) 、SMBG(中小企业事业群)三个事业群客户提供专业的细分产品、IVM智能可视化管理解决方案和大数据服务。

http://www1.hikvision.com/cn/index.html?jmode=j1
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

计算机图形技术

图像数据处理、计算机图像(英语:Computer Graphics)是指用计算机所创造的图形。更具体的说,就是在计算机上用专门的软件和硬件用来表现和控制图像数据。

概念学习技术

概念学习,也称为类别学习、概念获得和概念形成,定义为“搜索和列出可用于区分各种类别的非样本的样本的属性”。 更简单地说,概念是帮助我们对对象、事件或想法进行分类的心理类别,建立在对每个对象、事件或想法具有一组共同相关特征的理解的基础上。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

群体智能技术

集群智能(Swarm Intelligence),是指在某群体中,若存在众多无智能的个体,它们通过相互之间的简单合作所表现出来的智能行为,集群机器人便是集群智能一类。它由Gerardo Beni和Jing Wang于1989年在细胞机器人系统的背景下引入。

目标检测技术

一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置,这是计算机视觉领域最基本和最有挑战性的问题之一。近些年兴起的深度学习技术是一种可从数据中直接学习特征表示的强大方法,并已经为一般目标检测领域带来了显著的突破性进展。

量化技术

深度学习中的量化是指,用低位宽数字的神经网络近似使用了浮点数的神经网络的过程。

推荐文章
暂无评论
暂无评论~