想本科入读人工智能专业,这篇文章送给准备填志愿的你

这两天,全国各地的高考分数线基本都已出来了。挺过了高考千军万马过独木桥的难关,学子们现在最迷茫的就是填志愿了。最近,人工智能成为了新兴热门的专业,关于人工智能该如何报考,请看这里↓↓

文章有点长,目录预览:

  • 清华大学刘知远教授答疑

  • 各大开设人工智能的院校

  • 本科就读人工智能的体验(南京大学)

在计算机专业和人工智能日益火爆的当下,很多人对这两个专业又是好奇又是憧憬。对此,清华大学刘知远教授近日在知乎上分享了一些内容,以帮助考生更加理性地选择专业,希望更多真正喜欢 CS/AI 的考生选好学校选对专业。

刘知远教授从人工智能是什么、学什么、怎么学、以及去哪儿学的问题入手,对此进行了答疑。

清华大学刘知远教授答疑

人工智能是什么?

人工智能(Artificial Intelligence,AI)是一门年轻的学科,从 1956 年达特茅斯会议正式提出 AI 名称至今不过 65 年;从阿兰图灵 1950 年提出判断机器是否能够思考的图灵测试至今也不过 70 年时间。

AI 的 70 年发展史汇集了来自数学、计算机科学、逻辑学、哲学、神经科学语言学等不同领域学者的努力,是典型的交叉学科。同时,从整体来看 AI 仍然是计算机科学技术的主要分支。

人工智能是什么?简言之,人工智能学科是利用计算机实现人类智能。人类智能并没有公认的定义与界限,实际上也随着 AI 的发展而有所变化。某项人类技能被计算机所掌握后,人们往往不再认为它代表人类"真正"的智能。

例如,1997 年 IBM 深蓝战胜人类国际象棋冠军卡斯帕罗夫后,就有评论说 IBM 计算机只是在暴力搜索,不是真正的智能,that's not thinking!这种现象又被称为"AI Effect"。

所以,人工智能总是聚焦在那些尚未被计算机破解的人类智能能力上。比较简单的人类智能已经被解决了,例如计数能力有了计算器,数据记忆和查询有了数据库,下棋能力有了下棋软件,剩下的是那些困难的高级智能。

简单而言,如果我们把大脑看做一个黑盒,它能够接受外部世界的刺激信号,大脑处理这些信号产生输出反馈,人类智能正体现在这些"刺激-反馈"的对应中。针对不同刺激信号和反馈处理的复杂性,AI 下面有很多专门的领域开展相关研究和探索。

目前,公认的 AI 核心课题包括:机器学习计算机视觉自然语言处理语音处理、知识表示与计算、推理与规划,等等,并在此基础上支持着许多重要应用场景如无人驾驶、机器人等。

  • 机器学习:旨在让计算机具备自动学习的能力,能够解决分类、聚类、回归、关联分析等任务。目前主流是从大规模数据中自动学习和总结规律,从而能够对新的数据进行预测,也被称为统计机器学习。简单地讲,机器学习是从大量"刺激-反馈"数据中自动总结规律的技术。

  • 计算机视觉:旨在让计算机理解和处理图像数据(包括图片、视频等),使计算机掌握"看"的能力。图像是典型的无结构数据,由像素组成,如何从一幅图像中自动识别不同层次的对象(如轮廓、人脸、场景等)及其复杂关联,是计算机视觉面临的挑战问题。

  • 语音处理:旨在让计算机理解、处理和生成人类语音,使计算机掌握"听"和「说」的能力。语音也是一种典型的无结构序列数据,看似简单的一维语音信号包含着丰富的信息如内容、意图、身份、情感、信道、场景、干扰等。以语音识别为例,目前在深度学习技术的支持下,普通场景的语音转文本的效果已经得到广泛应用。而在多人、方言、强噪、远场等挑战场景下,语音识别效果还需要进一步提升。

  • 自然语言处理:旨在让计算机理解和处理人类语言。与 C++、Java 等人工设计的编程语言不同,人类语言是大自然的产物,因此被称为"自然语言"。人类语言也是典型的无结构数据,由字词组合而成,如何理解一句话、一篇文章甚至一本书的意思,也是人工智能面临的挑战问题。由于语言是人类特有的传递丰富信息和知识、表达复杂思想和情绪的载体,甚至被认为是人类思考的重要工具,因此自然语言处理问题更接近人类高级认知智能,有很多重要的开放问题。

  • 知识表示与计算:人类对世界的认识积累形成了知识,知识是人类理解外部信息、实现各种智能能力的基础。近年来随着知识图谱的广泛应用,成为研究界和工业界关注的重点问题。

由于上述这些课题都关涉人类智能,所以互相密切关联、不分彼此,例如计算机视觉语音识别自然语言处理都是机器学习算法的重要应用场景,知识表示与计算也成为计算机视觉自然语言处理方向的重要话题,等等。

正因为年轻,这些方向都充满着活力,一方面最新技术日益深远地影响着人类社会生活的方方面面,同时学科体系和技术框架也在飞速地日新月异、推陈出新,现在去翻十年前的教材很多内容都显得过时了。

从学科设置来看,国内大学遵照教育部《学位授予和人才培养学科目录》来颁发学位。最初的计算机一级学科是"计算机科学与技术",下设"计算机系统结构"、"计算机软件与理论"、"计算机应用技术"三个二级学科,其中"计算机系统结构"对应高性能计算(超算)和计算机网络体系架构(互联网),后来单独成立出"网络空间安全"一级学科;"计算机软件与理论"对应软件工程和计算机理论科学等,后来单独成立出"软件工程"一级学科;而"计算机应用技术"则对应计算机的各类应用技术,很大程度上正沿着从信息化到自动化再到智能化的路线前进,可以想见,如果现在这波 AI 浪潮还能持续几年,单独成立"人工智能"一级学科也指日可待。

从研究配置来看,AI 研究队伍主要分布在计算机、自动化、电子工程等信息科学相关院系中,这与 AI 起源有密切关系,计算机的奠基人图灵、冯诺依曼,自动化的主要理论基础"控制论"的奠基人维纳,以及电子工程和信号处理的主要组成"信息论"的奠基人香农,均为 AI 的创立贡献了思想。

所以,计算机系主要从计算理论和计算机应用的角度研究 AI,自动化系从自动控制的角度理解 AI,电子工程系则从信号处理(将 AI 关心的视觉、文本、听觉等模态理解问题看做信号处理)的角度解读 AI。

当然,在哲学、脑神经等其他领域也有从事人工智能探索的学者。不过总体而言,由于人工智能核心目标是探索如何将人类智能转化为可计算问题,因此它主要还是落在计算机领域。

如果希望对 AI 发展有比较通俗全面的了解,可以参考以下两本书:《人工智能狂潮》虽然标题名略显中 2,内容比较扎实,浅显全面并及时涵盖到最近的深度学习浪潮;《人工智能简史》是华人尼克的大作,作者搜集的史料全面扎实,夹叙夹议有很多干货,读起来很过瘾,不过很多地方点到即止,如果没有相关背景知识很难看懂作者所指。

人工智能学什么?

如前所述,人工智能大致还是一个计算机应用的课题。虽然这两年国内外已有很多高校开设了人工智能班和专业,课程设置还没有形成共识。我们可以从国内 AI 本科教育体系的先声——南京大学人工智能学院发布的《南京大学人工智能本科专业教育培养体系》做一些分析。

作为对比,这里列出清华大学计算机科学与技术系的选课指导清单,其中用红框标出了与人工智能有关的限选课程。

可以看到,人工智能需要学习的主要内容包括:

  1. 数学基础课:清华 CS 和南大 AI 都需要学习的有 微积分(或数学分析)、代数与几何、离散数学(或数理逻辑图论等)、概率论。南大 AI 新增 最优化方法,这在清华 CS 为研究生课程。

  2. 学科基础课:清华 CS 和南大 AI 都需要学习的有 程序设计基础、数据结构、人工智能导论、计算机原理、数字电路、系统控制。南大 AI 新增 机器学习、知识表示、计算机视觉自然语言处理 作为学科基础课,这在清华 CS 均为高年级选修课或研究生课程;清华 CS 需要额外学习 电路原理、信号处理操作系统、编译原理、形式语言与自动机,这些被南大 AI 列为专业选修课。

  3. 专业选修课:南大 AI 设立了很多 AI 相关的专业选修课,如 自动规划概率图模型强化学习神经网络深度学习等,在清华 CS 均为人工智能方向研究生课程;而南大 AI 设立的很多认知科学、神经科学、计算金融、计算生物学、计算语言学等交叉课程,在清华则分散在各院系开设的课程。

由此可以总结,目前看 AI 本科专业核心课程的设置与计算机专业相比,重叠部分要远大于差异部分。可以看出南大在 AI 课程体系构建方面花费了大量心力,非常符合 AI 的当前发展特点。

所以,回到这个问题,人工智能学什么?_建议就是以计算机核心课程(数学基础课、学科基础课)为学科主线,以 机器学习、知识表示、计算机视觉自然语言处理 为学科特色,以学科交叉为辅助_。

因此,我们也可以说,无论是在以南京大学人工智能学院为代表的新成立的人工智能专业,还是以清华大学计算机系为代表的计算机专业,都可以完成对人工智能基础知识的学习。

不同之处在于,前者预置为学科基础课,后者则成为高年级时的可选方向(计算机系统结构、计算机软件与理论、计算机应用技术)之一的计算机应用技术,如下是该方向的专业限选课程列表,其中超过一半课程是 AI 相关。

如果对这些课程要学什么感兴趣,可以购买查阅《南京大学人工智能本科专业教育培养体系》或者使用搜索引擎检索相关介绍。

人工智能怎么学?

清华大学章程明确提出"价值塑造、能力培养、知识传授"三位一体的育人模式,刘知远教授认为这是高水平 AI 人才养成方式的最佳描述。

知识传授这层不必多说,师者传道受业解惑,在大学里通过课程讲授和课下实践,研习精通计算机和人工智能理论与技术,每位同学通过一门门课程成绩反映出的,正是专业知识掌握的水平。绝大部分同学都能明白课程学习的重要性。然而,大学之道不仅于此,不然大学就不过是个专业技校。

在知识传授之上就要构筑能力培养,这对 CS/AI 专业而言尤其重要。计算机和人工智能是非常年轻的学科,正处在飞速发展的朝阳时期,学科知识更新换代很快,大部分最新知识根本无法在短时间内及时沉淀到教科书中。而进入教科书的那些知识,与实际应用场景往往已有较大距离。

很多 CS/AI 高科技公司自身就站在学科最前沿,亟需有快速学习和独立解决开放问题能力的人才。这样,一方面要求同学有意识建立终身学习的理念,有较强的独立学习的能力;另一方面则要求同学注意通过实验室研究等方式锻炼科研创新能力。

CS/AI 同学们需要主动参与科研工作的全过程,树立专业志趣,培养独立学习的能力、自我学习的习惯、提出问题的意识、以及独立解决开放问题的能力,这是大学培养 CS/AI 高水平人才的必由之路。因此,大学教师在 CS/AI 开展高水平原创研究的能力,也一定程度上决定了他们对学生进行能力培养的水平。

最后一层价值塑造也许是最玄乎的,但更加重要。一个人在知识和能力确定的情况下,Ta 的努力方向和坚持程度最终决定其成长的高度。找到在术业上的坚持方向,就是价值塑造的过程。

这个过程绝不是简单粗暴的灌输和宣讲就能实现的,要有高水平的教师一起教学相长,有志存高远的同学共同努力拼搏,有各界奋斗的学长作为示范榜样,有校外海外的实践平台广开视野。实践出真知,只有自己多听多看多想,才能找到自己喜欢的、努力的方向,也才更有后劲坚持不懈。

所以,不管是人工智能、计算机专业还是其他什么专业,只要想把自己培养成为该领域的可堪大用之才,就需要从知识、能力和价值这三个层面来努力提升自己。

人工智能去哪学?

上面说了这么多,接下来图穷匕见,再聊聊国内人工智能应该去哪里学。根据前面几个问题的回答,可以从师资水平、课程设置等方面来做判断,其中师资水平应该是最重要的因素,而课程设置、培养水平等与师资水平直接正相关。

如何判定 AI 师资水平,与 QS、THE、US News、ARWU 等大学或学科排名相比,刘知远更推荐 UMass 教授 Emery Berger 维护的高校计算机科学领域排名 CSRankings,采用 DBLP 数据库中大学 CS/AI 教授在不同方向顶级会议上发表的论文数量进行排名,有客观确切数据支持,例如美国号称 CS 四大名校的 Stanford、MIT、UCB 和 CMU 就排在美国前四位。同时 CSRankings 工程和数据全部开源在 github 上,可以非常方便地进行检查、复现和扩展。

CSRankings 将 CS 划分为 AI、Systems、Theory、Interdisciplinary Areas 四个一级方向,每个方向有有若干子领域,例如 AI 就又下分 General AI(AI 总方向)、Computer Vision (计算机视觉)、Machine Learning & Data Mining(机器学习与数据挖掘)、Natural Language Processing(自然语言处理)、The Web & Information Retrieval(互联网与信息检索)。

每个字领域只收录 2-3 个顶级会议,这主要是因为计算机科学技术由于发展比较快,所以学者们更重视通过国际会议论文发表最新成果进行学术交流,而不像其他领域那样主要是通过期刊发表最新研究成果。

由于 CSRankings 原网站没有提供中国单列的高校排名,国内学术网站 AMiner 做了一个改进版,除了提供中国高校单列名单外,还额外提供根据论文引用数量的排名。

如果按照 2009-2019 十年间论文发表统计,刘知远简单统计了国内 AI/CS 排名较高的高校(不含香港台湾高校、不考虑中科院)排序如下。同时表格还列出 2016-2019 近三年的排序数据,可以看到,最近几年国内高校 AI 进步神速,特别是清华 AI 已经跃居世界第一。

这个排序大致能够反映各大高校 CS/AI 专业的国际学术前沿整体水平,而且通过 AI 领域和 CS 整体的排名反差,可以观察到该高校 AI 方向的强势程度,例如复旦的 AI 排名高于其 CS 排名 2 位,哈工大 AI 排名高于 CS 排名 3 位等等,说明这两所大学的 AI 方向相对比较强势。而且,还可以看出,国内高校 AI 领域的世界排名明显超过 CS 整体的世界排名,说明国内高校在 AI 方面更接近世界前沿水平。

需要注意:

  1. 这个统计结果只能反映师资力量的一个侧面,而很多国内高校如北航、国防科大等在国家信息科学重大需求方面做出的巨大贡献如天河等,并无法客观反映到这个统计中。

  2. 由于 CSRankings 作者 Emery Berger 坚持只收录能招收博士的 CS 教授,因此那些在电子工程或自动华系等其他非 CS 系的教授没有被收录进来,从而导致该清单并不能完全反映各大高校的 AI 等领域的师资水平,但也正因为其只收录 CS 教授,也许对于我们评判这些高校的 CS 专业师资力量更有帮助。此外,部分高校可能存在教授列表不全等问题,而 CSRankings 接受修改申请,建议国内高校相关院系如果有遗漏 CS 教师的可以去申请更新。

CSRankings 主要以高校为单位进行排序,前几天我组同学用 CSRankings 开源数据,对 AI 领域的国内 C9 高校学者进行了排序,可以看到前 20 的学者有 7 位清华、5 位北大、2 位南大、2 位浙大、2 位哈工大、2 位复旦,可以从另一个侧面反映各高校的 AI 师资力量。

想去清华学人工智能去哪学?

作为清华人,刘知远教授当然推荐大家去清华学人工智能。因此,他对清华的人工智能专业进行了介绍:

  • 计算机类:含交叉信息研究院的计算机科学实验班(姚班)、人工智能学堂班(智班)、计算机系、软件学院。

  • 自动化(与工业工程)类、电子信息类。如前所述,自动化的主要理论基础"控制论"的奠基人维纳,以及电子工程和信号处理的主要组成"信息论"的奠基人香农,均为 AI 的创立贡献了思想,所以自动化系从自动控制的角度理解 AI,电子工程系从信号处理的角度解读 AI,也与 AI 有密切关系。因此自动化类、电子信息类也是学习 AI 的可选方案。

  • 数理类、文理通识类。数理类下的基础科学班以及文理通识类新雅书院,均支持同学自由选择未来发展方向。人工智能(特别是其中偏重基础理论的机器学习)是基科班同学的热门选择;而新雅书院也有大量同学选择计算机和人工智能方向。

  • 其他工科类交叉方向。清华是工科强校,在信息化和智能化的浪潮下,很多传统强势的工科方向近年来也开始努力开展智能化转型,如土木系的智能建造、电机系的智能电网,车辆学院的无人驾驶(成立了清华智能驾驶实验室)、精仪系的类脑器件(成立了清华类脑计算研究中心),可以说几乎每个工科大类都有深度参与智能化的研究方向。

  • 文科类。清华的文科方向大多小而精,例如社科学院有社科大数据的构建与研究,法学院致力于计算法学研究,中文系有计算语言学研究,外文系有语言认知研究,心理系有脑认知研究,美学院有信息交互设计和智能艺术创作研究,这些都与计算机和人工智能有密切联系,具有高度的文理交叉特点。

刘知远教授在计算机类中提到的姚班相信大家都已熟知,它是由图灵奖得主、清华大学交叉信息院院长、世界著名计算机科学家姚期智院士于 2005 年创办,重点着眼于计算机科学与物理学、数学、生命科学、经济学等相关学科的学科交叉培养。

智班(清华学堂人工智能班)是由姚期智院士于今年 5 月份新创办的,也将于今年 9 月份开始招收本科生,首批预计招收 30 人,以「广基础、重交叉」为培养特点。姚期智院士将担纲智班首席教授。

国内哪些学校可以学人工智能

前文中,刘知远教授已经为我们统计了一些可以学习人工智能的高校,但国内提供人工智能本科专业的高校远不止这些。

今年 3 月份,教育部在官网正式发布公告,北京科技大学、上海交通大学等 35 所高校获批新增「人工智能」本科专业,「人工智能」专业代码为 080717T,授予工学学位,四年制。

获批的除了南京大学、上海交通大学等教育部直属高校,哈尔滨工业大学、北京理工大学等工信部直属高校,还包括中北大学、中原工学院、华南师范大学等由各省主管的高校。完整名单见下图。

获批新增「人工智能」本科专业的 35 所高校

此外,机器之心还从「2018 年度普通高等学校本科专业备案和审批结果」中发现,有众多高校新增备案或者获批与大数据、机器人相关的专业,其中包括「数据科学大数据技术」、「机器人工程」、「大数据管理与应用」。

我们还注意到一些有趣的专业,例如哈尔滨工程大学新增获批的「海洋机器人」本科专业,北京体育大学新增获批的「智能体育工程」本科专业等。

本科就学人工智能是一种怎样的体验?南大有话说

从本科开始就学人工智能是一种什么样的体验?作为国内较早开设人工智能本科专业的高校,经历过一年学习的南京大学能为我们提供更多的经验。

前不久,周志华教授和南大人工智能本科专业的学生接受了南方都市报的采访,谈了谈他们的感受。

首先是数学基础。南京大学人工智能专业特别注重培养学生的数学基础,课表包含高等代数、数学分析、离散数学等诸多数学基础专业,学生直呼「烧脑」。但院长周志华表示,人工智能面临的问题千变万化,解决问题涉及到多种数学工具,高水平人才必须有好的数学基础。

在谈到与传统计算机科学专业在数学教学方面的差别时,周志华表示,传统计算机学科的数学教学情况是:微积分线性代数课程的内容很浅,通常不开设矩阵论;概率论与数理统计课程的内容仅是蜻蜓点水;最优化方法课程一般不开设;数理逻辑课程一般是选修。这造成学生在学习人工智能核心课程时有很大障碍。

周志华教授还指出,当前的课程设置并没有已经超越本科生的能力,既想打好基础、学有所用,又想学得轻松,「不太可能」。

学生表示,辛苦是这一专业的主旋律,但他们「忙并快乐着」,时不时地就有「梦回高三」的忙碌感。

其次,注重与产业的结合。

人工智能是一个与产业结合非常紧密的学科,因此南大也非常注重让学生到企业中学习。据报道称,南大学生能够在学校附近的南大人工智能学院学生实训基地现场感受一线产业应用。实训基地以京东、科沃斯、旷视、地平线等国内知名企业在南大附近建设的人工智能研究院或产业化公司为依托。

此外,南大还与英特尔腾讯等企业合作,为学生安排了智能硬件等的暑期实践课程。

小结

以上就是机器之心小编为考生们做的「功课」了,对人工智能感兴趣而且打算报考的同学可要做好吃苦的准备。

祝各位都能被心仪的学校录取呀~

参考内容:

https://zhuanlan.zhihu.com/p/68474477?utm_source=weibo&utm_medium=social&utm_content=snapshot&utm_oi=27569910972416

https://mp.weixin.qq.com/s/z-HeNw1xrnBRV5Eu-Awjyg

http://epaper.oeeee.com/epaper/A/html/2019-06/11/content_19699.htm?from=timeline&isappinstalled=0


入门专业南京大学清华大学
1
相关数据
来也科技机构

「来也」是国内领先的人工智能交互平台,由常春藤盟校(Ivy League)归国博士和MBA团队发起,核心技术涵盖自然语言处理(NLP)、多轮对话控制和个性化推荐系统等。公司已获得数十项专利和国家高新技术企业认证。 来也的愿景是通过AI赋能,让每个人拥有助理。C 端产品小来是智能化的在线助理,通过业内创新的AI+Hi模式,提供日程、打车、咖啡、差旅和个性化查询等三十余项技能(覆盖400w用户和数十万服务者),让用户用自然语言发起需求并得到高效的满足。B端品牌吾来输出知识型的交互机器人和智能客户沟通系统,帮助各领域企业客户打造行业助理。目前已经在母婴,商旅,金融和汽车等行业的标杆企业实现商业化落地。

https://www.laiye.com/
英特尔机构

英特尔是计算创新领域的全球领先厂商,致力于拓展科技疆界,让最精彩体验成为可能。英特尔创始于1968年,已拥有近半个世纪产品创新和引领市场的经验。英特尔1971年推出了世界上第一个微处理器,后来又促进了计算机和互联网的革命,改变了整个世界的进程。如今,英特尔正转型成为一家数据公司,制定了清晰的数据战略,凭借云和数据中心、物联网、存储、FPGA以及5G构成的增长良性循环,提供独到价值,驱动日益发展的智能互联世界。英特尔专注于技术创新,同时也积极支持中国的自主创新,与产业伙伴携手推动智能互联的发展。基于明确的数据战略和智能互联全栈实力,英特尔瞄准人工智能、无人驾驶、5G、精准医疗、体育等关键领域,与中国深度合作。面向未来,英特尔致力于做中国高价值合作伙伴,在新科技、新经济、新消费三个方面,着力驱动产业协同创新,为实体经济增值,促进消费升级。

https://www.intel.com/content/www/us/en/company-overview/company-overview.html
相关技术
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
地平线机构

地平线作为嵌入式人工智能全球领导者,致力于提供高性能、低功耗、低成本、完整开放的嵌入式人工智能解决方案。面向智能驾驶、智能城市和智能商业等应用场景,为多种终端设备装上人工智能“大脑”,让它们具有从感知、交互、理解到决策的智能,让人们的生活更安全、更便捷、更美好。

http://www.horizon.ai
周志华人物

周志华分别于1996年6月、1998年6月和2000年12月于 南京大学计算机科学与技术系获学士、硕士和博士学位。主要从事人工智能、机器学习、数据挖掘 等领域的研究工作。主持多项科研课题,出版《机器学习》(2016)与《Ensemble Methods: Foundations and Algorithms》(2012),在一流国际期刊和顶级国际会议发表论文百余篇,被引用三万余次。

刘知远人物

刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为表示学习、知识图谱和社会计算。2011 年获得清华大学博士学位,已在 ACL、IJCAI、AAAI 等人工智能领域的著名国际期刊和会议发表相关论文 60 余篇,Google Scholar 统计引用超过 2100 次。承担多项国家自然科学基金。曾获清华大学优秀博士学位论文、中国人工智能学会优秀博士学位论文、清华大学优秀博士后、中文信息学会青年创新奖,入选中国科学青年人才托举工程、CCF-Intel 青年学者提升计划。担任中文信息学会青年工作委员会执委、副主任,中文信息学会社会媒体处理专委会委员、秘书,SCI 期刊 Frontiers of Computer Science 青年编委,ACL、COLING、IJCNLP 领域主席。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

信息检索技术

信息检索(IR)是基于用于查询检索信息的任务。流行的信息检索模型包括布尔模型、向量空间模型、概率模型和语言模型。信息检索最典型和最常见的应用是搜索引擎。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

神经科学技术

神经科学,又称神经生物学,是专门研究神经系统的结构、功能、发育、演化、遗传学、生物化学、生理学、药理学及病理学的一门科学。对行为及学习的研究都是神经科学的分支。 对人脑研究是个跨领域的范畴,当中涉及分子层面、细胞层面、神经小组、大型神经系统,如视觉神经系统、脑干、脑皮层。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

图论技术

图论是以“图”为研究对象的一个数学分支,是组合数学和离散数学的重要组成部分。图是用来对对象之间的成对关系建模的数学结构,由“顶点”(又称“节点”或“点”)以及连接这些顶点的“边”(又称“弧”或“线”)组成。值得注意的是,图的顶点集合不能为空,但边的集合可以为空。图可能是无向的,这意味着图中的边在连接顶点时无需区分方向。否则,称图是有向的。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

信号处理技术

信号处理涉及到信号的分析、合成和修改。信号被宽泛地定义为传递“关于某种现象的行为或属性的信息(如声音、图像和生物测量)”的函数。例如,信号处理技术用于提高信号传输的保真度、存储效率和主观质量,并在测量信号中强调或检测感兴趣的组件。我们熟悉的语音、图像都可以看做是一种信号形式。因此,对于语音、图像的增强、降噪、识别等等操作本质上都是信号处理。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

微积分技术

微积分(Calculus)是高等数学中研究函数的微分(Differentiation)、积分(Integration)以及有关概念和应用的数学分支。它是数学的一个基础学科。内容主要包括极限、微分学、积分学及其应用。微分学包括求导数的运算,是一套关于变化率的理论。它使得函数、速度、加速度和曲线的斜率等均可用一套通用的符号进行讨论。积分学,包括求积分的运算,为定义和计算面积、体积等提供一套通用的方法 。

线性代数技术

线性代数是数学的一个分支,它的研究对象是向量,向量空间(或称线性空间),线性变换和有限维的线性方程组。向量空间是现代数学的一个重要课题;因而,线性代数被广泛地应用于抽象代数和泛函分析中;通过解析几何,线性代数得以被具体表示。线性代数的理论已被泛化为算子理论。由于科学研究中的非线性模型通常可以被近似为线性模型,使得线性代数被广泛地应用于自然科学和社会科学中。

图灵测试技术

图灵测试(英语:Turing test,又译图灵试验)是图灵于1950年提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等价或无法区分的智能。测试的谈话仅限于使用唯一的文本管道,例如计算机键盘和屏幕,这样的结果是不依赖于计算机把单词转换为音频的能力。

语音处理技术

语音处理(Speech processing),又称语音信号处理、人声处理,其目的是希望做出想要的信号,进一步做语音辨识,应用到手机界面甚至一般生活中,使人与电脑能进行沟通。

控制论技术

控制论是一门跨学科研究, 它用于研究控制系统的结构,局限和发展。在21世纪,控制论的定义变得更加宽泛,主要用于指代“对任何使用科学技术的系统的控制”。由于这一定义过于宽泛,许多相关人士不再使用“控制论”一词。 控制论与对系统的研究有关,如自动化系统、物理系统、生物系统、认知系统、以及社会系统等等。

概率图模型技术

在概率论和统计学中,概率图模型(probabilistic graphical model,PGM) ,简称图模型(graphical model,GM),是指一种用图结构来描述多元随机 变量之间条件独立关系的概率模型

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

信息论技术

信息论是在信息可以量度的基础上,研究有效地和可靠地传递信息的科学,它涉及信息量度、信息特性、信息传输速率、信道容量、干扰对信息传输的影响等方面的知识。通常把上述范围的信息论称为狭义的信息论,又因为它的创始人是香农,故又称为香农信息论。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

知乎机构

知乎作为中文互联网知名知识内容平台,致力于构建一个人人都可接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,高效获得可信赖的解答。 目前,知乎已经覆盖「问答」社区、一站式知识服务平台「知乎大学」、短内容分享功能「想法」等一系列产品和服务,并建立了包括音频、视频在内的多元媒介形式。截止 2018 年 8 月底,知乎用户数已突破 2 亿,回答数超过 1.2 亿。未来,知乎进一步加大对 AI 技术和应用的投入,构建一个由 AI 驱动的智能社区,让知识普惠每一个人。

https://www.zhihu.com
语言学技术

每种人类语言都是知识和能力的复合体,语言的使用者能够相互交流,表达想法,假设,情感,欲望以及所有其他需要表达的事物。语言学是对这些知识体系各方面的研究:如何构建这样的知识体系,如何获取,如何在消息的制作和理解中使用它,它是如何随时间变化的?语言学家因此关注语言本质的一些特殊问题。比如: 所有人类语言都有哪些共同属性?语言如何不同,系统的差异程度如何,我们能否在差异中找到模式?孩子如何在短时间内获得如此完整的语言知识?语言随时间变化的方式有哪些,语言变化的局限性是什么?当我们产生和理解语言时,认知过程的本质是什么?语言学研究的就是这些最本质的问题。

暂无评论
暂无评论~