机器学习领域华人专家最多的前十所机构有哪些?

AMiner的AI华人智库是对照NSFC的人工智能专项代码F06,梳理出的人工智能领域的知名华人学者库,目前智库里已经收集了近1800位活跃在领域一线的华人专家学者。

该智库下有7个一级子领域和62个二级子领域,机器学习领域是其中一个一级子领域。机器学习已经成为了当今时代的热门话题,但是从机器学习这个概念诞生到机器学习技术的普遍应用经过了漫长的过程。

机器学习概念。普遍认为,机器学习(Machine Learning,常简称为ML)的处理系统和算法主要通过在数据和通过找出数据里隐藏的模式进而做出预测的识别模式,它是人工智能(Artificial Intelligence,常简称为AI)的一个重要子领域,而人工智能又与更广泛的数据挖掘(Data Mining,常简称为DM)和知识发现(Knowledge Discovery in Database,常简称为KDD)领域相交叉。

机器学习发展历程

机器学习的发展。机器学习已经成为了当今时代的热门话题,但是从机器学习这个概念诞生到机器学习技术的普遍应用经过了漫长的过程。

机器学习的论文解读。AMiner选取最近10年表1展示的顶级学术会议知识图谱领域全部论文作为备选池,在确定细分领域关键词后根据关键词进行细分领域论文的二次抓取。

机器学习的应用领域。机器学习人工智能的核心,应用遍及人工智能的各个领域,目前机器学习已经在数据挖掘计算机视觉自然语言处理、生物特征识别、搜索引擎、DNA序列测序、战略游戏和机器人等多个方面都得到了运用。

我们对此华人智库中的机器学习领域专家信息进行了统计。

自然语言处理华人专家分布地图

我们对机器学习华人专家分布进行分析,绘制机器学习华人专家分布地图。由上图可知,机器学习华人专家主要集中在北京这种科研院校集中的城市,其次在上海、南京、武汉、哈尔滨和西安等具有机器学习基础的地区也聚集了许多华人专家。

机器学习在国内企业的应用

百度大脑

百度大脑的四大功能,分别是语音、图像,自然语言处理和用户画像这四大能力:

  • 语音的能力:包括语音识别能力和语音合成能力。

  • 图像的能力:图像能力指的是看到一个图片,不仅能看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉

  • 自然语言处理能力:自然语言处理能力比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱

  • 用户画像:用户画像在传统的AI中并不是主流。但是今天,我们每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。

腾讯AI Lab

腾讯AI Lab成立于2016年,团队主要分布在在深圳、西雅图和北京。腾讯AI Lab研究主攻四个方向,包括机器学习计算机视觉语音识别自然语言处理;应用也主要是四个方向,包括社交、内容、游戏和平台型AI+X。

  • 2017年3月19日,腾讯人工智能实验室AI Lab研发的围棋AI程序“绝艺”在第十届日本UEC杯计算机围棋大赛中夺冠,成为当时国内AI界讨论的热点。

  • 2019年1月3日,腾讯AI Lab主任张潼,机器学习大数据分析领域的国际知名学者,美国新泽西州立大学统计系教授,曾任百度研究院副院长,从腾讯AI Lab离职,由张正友接任。

机构分布

我们以华人专家库机器学习领域中的学者的信息为基础数据,对其所属机构进行分类,统计后发现华人专家库机器学习领域中的学者主要集中在中科院、清华大学、北京大学、南京大学、复旦大学、上海交通大学、东南大学、华中科技大学、哈尔冰工业大学、和国防科技大学等高校。

性别分析

华人专家库机器学习领域中的学者有96%是男性,4%是女性。

AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。系统2006年上线,吸引了全球220个国家/地区800多万独立IP访问,数据下载量230万次,年度访问量1000万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

https://www.aminer.cn/
专栏二维码
产业机器学习
1
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

大数据技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

推荐文章
暂无评论
暂无评论~