参与李泽南

百度研究院再升级:迎来9位世界级科学家

美国时间11月13日,百度研究院在美国硅谷召开会议,宣布百度研究院顾问委员会正式成立,并宣布在2018年陆续迎来9位世界级科学家加盟。当天,百度研究院院长王海峰领衔的百度研究院顾问委员会和核心科学家亮相百度美国办公室。

新成立的百度研究院顾问委员会包含 5 名成员,阵容星光熠熠,包括 AT&T 和贝尔实验室前副总裁及首席科学家 David Belanger,伊利诺伊大学厄巴纳-香槟分校终身教授、计算机视觉领域顶级科学家 David Forsyth,著名的计算语言学专家 Mark Liberman,卡耐基梅隆大学终身教授、机器人技术领域专家 Martial Hebert,明尼苏达大学终身教授、知识发现与数据挖掘(KDD)领域的最高技术荣誉 ACM SIGKDD 创新奖得主 Vipin Kumar 等,均是国际上享有盛誉的知名科学家。这些科学家的研究领域包括信息挖掘、计算机视觉、语音技术、机器人、大数据挖掘商业智能等,几乎囊括了 AI 领域从底层基础到认知、感知技术的全领域范畴。他们将成为百度研究院的「智囊」,带来最顶尖的研究经验,推动产出更多拥有世界级影响力的研究成果。此外,顾问委员会也将基于对百度 AI 技术的了解,为百度提供 AI 发展趋势的判断和未来研究方向的建议。

 百度研究院院长王海峰与顾问委员会委员

百度高级副总裁、AI 技术平台体系(AIG)总负责人、百度研究院院长王海峰在现场发言中对各位顾问委员的加入表示热烈欢迎。他提到,学术研究一直是产业间 AI 核心竞争力的重要组成部分。此次新成立的顾问委员会将为百度研究院的 AI 研究注入学术端的血液,让百度研究院在前瞻性的研究方向上,更具深远布局。未来我们将与这些科学家一起,继续去突破解决 AI 问题,用 AI 更好的服务社会和普通人的生活。

发展数年来,百度研究院不仅汇聚了 Kenneth Ward Church、吴华、李平、熊辉、杨睿刚、浣军、马艳军等国内外 AI 领域世界级专家, 还在 2018 年陆续引入了自然语言理解机器翻译领域专家黄亮,计算机视觉和生物特征领域专家郭国栋,悉尼科技大学教授、计算机视觉人工智能专家杨易,马里兰大学终身教授、马里兰大学帕克分校计算机科学系及电气与计算机工程系主任、自动驾驶和机器人领域领军人物 Dinesh Manocha 等科学家及顾问。

 百度研究院院长王海峰与新加盟科学家

目前,百度研究院旗下共有深度学习实验室(IDL)、大数据实验室(BDL)、硅谷人工智能实验室(SVAIL)、商业智能实验室(BIL)和机器人与自动驾驶实验室(RAL)5 个实验室,覆盖了包括自然语言处理计算机视觉、语音技术、大数据自动驾驶和机器人以及通用人工智能技术等全领域。它聚焦前瞻基础技术探索,布局 AI 未来方向。

会上,百度研究院还借此公布了近期在自然语言处理、语音、高性能计算、深度学习等 9 个领域的重要成果。

自然语言处理(NLP)领域,百度构建了最大的中文异构知识图谱,研发基于多文档校验的阅读理解技术、基于交互式学习的对话理解技术等,在 AI for Prosthetics Challenge 等国际知名赛事中屡获冠军。目前百度 NLP 技术几乎支持百度所有应用,每天被调用超过 3000 亿次,并通过百度 AI 开放平台对外开放。

基于自然语言处理技术和语音技术,百度建立了世界上第一个具有集成预期和可控延迟的语音实时翻译系统,这一技术已被成功应用于百度同传产品中,并在 11 月 1 日的百度世界大会上进行了展示。

语音合成领域,百度提出了第一个完全端到端的深度神经网络模型,可合成出接近于真人声音的语音。

在 AI 医疗领域,百度发布了拥有强大的肿瘤病理切片检测能力的「神经条件随机场」算法,可为癌症诊断和治疗提供重要助力,其检测准确率已经突破此前最高记录,甚至超过专业病理医生。

在机器人领域,百度开发了世界首个基于视觉的低成本建筑机械传感控制系统。基于该技术打造的无人挖掘机,可减少 40%人力成本,同时工程收益可以提升 50%。

商业智能领域,百度致力于区域画像、POI 知识图谱和用户画像等基础能力的研发,生成了数以千万条 POI 属性和数以亿条关系数据,完成了多尺度百万级区域的百余项指标的计算,并将这些能力成功应用于数读城市和百度地图的智能出行等产品中。

在高性能计算领域,百度作为主要创始机构发布了国际业界公认的开源深度学习性能基准平台 MLPerf 并产生巨大影响力,目前已吸引了 50 多家公司,和哈佛等 7 所顶级大学加入。

深度学习平台方面,作为国内唯一开源开放的深度学习框架,PaddlePaddle 近期正式发布了 1.x 的稳定版本,并在官方支持模型的完备性、超大规模深度学习并行技术和高速推理引擎等技术领域取得了领先优势。同时,PaddlePaddle 持续降低深度学习门槛,深度赋能各行各业,助力实体经济发展。基于开放普惠 AI 理念,百度还开发了自动深度学习技术 AutoDL,支持深度学习的自动设计、迁移和边缘计算适配。在开放测试集上测试,AutoDL 的设计能力超过人类专家,指标在业内居于世界领先地位。这一能力已经通过百度平台 EasyDL、AI Studio 免费向开发者开放,广大中小初创企业和个人无需特殊软硬件和工程团队,也能建立强大 AI 模型,加速 AI 应用落地。

大数据方向上,百度快速检索算法处于世界领先地位,同时专注开发实用机器学习算法平台,该算法在搜索、信息流、知识图谱等百度关键产品和技术上发挥着重要价值。

人工智能是第四次工业革命的核心驱动力,它的价值有目共睹,王海峰表示,「我们对人工智能的探索也将不断前行,未来无止境。」

产业百度
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

商业智能技术

商业智能(Business Intelligence,BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

条件随机场技术

条件随机场(conditional random field,简称 CRF),是一种鉴别式机率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。 如同马尔可夫随机场,条件随机场为无向性之图模型,图中的顶点代表随机变量,顶点间的连线代表随机变量间的相依关系,在条件随机场当中,随机变量 Y 的分布为条件机率,给定的观察值则为随机变量 X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链接式的架构,链接式架构不论在训练(training)、推论(inference)、或是解码(decoding)上,都存在有效率的算法可供演算。 条件随机场跟隐马尔可夫模型常被一起提及,条件随机场对于输入和输出的机率分布,没有如隐马尔可夫模型那般强烈的假设存在。 线性链条件随机场应用于标注问题是由Lafferty等人与2001年提出的。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推理引擎技术

推理机是实施问题求解的核心执行机构,常见于专家系统。它是对知识进行解释的程序,根据知识的语义,对按一定策略找到的知识进行解释执行,并把结果记录到动态库的适当空间中去。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~