Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

百度研究院晒出年度成绩单,九大实验室硕果累累

近日,一年一度的百度研究院顾问委员会会议圆满落幕。一向低调神秘的百度研究院,公布了一份亮眼的成绩单:最近一年,百度研究院在国际顶会和期刊上累计发表270多篇论文,夺得40多项国际权威竞赛冠军,获得30多项国内外奖项,在深度学习、视觉、生物计算、量子计算、机器人、安全等多个领域的前瞻技术研发和落地探索上,取得了丰硕成果。

百度研究院晒出年度成绩单,九大实验室硕果累累


前瞻技术全面突破 领跑全球

百度研究院晒出年度成绩单,九大实验室硕果累累

(百度研究院召开顾问委员会线上会议)

在前瞻技术方面,百度研究院在生物计算、量子计算、自然语言处理、隐私安全计算等领域取得持续突破,均处于世界领先水平。

新冠疫情期间,mRNA作为一种新型的疫苗类型,具有可大规模快速生产的优势,成为这场疫情保卫战的重要武器之一,但科学家难以通过传统算法在紧急时刻内找到最稳定的序列。

2020年4月,百度研究院正式推出LinearDesign算法。相较于传统的密码子优化设计方法,LinearDesign能大大提升mRNA疫苗序列的稳定性和蛋白质表达水平,以及疫苗的抗体滴度(即保护力)。针对新冠病毒刺突蛋白mRNA疫苗,LinearDesign可在10分钟以内寻找到稳定的序列设计,并在抗体滴度上,比通用的密码子优化序列有大幅度提升。也就是说,在同等条件下,采用百度算法设计的新冠疫苗,可以大大提升保护力。

LinearDesign不仅能用于新冠 mRNA 疫苗的研发,还能用于流感疫苗、肿瘤疫苗等多种疫苗,甚至包括抗体和药物的研发。真正将药物发现的“大海捞针”变成“按图索骥”,为人类的生命健康谋福祉。

在量子计算领域,百度研究院完成了以量脉、量桨、量易伏三大项目为主体的百度量子平台的数次重磅升级。其中量易伏成为国内首个接入量子计算真机的云原生量子计算平台。百度量子平台提供了连接顶层解决方案和底层硬件基础所需的大量软件工具以及接口,希望其成为“量子计算时代操作系统”。

在各项核心技术产出上,百度量子持续保持着国际领先地位,并正在发掘量子计算对AI科技的更多加持。量子人工智能在算法、框架、硬件三个层面进行AI基础能力的创新突破,预计能在准确率提升的同时大幅降低时间和能源成本。

在AI+工业领域,计算机视觉和深度学习等技术的进步,让工程机械也出现了“无人化”趋势。百度研究院打造了全球首个实际落地的、可长时间作业的无人挖掘机作业系统(AES),并被国际顶级期刊《Science》子刊 《Science Robotics》刊发相关技术成果。

AES融合了感知、运动规划和控制系统,可在没有任何人工干预的情况下工作,通过准确和实时的算法来自主感知环境、规划路线和控制机械。借助该系统打造的无人挖掘机不仅可以更好地适应塌方或有毒等恶劣的作业环境,降低人身安全危险;同时也能实现更长时间的不间断作业,提升工作效率。目前,AES已经落地工业废料处理相关领域,实现了工业废料连续24小时自动上料功能,助力工业废料处理产线实现全程的无人化处理。

百度研究院晒出年度成绩单,九大实验室硕果累累

(AES实战场景)

在视觉领域,百度研究院基于飞桨深度学习平台打造并发布了一个视觉Transformer&MLP算法开发及实验平台——PaddleViT,为业界提供了最前沿的4个视觉任务模型。在以人为中心的视觉分析方面,提出了一系列包括人脸年龄估计、人脸防伪、人脸表情识别、人脸伪造检测等算法,并出版一本关于活体检测的技术著作《Multi-modal Face Presentation Attack Detection》(《多模态人脸防伪检测》),该著作也被国际知名出版社Morgan & Claypool Publishers收录到其计算机视觉领域的系列丛书中。

人工智能技术特别是深度学习及其应用飞速发展,但深度学习的“黑盒”特性使其缺乏足够的可解释性,也降低了对特定领域的深度学习和人工智能的信任感。百度研究院开发了基于飞桨的可解释性算法开源库InterpretDL,目前已集成了十余种主流的可解释性算法,并遵循“Plug-and-Play”的设计理念,用户无需修改模型;所有算法使用统一API接口,方便用户快速上手;对每种算法提供单独的教程与解析,帮助用户理解、选择合适的算法,在多个领域都有明显的性能提升。

百度研究院还打造了业界首个针对机密计算的形式化验证工具SGXRay,协助厂商修复多个高危漏洞。并建立全球首个支持多硬件平台的、安全性最高的开源机密计算框架Teaclave,可提供RUST SDK,支持内存安全的可信应用开发。

在基础理论研究方面,百度研究院从理论、算法、硬件、应用方面构建了完整的分布式机器学习和联邦学习系统框架;在加速机器学习方面,百度研究院提出了包括近邻检索、哈希算法、模型压缩等一系列优化算法,并实现在百度深度学习框架飞桨当中。同时,百度研究院还持续研究深度学习和知识图谱Embedding构建、深度学习模型安全和攻击、深度生成模型包括GAN,EBM,VAE等;累计数十篇包括机器学习、深度学习基础理论的论文,在Journal of Machine Learning Research, IEEE Transactions of Information Theory, Conference on Learning Theory, NeurIPS 等顶级期刊和会议中发表,并获得NIPS 最佳论文奖和SIGIR 最佳短文荣誉提名奖等多个奖项。

应用落地遍地开花 赋能千行百业

百度研究院对技术的前瞻视野不仅体现在研发突破上,也融入在前沿技术的产业级落地探索上。

跳水运动作为一项超高速运动,从起跳到落水只有2秒钟时间,动作捕捉和回溯是长期以来的难点,百度研究院基于“3D+AI”技术,首次实现“云-边-端”软硬一体的AI辅助训练系统,通过AI技术对训练视频进行摘要、动作抽取、姿势纠正等处理,快速进行归纳整理,突破了体育运动定量评价与数据分析的难题,将竞技体育更精细化定格在时间和空间维度,让体育训练更加科学、智能、合理、有效,实现了“看得清”“看得准”“看得全”“看得懂”四大核心能力。

百度研究院晒出年度成绩单,九大实验室硕果累累

(“3D+AI”跳水辅助训练系统)

同传对于人类来说是一项很有挑战性的任务,因为人类同传译员需要同时做到听、理解、翻译并说出翻译内容。人类一般只能持续15分钟的高质量同传,且译出率一般都在60%左右,漏翻,错翻等情况时常发生。作为AI同传技术的领军者,百度AI同传首次做到了直接从语音到文字的同传翻译,该模型达到了更低的时延和更准确的翻译,彻底摒除了ASR错误对翻译模型的影响,进一步简化了整体同传框架。

如今,移动视频已经成为移动互联网使用最重要的三大应用类型之一。百度研究院于2020年推出了业界首个支撑通用型、大规模生产的智能视频合成平台VidPress影燃,可以低成本、大批量、高质量的将图文内容智能转化为带有配音配乐和画面的视频内容,将中、短视频采编创作的门槛降到最低。2021年,VidPress影燃携手秒懂百科,智能生成并发布了超过800条足球球员球队的介绍视频、精彩进球瞬间和慢动作回放视频。并作为百度大脑中“图文转视频”功能算子,助力人民日报将图文稿件智能转化为快讯短视频分发到不同平台,用低成本创造高品质内容。该能力还落地百家号,赋能图文作者低⻔槛转型为视频内容发布者。

在城市运营方面,基于大数据和人工智能技术,百度研究院也研发了支撑“数字城市运营”关键AI技术的“城立方”平台,包含了自动化城市大数据报告系统、卡口过车数据轨迹还原系统等模块。该系统已经部署在百度智能交通产品上,使交管决策有依据、算法可校验,让城市交通运营商模式行健致远。

学术研究和外部合作双驾马车 打造核心硬实力

作为百度旗下聚焦于人工智能前瞻基础研究、探索技术前沿方向的高端科研团队,百度研究院现已拥有认知计算实验室、硅谷人工智能实验室、深度学习实验室、大数据实验室、商业智能实验室、量子计算研究所、机器人与自动驾驶实验室、安全实验室、生物计算实验室九大实验室/研究所,研究领域几乎囊括了从底层基础到感知、认知技术的AI全领域范畴。数十位世界级顶尖专家学者汇聚于此,着力推动技术研发和布道。

百度CTO、百度研究院院长王海峰多次谈及百度研究院的战略:持续硬核技术创新,产生高影响力的研究成果并驱动实际应用。

基于这一理念,百度研究院也一直走在技术突破与落地应用的最前端,并不遗余力地推动技术的交流合作。近两年,百度研究院牵头举办了60余场学术研讨会,与产学研界广泛开展交流合作。在安全领域创办了以“自动驾驶安全”为主题的CTF比赛活动,并举办了面向全球的自动驾驶CTF比赛,推动AI感知与自动驾驶安全竞赛及社区建设。

无论在前瞻研究还是应用探索,百度研究院不断攀登新的高峰。当下,新技术正爆发出引领新一轮变革的强大推动力,百度也在持续追寻前沿科技的星辰大海。

产业
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

运动规划技术

运动规划(也被称为导航问题或钢琴搬运工的问题)是机器人的一个术语,用于将期望的运动任务分解成离散的运动,以满足运动的限制,并可能优化运动的某些方面。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

商业智能技术

商业智能(Business Intelligence,BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

深度生成模型技术

深度生成模型基本都是以某种方式寻找并表达(多变量)数据的概率分布。有基于无向图模型(马尔可夫模型)的联合概率分布模型,另外就是基于有向图模型(贝叶斯模型)的条件概率分布。前者的模型是构建隐含层(latent)和显示层(visible)的联合概率,然后去采样。基于有向图的则是寻找latent和visible之间的条件概率分布,也就是给定一个随机采样的隐含层,模型可以生成数据。 生成模型的训练是一个非监督过程,输入只需要无标签的数据。除了可以生成数据,还可以用于半监督的学习。比如,先利用大量无标签数据训练好模型,然后利用模型去提取数据特征(即从数据层到隐含层的编码过程),之后用数据特征结合标签去训练最终的网络模型。另一种方法是利用生成模型网络中的参数去初始化监督训练中的网络模型,当然,两个模型需要结构一致。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

百度机构

百度是全球领先的人工智能平台型公司。百度大脑是中国领先的“软硬一体AI大生产平台”,是百度AI的集大成,对外全方位输出超过270多项核心AI能力,服务230万开发者。飞桨是中国首个全面开源开放、功能完备的产业级深度学习平台,是中国自主研发的“智能时代的操作系统”。百度智能云是百度AI To B 业务的重要承载者和输出者,是产业智能化领导者。小度助手是中国领先的对话式人工智能操作系统,拥有中国市场最繁荣、开放的对话式人工智能生态,今年6月,小度助手语音交互次数超过58亿次。作为全球领先的、最活跃的自动驾驶开放平台,百度Apollo代表中国最强自动驾驶实力,被知名研究公司Navigant Research列为全球四大自动驾驶领域领导者之一。目前聚焦在以自动驾驶、汽车智能化、智能交通为核心的三大赛道。自动驾驶技术方面,超过十项中国第一,实力领跑行业。智能交通方面,百度 “ACE交通引擎”是全球首个车路行融合的全栈式智能交通解决方案。

https://www.baidu.com/
联邦学习技术

如何在保护数据隐私、满足合法合规要求的前提下继续进行机器学习,这部分研究被称为「联邦学习」(Federated Learning)。

Infor机构

Infor是一家跨国企业软件公司,总部设在美国纽约市。Infor专注于通过云计算作为服务交付给组织的业务应用。最初专注于从财务系统和企业资源规划(ERP)到供应链和客户关系管理的软件, Infor在2010年开始专注于工业利基市场的软件,以及用户友好的软件设计。Infor通过Amazon Web Services和各种开源软件平台部署云应用。

www.infor.com
相关技术
量子计算技术

量子计算结合了过去半个世纪以来两个最大的技术变革:信息技术和量子力学。如果我们使用量子力学的规则替换二进制逻辑来计算,某些难以攻克的计算任务将得到解决。追求通用量子计算机的一个重要目标是确定当前经典计算机无法承载的最小复杂度的计算任务。该交叉点被称为「量子霸权」边界,是在通向更强大和有用的计算技术的关键一步。

药物发现技术

在医学,生物技术和药理学领域,药物发现是发现新候选药物的过程。

年龄估计技术

年龄估计(Age Estimation),即提供一张图片,自动识别出图中人物的年龄。这项技术有很多应用,如视频监控、产品推荐、人机交互、市场分析、用户画像、年龄变化预测(age progression)等。

人脸防伪技术

指刷脸的时候,算法要判别这张脸是不是真人活体脸,而对于合成的、或者他人照片来攻击算法的,应该予以拒绝。

推荐文章
暂无评论
暂无评论~