Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

乌镇世界互联网大会百度CTO王海峰谈创新发展:人工智能是新动能

11月23日-24日,世界互联网大会·互联网发展论坛在浙江乌镇举行。今年的大会以“数字赋能 共创未来——携手构建网络空间命运共同体”为主题,聚焦全球网络空间发展新热点和新趋势,“数字经济与科技抗疫”、“科技发展与创新驱动”等成为重要议题。人工智能是新一轮科技革命和产业变革的重要驱动力量,成为科技创新与产业发展的新动能。

24日上午,百度CTO王海峰出席“人工智能:育新机 开新局”论坛,并发表“人工智能 创新发展新动能”主旨演讲。人工智能发展到今天,已经具备了标准化、模块化、自动化的特征。王海峰表示,“随着技术的发展,随着大规模的产业应用落地,人工智能已经进入到工业大生产阶段。”

百度CTO王海峰在乌镇世界互联网大会人工智能论坛发表演讲

2010年初,百度开始布局人工智能,是国内投入最早、技术最强、布局最完整的人工智能领军企业,是AI技术及应用创新的引领者和推动者。

百度大脑是百度人工智能多年技术积累和产业实践的集大成,包括基础层、感知层、认知层、平台层和AI安全。基础层是数据、算力和算法,是支撑新一代人工智能快速发展的核心基础;感知层包括语音、视觉、虚拟现实增强现实技术;认知层包括语言与知识技术,是让机器像人一样,掌握知识、理解和运用语言,具备认知能力;平台层则是面向开发者和合作伙伴打造繁荣生态;安全体系则纵贯百度大脑各层,为AI技术及应用保驾护航。王海峰介绍,百度大脑从2016年开始开放百度AI技术,到今年已经升级为6.0,成为“AI新型基础设施”,一方面核心技术不断迭代创新,另一方面,飞桨深度学习平台及百度昆仑芯片等也不断夯实软硬一体AI大生产平台。

在我国经济社会转向高质量发展,构建新发展格局的大背景下,科技创新、科技自立自强是关键。王海峰表示,百度大脑的基础底座“飞桨深度学习平台”是我国首个自主研发、开源开放、功能完备的产业级深度学习平台。深度学习平台在整个人工智能技术栈中处于承上启下的核心位置,相当于“智能时代的操作系统”。

不断创新迭代的飞桨平台,具有开发便捷的核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎和覆盖多领域的产业级模型库等四大核心技术。如今飞桨已凝聚230多万开发者,服务9万多家企业,创建了超过31万个模型,在AI技术创新、生态建设和产业发展过程中,发挥着重要作用。

AI核心技术和算法层面,百度大脑持续创新突破,核心技术保持领先。在语音方面,基于麦克风阵列的声音增强和声学建模一体化的端到端识别,使得语音识别的错误率大幅降低;业界首创的多分区模型波束技术则有效解决耳机等终端设备“串扰”问题。通过专为远场语音交互定制的百度鸿鹄芯片,百度实现了软硬一体化设计的语音交互,以软件定义芯片,更契合深度学习模型计算。

视觉方面,百度大脑视觉技术全场景覆盖,包括图像、视频、AR/VR等等,以及人脸、视频、文字、车辆、人体等各种垂类的识别技术,在各领域得到了应用。同时,百度还开发了视觉AISDK,3D结构光模组等等,构建软硬一体的视觉技术能力。

在语言与知识技术方面,百度构建了世界上最大规模的知识图谱,拥有超过50亿实体,5500亿知识,并在不断演进和更新,已应用于各行各业,日均调用次数超过400亿次。基于知识增强的持续学习语义理解框架文心(ERNIE),在深度学习的基础上融入知识,具备人类一样的学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,刷新榜单历史,超越人类得分。在11月14日举行的2020第十届中国智能产业高峰论坛上,文心(ERNIE)受到业界的高度认可,获颁“2020年度优秀科技成果”。

百度大脑6.0已经具备“知识增强的跨模态深度语义理解”能力,语音语言一体化理解、图像语言一体化理解,使得语音识别及图像识别准确率大幅提升。融合语音、语言的同声传译技术,翻译准确率超过80%,时延3秒,与人类水平相当。百度同传已支持多场国际会议,为2020服贸会提供机器同传服务,总观看量接近500万次。而在百度世界2020大会中首度亮相的具有认知能力的虚拟数字人,更是融合语音、语言、视觉等多种技术的综合应用。

百度大脑开放平台已对外开放270多项领先的AI能力,更敏捷、更高效支撑AI工业大生产,助力产业智能化提速。

王海峰介绍,基于百度大脑,百度通过智能云将AI能力向各行各业输出。百度智能云融合云计算百度大脑、大数据等百度核心技术,提供了通用的基础云平台、AI中台、知识中台等多层次的平台,以及为各行各业赋能的智能应用和解决方案。

百度智能云提供的智慧城市解决方案,包括城市感知中台、城市AI中台、城市数据中台、城市交互中台等等,支持各种智能应用场景,让城市更安全、更从容、更通畅、更宜居。

医疗领域,百度智能云打造的智慧医疗体系包括医疗AI中台和医疗知识中台,涵盖筛查、诊断、管理三个重要环节。目前,已经服务27个省市自治区、超过1500家基层医疗机构,辅助数万名医生,服务人次超过了2500万。

工业制造领域,智能技术正在帮助制造业创新、提质、降本、增效。百度智能云利用领先的AI技术帮助企业建立竞争优势并支持中国制造业实现智能化升级。

智能化升级浪潮中,人才不可或缺。百度人工智能技术生态已培养超过100万人工智能人才;未来5年,还将联合社会各界培养500万人工智能技术及产业人才,为中国智能经济和智能社会的发展提供AI人才保障。

王海峰表示,希望与社会各界一起努力,加速推进人工智能与产业的深度融合。面对信息革命历史机遇,人工智能技术驱动的产业智能化变革,正在持续为世界经济复苏和高质量发展提供新动能。

产业王海峰百度
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

增强现实技术

增强现实,是指透过摄影机影像的位置及角度精算并加上图像分析技术,让屏幕上的虚拟世界能够与现实世界场景进行结合与互动的技术。这种技术于1990年提出。随着随身电子产品运算能力的提升,增强现实的用途也越来越广。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

虚拟现实技术

虚拟现实,简称虚拟技术,也称虚拟环境,是利用电脑模拟产生一个三维空间的虚拟世界,提供用户关于视觉等感官的模拟,让用户感觉仿佛身历其境,可以及时、没有限制地观察三维空间内的事物。用户进行位置移动时,电脑可以立即进行复杂的运算,将精确的三维世界视频传回产生临场感。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

感知层技术

IoT (物联网) 三层结构中的一层,用于识别物体,采集信息等感知类的任务;另外两层是应用层(Application layer)和网络层(Network layer)。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

麦克风阵列技术

麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。 早在20世纪70、80年代,麦克风阵列已经被应用于语音信号处理的研究中,进入90年代以来,基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。而到了“声控时代”,这项技术的重要性显得尤为突出。

推理引擎技术

推理机是实施问题求解的核心执行机构,常见于专家系统。它是对知识进行解释的程序,根据知识的语义,对按一定策略找到的知识进行解释执行,并把结果记录到动态库的适当空间中去。

百度智能云机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://www.baidu.com
结构光技术

结构光是将已知图案(通常是栅格或水平条)投射到场景上的过程。这些物体在撞击表面时变形的信息来在视觉系统中计算场景中物体的深度和表面信息,如在结构光3D扫描器中使用的。 结构光是一组由投影仪和摄像头组成的系统结构。用投影仪投射特定的光信息到物体表面后及背景后,由摄像头采集。根据物体造成的光信号的变化来计算物体的位置和深度等信息,进而复原整个三维空间。

推荐文章
暂无评论
暂无评论~