杜佳豪编辑

百度CTO王海峰公布百度知识图谱最新数据:超过50亿实体、5500亿事实

8月3日,在浙江德清召开的中国工程院信息与电子工程领域颠覆性技术高端论坛上,百度CTO王海峰以“知识增强的自然语言理解”为题发表主旨报告。报告中,王海峰公布了百度知识图谱的最新数据:百度打造了世界上最大的多源异构知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新。百度知识图谱应用于各行各业,每天的调用次数超过400亿次。

王海峰表示,知识是人类认知世界的成果,是人类智慧的结晶,知识的掌握、运用和传承推动着人类的进步。知识图谱是机器认知世界的基础。近些年来,大规模知识图谱兴起,知识和深度学习越来越多地结合,首先形成统一的语义表示,进而进行深度的语义理解。百度融合多源异构大数据,构建了超大规模知识图谱,所包含的实体和事实的数量,远远超出人脑记忆的知识。

知识图谱对于AI基础技术领域的研究具有重大意义,同时在行业落地、产业智能化当中也发挥着重要作用。5月20日,百度云智峰会上,王海峰首次发布百度智能云知识中台,基于百度多年积累的知识图谱自然语言处理、多模态语义理解、智能搜索等AI核心技术打造。

知识中台可以为企业提供高效便捷的知识生产、组织和应用能力,满足业务场景智能化需求,解决大多数企业缺乏构建和运用知识能力的痛点。比如在医疗行业,百度的医疗知识图谱和人民卫生出版社共建,助力医疗的筛、诊、管等各个方面。此外,金融风控、智能客服、能源电力等领域,百度知识图谱均已广泛应用。

通过自然语言理解知识图谱等核心技术的不断落地应用,人工智能正在服务千行万业,加速产业智能化。

产业知识图谱王海峰百度
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

百度机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

https://www.baidu.com/
暂无评论
暂无评论~