Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

作者:一刻talks

机器之心公开演讲:如何用AI技术传播AI知识

这是一刻talks讲者、机器之心创始人兼CEO赵云峰在一刻talks第100场演讲局「先见•未来大会」上的演讲。在信息爆炸的时代,我们脑力有限,但人工智能会协助我们处理大量信息。赵云峰认为,人工智能技术的发展,未来知识的学习和问题的解决将更高效,更精准。

文章3421字,阅读需要9分钟

大家好,我是一刻 talks 讲者,机器之心创始人赵云峰。在 2014 年初国内没有这么多人关注人工智能的时候,我创办了机器之心去报道人工智能,现在我们

每天向全世界 100 万专业用户传递我们的中英文内容,去帮助他们更加高效学习,去辅助他们的商业决策。

在做媒体同时,我们也一直在探索,我能否用一些更加智能化的技术,显著提升知识传播的效率。所以今天的演讲,就是过去我们对于技术和产品的一些思考。

Part.1

研究人工智能的起因

过去我被问到最多的一个问题是,你在当时那个时点是怎么想到去做一个人工智能媒体的?从外部环境来看,当时所谓的热点和风口不是人工智能;从我自身来看,我也没有计算机科学背景和媒体经验。但这个疑问恰恰是我关注人工智能的原因,就是一个外行者对一个新领域新知识的好奇和学习。当时我希望把这些东西给到一些和我有同样需求的人,也希望去影响更多人——能够提醒大家,什么才是最应该关注的真正的前沿科技知识,去激发大家的想象力和好奇心,而不能是每天被大量无效的信息和所谓的风口热点所困扰。

过去我们的知识和信息出现了一个非常大的 Gap。我们最早的知识传播是口头文化,《柏拉图导论》里提到,早期的希腊人会把诗人的吟诵铭记在心,成为他们生活的一切操作性智慧。后来有了印刷术和图书,知识得以更加广泛的传播。后来信息化和互联网的出现使我们的信息量有了爆发增长,信息变得无处不在,唾手可得。再加上基于算法和社交关系的推荐,这使信息和知识开始变得割裂,信息量的增加让我们忽视了对学习的重视。就像在《浅薄》中提到的,互联网在提供给我们便利的获取信息的工具时,也在重塑我们的思维方式和记忆。使我们变得没有以前那样擅长学习了。另外一本书,《World Withoud Mind》中也提到,现在的科技巨头,是垄断着我们的信息和知识,由他们控制我们现在应该看什么学什么。面对这样的现象,我们如何解决呢?很遗憾,我们人类自身的脑力、精力和时间是有限的,靠我们自己的血肉之躯,好像永远也不可能与这些庞大的永无止境的信息机器抗争。

但我们有自己的优势,可以创造发明各种各样的工具。过去我们也被繁重而忙碌的体力劳动所困扰,但我们学会了物理,发明各种各样的机器为我们所用,代替了我们的体力劳动。

Part.2

人工智能可以做什么

那现在我们能否也创造另外一种工具来解决我们知识和学习的问题呢?在互联网之后,我们进入到了一个全新时代,我们有了一些更新的技术,这就是人工智能,如果说互联网和智能设备让我们的信息量变得更多,那人工智能可以帮我们更加高效自动的处理这些信息。

人工智能帮助我们获取知识有两个层面。第一是帮我们提升工作效率。帮我们节约时间,让我们有更多时间去学习。比如说基于图像识别的医疗影响分析可以辅助医生进行诊断,医生就有更多自由的时间学习更加先进的诊疗方式或者去参加更多的专家会诊。我们基于人脸识别的视频监控,可以从海量视频中迅速找到犯罪嫌疑人,取代了人工筛查的工作,警察有了更多的时间做更加专业的研判。

人工智能帮助我们获取知识的第二层面是更加直接的,就是知识图谱自然语言理解,比起图像识别和语音识别,这些技术和我们的知识及认知更加接近,所以它发挥的作用也更加直接。

我们现在就是基于这两项技术,更加高效的去传播人工智能相关知识。

首先,我们建立了人工智能垂直领域的知识图谱。大家都知道计算机非常擅长处理信息,但是看不懂我们的知识,所以我们需要建立一个知识库给到机器,让他理解我们基于自然语言传递出来的需求,更好的基于知识做推理。这个知识库包括各个实体信息,以及各自之间的关联。我们的知识图谱基本上涵盖人工智能领域所有重要的实体,比如说技术点,论文,专家等等,并且在他们之间做好了关联。

比如说大家某个技术找出相关的论文、技术框架、应用案例和人物等等,知识图谱是我们信息平台的基础,可以把过去的碎片化信息变成现在的结构化信息。举个例子,知识图谱就像我们建筑物结构一样,可以把其他部件非常有机的结合在一起,实现它的功能。

知识图谱之上,我们整合了多种信息形态和交互方式。过去大家学习新领域知识时,需要阅读某篇文章,查看某份报告,或者在某个数据库进行检索,这时我们会意识到一个问题,不同信息是分布在各个网站和载体上的,他们之间没有任何打通和关联,所以我们花了大量时间在不同形态之间进行跳转,这是效率非常低的。现在我们把所的信息形态整合到一个平台上,大家可以非常自由的在它们之间进行切换。并选择自己最适合的信息形态进行察看。

在最上层,我们提出了智能化的交互方式。第一个我们所做的是人工智能领域的垂直推荐和搜索系统,过去大家在查找一些专业信息时,经常发现我们所使用的通用的搜索引擎和推荐系统并不是那么好用。因为这些产品是去满足所有人的所有需求,所以没有办法对每一个垂直领域的专业知识进行优化。我们对于这个垂直领域的知识和算法进行了优化,同时加入了大量的专业知识和人工判断。人工智能从业者去查找相关信息时,在我们这个平台上得到的结果会更加精准,也不会受到其他无关内容的干扰。

第二个是聊天机器人,过去大家在查找一些问题的时候,基本上都是这样一些步骤,去搜索找文章,从中找到一些信息点,整理成我想要提问的问题答案。对于聊天机器人,我们可以基于任务式的问答直接获取答案,解决了烦琐的信息处理步骤。比如说可以问它什么是人工智能,什么是机器学习,什么是神经网络等等,我们会给出一个非常精准的答案。

人工智能技术人员可以通过这样的方式,找到一些最新的论文、技术框架、开源数据集等,辅助他们工程方面的工作。产业界的人也节省了从海量信息中抽取有价值的信息等过程,找到最适合自己的应用案例或者合作伙伴。

基于人工智能的交互方式,加上大家比较了解的传统的阅读和数据库的交互形态,我们把它整合成了非常复合的信息交互体系,用户可以在任何时间点,基于自己最方便的方式选择一个和信息之间的交互方式。大大提升了我们获取知识的效率。

Part.3

从现在开始使用人工智能

除了我们自己做的这个事情之外,我们发现使用人工智能的知识服务平台越来越多。比如说大家在学习英语时,语音识别技术可以帮助识别和检测我们的口语发音,也可以根据每一个人自己独特的学习情况去给他个性化推荐学习资料。律师领域人工智能可以基于语义识别技术快速检索案件和条款,使律师可以更加专著于一些案件的研究上。我们相信这样一些知识和产品会越来越多。大家应该更多的去发现和使用这样的功能,以提升我们的知识学习效率。

面对人工智能其实我们没有任何理由去排斥和恐慌,而是应该拥抱和使用它,让它为我们所用,去扩展自己独特的智能,因为这个才是我们人类之所以称之为人类的禀赋。

随着人工智能帮我们处理的工作越来越多。可能有些人理想中的生活是这样的。机器帮我们处理好一切,所以我们人类可以做的就是重复的不经大脑的享乐,很遗憾,这种情况可能永远不会出现。或者即便出现了,大家可以试想一下,一边是机械的思想逐渐退化的人类,一边是无所不能的机器,那到底谁才是机器,谁才是人类。

人工智能只会让我们越来越努力,因为智能机器帮我们完成的工作越多,对我们人类自身智能的要求也就越高,我们需要学习的知识、掌握的技能也就越来越多。工具,尤其是智力工具的出现,一再拓展着我们自有智力和努力程度的上限。我们要竭尽所能的,或主动或被动的完成这项艰巨的任务,且永无止境。

对于人工智能本身以及它的作用,我们也不用去等待,因为没有一个明确的未来,我很认同设计师原研哉对未来的解读:「未来不在每个人都在寻找的地方,"那里"就在现在后面。它不是一行里的一个整数:9、 10. 11……它在 6.8 或 7.3 这种地方,察觉时已在未来正中央」,所以,我们应该从现在开始,连续的向前,和思考、智力、知识相关的工作永远都是辛苦的,但就像德国诗人荷尔德林所说:「人充满劳绩,但还诗意地栖居于这块大地之上。」

谢谢大家。

产业人工智能内容推荐
21
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

推荐系统技术

推荐系统(RS)主要是指应用协同智能(collaborative intelligence)做推荐的技术。推荐系统的两大主流类型是基于内容的推荐系统和协同过滤(Collaborative Filtering)。另外还有基于知识的推荐系统(包括基于本体和基于案例的推荐系统)是一类特殊的推荐系统,这类系统更加注重知识表征和推理。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

聊天机器人技术

聊天机器人是经由对话或文字进行交谈的计算机程序。能够模拟人类对话,通过图灵测试。 聊天机器人可用于实用的目的,如客户服务或资讯获取。有些聊天机器人会搭载自然语言处理系统,但大多简单的系统只会撷取输入的关键字,再从数据库中找寻最合适的应答句。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

推荐文章
机器之心・联合创始人
机器之心相关业务常年招实习生(有机会转全职),有志一起成长的小伙伴请投简历~