智能审阅、自动写作的现状与未来

近日,在全国两会中山东台引入人工智能技术进行报导引起了广泛关注。AI与新闻及写作的融合早在10年前国外媒体便开始了商业化的尝试,随着国内人工智能行业的飞速发展,智能写作、机器阅读、智能审阅逐渐走入了越来越多企业和办公人员的视野。

阅读、写作做为人与人、企业与企业之间信息传递的主要方式,目前的发展现状如何?未来又会产生哪些机遇?为此,达观数据副总裁贾学锋与张江新媒体“你好张江”聊了聊目前国内 AI+阅读与写作的发展近况和机遇挑战。

人物介绍

贾学锋:目前担任达观数据副总裁,负责达观数据AI项目交付实施、客户需求理解及咨询方案设计以及基于自然语言理解知识图谱、搜索和推荐等技术驱动的人工智能产品设计。在加入达观前,在SAP中国研究院、阿里巴巴和万达网络集团从事与人工智能相关的算法研究、产品设计以及商业化相关工作。

01

您怎么看机器人代写事件?

贾学锋:代写机器人是人工智能一个非常重要的发展方向,在很多场景中是可以代替人的工作。但写作是一个非常复杂的创造过程,以目前技术的发展情况来看,短时间内是机器是没办法达到这种要求的。因此,短时间内代写机器人不能够完全代替人的工作。我们这里举一个简单的例子,在我们达观官网上,有智能作诗、智能写对联等功能,这些功能是我们的机器在阅读了大量的古诗、对联的基础上,基于我们的NLP分析结果,通过“平仄”作诗、写对联的规则自动生成。但是我们同样给机器阅读大量的小说,机器也是没办法写出《流浪地球》这样的小说。

也许你会说,现在网络上出现了很多关于代写机器人的新闻,比如代写新闻稿、代写学生作业等,这样的代写能力在我们业内看来是一个人工智能方向非常浅的应用。以地震新闻为例,如果我们要机器写一篇地震新闻稿,我们首先需要定义新闻稿的模板,就像下面这样:

20xx年xx月xx日(新闻发布时间),据xxxx(发布机构)消息,xxxx(地震发生地点)xx日(地震发生时间)发生x.x级(地震震级)地震。目前尚无人员伤亡和财产损失报告/目前地震已经造成xx伤亡,直接经济损失xxxx万元。消息说,地震发生在北京时间xx日xx时xx分,震中位于南纬x.xx度、东经x.xx度,震源深度x.xx公里。

在类似这样的新闻稿在定义好之后,当地震发生时,我们的地震监测设备会将把监测获取的数据,即上述下划线中的内容,填写进对应的字段中,新闻会在一分钟内生成,经人员审核通过后就可以向外发布了。类似的场景有足球新闻中比赛结果的报告、极端天气报告等等。我们可以看见,这些场景中的消息如果由人来进行撰写,那也是一些简单、重复的工作。所以就现在的代写机器人的应用场景而言,确实是能在这些场景中代替人完成很多重复性的事务。

但人和机器一个非常重要的差别,是人的创造性。写作与音乐创作、绘画创作一样,都是属于创作的过程。我们以写作中的翻译来举例子,看下面几段话:

You say that you love rain,

but you open your umbrella when it rains...

You say that you love the sun,

but you find a shadow spot when the sun shines...

You say that you love the wind,

but you close your windows when wind blows...

This is why I am afraid,

You say that you love me too...

常规情况下,我们人和机器来进行翻译,翻译的结果是这样:

你说你喜欢雨,

但是下雨的时候,你却撑开了伞;

你说你喜欢阳光,

但当阳关播撒的时候,你却躲在阴凉之地;

你说你喜欢风,

但当清风拂面的时候,你却关上了窗。

所以我无比害怕,

因为你也曾说过喜欢我。

但下面这种翻译方法是机器基本不可能达到的:

你说烟雨微茫,兰亭远望;

后来轻揽婆娑,深遮霓裳。

你说春光烂漫,绿袖红香;

后来内掩西楼,静立卿旁。

你说软风轻拂,醉卧思量;

后来紧掩门窗,漫帐成殇。

你说情丝柔肠,如何相忘;

我却眼波微转,兀自成霜。

在这里我们就能看出,机器和人的差异,人在翻译的过程中加入了对诗词意境的理解和自己的情感,这样的理解方式与人自身个体在语言上的天赋、造诣、自身的修养、生活的环境是息息相关的。在短时间内机器在这些方面是没办法达到人的高度。

总的来说,代写机器人是一个非常有意义的产品,它能解放人的劳动力,让人在更多自己适合的领域中发挥自己的价值。同时代写机器人不会代替人,它会在长时间内与人一起,在写作中各自发挥各自的作用,提升人的效率。

02

AI+这些有趣应用除了博关注度外,您认为其实用价值在何处?

贾学锋:2018年去世的伟大的物理学家霍金,他生前的三大预言之一,便和人工智能技术息息相关:“彻底开发人工智能会使可能会使人类灭亡”。这里我们不危言耸听,但是随着技术的不断发展,机器通过不断学习,已经可以开始模仿人类的思维方式,之前广受关注的AI+下棋,辩论等等都展示出了这一趋势。

同时,除了这些有趣的应用,人工智能也在给各行各业包括我们的日常生活带来改变,提供便利。举几个简单的例子:

1.  我们达观的文本智能审阅系统,可以帮助财务人员,法务人员快速的从大量文本中提取出他们关注的信息,节省阅读时间,提高工作效率。让他们有更多的时间可以投入到更具创新,更有意义的工作当中。

2.  又比如,现在流行的chatbot,智能客服,通过利用自然语言处理知识图谱,构建实现了与人沟通的一个客服体系,可以帮助包括电商等服务密集型企业提高售后服务质量,节省人力客服的成本。

3.  还有很多企业场景都可以用到人工智能技术来帮助我们提高工作效率,如智慧医疗,智能安防。

4.  不仅在to B的领域,在to C的领域,人工智能也在慢慢影响我们的生活,智能家居,智能穿戴设备,自动驾驶等等。

我们也期待随着技术的成熟,新技术的不断涌现,能有更多更实用的AI落地场景,给我们的工作和生活提供便利和乐趣。

03机器学习

人工智能能够从海量的信息中挑选出对补充新知有用的内容,AI如何习得这种能力?

贾学锋:AI不仅可以对海量数据进行统计计算,而且还可以从海量数据中萃取出知识,构建知识的网络,进而在这个网络中进行类似人的推理计算。

大数据时代,海量信息处理是无法通过人工处理的,需要依靠计算机进行自动化处理。最初的做法是人为设定好一些规则,由机器来执行,但特征一多规则就很难制定,即使定下了规则也没法根据实际情况灵活变化。通过机器学习自然语言处理知识图谱技术可以很好的解决以上问题,机器学习是使计算机具有智能的根本途径,特别是现在的深度学习技术,更加有效。

04

达观数据在这方面有哪些布局,能否简单分享一下技术原理?

贾学锋:达观的愿景就是成为文本智能处理专家,服务于中国乃至国外的有文字处理的客户。文本智能处理包括NLU(自然语言理解)和 NLG(自然语言生成),我们在文本自动生成技术方面在很积极研究和尝试。在宽泛的意义上,文本生成可分为这4类:

文本到文本、数据到文本、图像到文本和意义到文本。图像到文本和意义到文本等有不少的公司在尝试,后者难度更大。达观目前专注在前两个方向的商业化落地。

1

文本到文本

简答来说就是对给定的一段文本,进行变化处理后得到另外一段文本。典型的有:文本摘要、句子压缩、句子融合 、文本复述等。 达观目前和很多的客户在落地这些功能,比如帮助资讯类App进行文章摘要生成,让用户更快地判断推荐的文章是否是自己感兴趣的。帮助政府相关机构对各种政策性文件进行摘要生成等。

目前的文本摘要方法主要有抽取式和生成式两种。抽取式是现在常用的方式,易于实现还能摘要中的句子具有良好的可读性。该类方法主要包括两个步骤:一是对文档中的句子进行重要性计算或排序,二是选择重要的句子组合成最终摘要 。会用到CRF, HMM, SVM以及现在的深度神经网络技术等。

2

数据到文本

数据到文本的生成技术指根据给定的数值数据生成相关文本,例如基于数值数据生成天气预报文本、体育新闻、财经报道、医疗报告等。数据到文本的生成技术是具有极强的应用前景的。目前达观在和一些金融公司和商学院合作,去生成股评、公司基本面分析报告、以及某个主题的商业研究报告,例如从各种小米手机的营销文章中,生成关于营销策略的研究报告。这一方面国内的研究不太多,不仅仅是技术层面的事情,更多还要和分析方式结合起来才能做好。

现在多采用基于人工模板,将需要的数据填入写好的模板中,从而生成。由于采用的模板比较固定,所以生成的内容会比较类似,缺乏生动。现在多会尝试模板技术、基于NN的技术和强化学习等多种手段的融合来服务不同的业务场景。目前NLG的评估还不是很成熟,这也是制约NLG发展的一个重要原因,如果有更好的评估方法或者存在一个业内公认的高质量数据集,相信NLG会快速发展。

05

当前,AI+阅读写作主要应用于哪些行业领域?应用前景如何?

贾学锋:可以说凡是涉及到跟文字打交道行业都是可以用到AI+阅读写作。

1、涉及到跟文字打交道最为密切的行业

政府领域,在政府中每年涉及到大量文档阅读和写作工作,比如每年会起草各种政府报告供参会及各界人士学习,少则数千字多则数万字,据统计 2017年两会政府工作报告全文高达1.86万字,全国各界人士据此进行学习领会政府会议精神,这些文档的编写和阅读涉及到了大量人力工作,如果通过AI技术首先进行政府报告编写然后人力进行样式的校验,在阅读方面通过AI技术自动分析文档的核心要义,这样就会大大提高政府部门的工作效率;除此之外法律行业也是如此。

2、涉及到大量重复性人力劳动的行业

比如金融行业,金融行业我们一般会分为银行、证券、保险、基金等四类,以证券行业为例,券商中会涉及到大量不同种类文档处理比如债券募集说明书,企业发债都需要提交债券募集说明书并对其进行严格的审核才能够通过并进行发债,这里面涉及到债券募集说明书的编写和审核工作,以审核为例从小到错别字和格式审核再到数据一致性、数据计算错误最后到基于业务层面的完备性审核方面都会涉及到,审核原理其实就是通过阅读理解文档所表达含义进行相关工作。

我们人类阅读的速度要远远快于写作的速度,与此类似在目前AI+阅读的技术相比较AI+写作技术也要更为成熟些,我们现在所面对的AI+阅读写作在行业的应用还只是沧海一粟,随着AI技术不断发展行业需求不但激发他们结合会愈发紧密,我坚信未来AI+阅读写作在行业中会有更广阔的空间。

达观数据
达观数据

达观数据是一家专注于文本智能处理技术的国家高新技术企业,获得2018年度中国人工智能领域最高奖项 “吴文俊人工智能科技奖”,也是本年度上海市唯一获奖企业。达观数据利用先进的自然语言理解、自然语言生成、知识图谱等技术,为大型企业和政府客户提供文本自动抽取、审核、纠错、搜索、推荐、写作等智能软件系统,让计算机代替人工完成业务流程自动化,大幅度提高企业效率。

产业自然语言生成自然语言理解机器学习知识图谱自然语言处理写作机器人
相关数据
达观数据机构

达观数据成立于2015年,是中国领先的文本智能处理企业,利用先进的文字语义自动分析技术,为企业、政府等各大机构提供文本自动抽取、审核、纠错、搜索、推荐、写作等智能软件系统,让计算机代替人工实现业务流程自动化,大幅度提高运营效率。 达观数据为企业提供完善的文本挖掘、知识图谱、搜索引擎和个性化推荐等大数据服务,是国内唯一一家将自动语义分析技术应用于企业数据化运营的人工智能公司。

http://www.datagrand.com/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

自然语言生成技术

自然语言生成(NLG)是自然语言处理的一部分,从知识库或逻辑形式等等机器表述系统去生成自然语言。这种形式表述当作心理表述的模型时,心理语言学家会选用语言产出这个术语。自然语言生成系统可以说是一种将资料转换成自然语言表述的翻译器。不过产生最终语言的方法不同于编译程式,因为自然语言多样的表达。NLG出现已久,但是商业NLG技术直到最近才变得普及。自然语言生成可以视为自然语言理解的反向: 自然语言理解系统须要厘清输入句的意涵,从而产生机器表述语言;自然语言生成系统须要决定如何把概念转化成语言。

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。 阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。 2014年9月19日,阿里巴巴集团在纽约证券交易所正式挂牌上市,股票代码“BABA”,创始人和董事局主席为马云。 2018年7月19日,全球同步《财富》世界500强排行榜发布,阿里巴巴集团排名300位。2018年12月,阿里巴巴入围2018世界品牌500强。

https://www.alibabagroup.com/
小米机构

小米是中国一家专注于智能硬件、智能家居以及软件开发的企业,于2010年4月6日成立,总部位于中国北京,截至2018年3月31日,员工人数近1.45万。 2010年8月及12月,小米发布了基于安卓系统深度定制的第三方固件MIUI及首款移动应用米聊。2011年8月16日,小米正式推出了其第一款硬件产品——小米手机(一代),开创了以互联网线上抢购高配置、低售价的智能手机销售模式。 通过旗下生态链品牌MIJIA(米家),小米的产品线从智能手机及耳机、移动电源等手机周边产品和音箱、手环等相关移动智能硬件,扩展到智能电视、机顶盒、路由器、空气净化器、电饭煲等家居消费产品。截至2018年3月底,小米已进入全球74个国家和地区的市场,并在其中15个市场智能手机出货量名列前五。 2012年,小米全资买入北京多看科技有限公司,进入电子书阅读领域。多看阅读是旗下网站,并有相应的App。2018年,业界传闻小米有计划生产电子阅读器。 2018年5月3日,小米正式向香港交易所提交IPO申请[6],于2018年7月9日以同股不同权的方式挂牌上市,并计划于7月23日纳入恒生综合指数。 2018年11月19日,美图公司与小米集团宣布达成战略合作伙伴关系,合作期限30年。

暂无评论
暂无评论~