参与李泽南

用AI解决工作流程的「最后一公里」问题,达观数据发布智能RPA

7 月 26 日,达观智能在北京正式推出了全新产品达观智能 RPA,这是国内首款集 OCR(光学字符识别)与 NLP(自然语言处理)技术于一体的智能化办公系统。

达观数据推出的新产品,可以将人们从日常重复性劳动中解放出来,迅速实现业务提效。达观数据创始人、CEO 陈运文在发布会上表示:「RPA 如同人的双手,自动化执行企业工作流程中『大量重复』和『规则明确』的工作任务。随着工作流程的规则更灵活、工作任务更复杂,企业需要更智能、更数字化的 RPA。」

RPA(Robotic Process Automation 机器人流程自动化)系统,旨在让计算机学习和模仿人类处理任务的步骤,快速完成重复性的业务操作,实现端到端的流程自动化。这种技术可以大幅度提高政府机构和公司的办事工作效率。目前在北美市场,RPA 已进入了大规模市场应用阶段,是全球增长速度最快的企业智能软件。

陈运文在发布会上。

与传统 RPA 不同的是,达观智能 RPA 致力于解决流程自动化的「最后一公里问题」,通过自然语言逻辑分类、自然语言数据提取、识别和深度学习模式预测,达观智能大幅度提升了 RPA 的应用范围。「智能 RPA 技术还在快速发展过程中,达观的 NLP 能力、OCR 技术都在不断升级,我们接下来的目标是让 50% 的日常工作自动化,」陈运文介绍道。「从现在的 20% 到 50% 会是很大的进步。未来我们还希望实现从 50% 到 80%,甚至更高覆盖面的发展。」

达观数据集成 RPA 与 AI 技术的方法,赋予了计算机学习和思考的能力,力图打造更加聪明的「机器人员工」。

融合 AI 技术,大幅提升工作效率

与目前市面上很多 RPA 产品不同,达观在开发 RPA 产品最初的时候就充分考虑了使用 AI 技术,让计算机具备学习思考能力。有了聪明的大脑以后,RPA 机器人可以用半自动、甚至全自动的方式来帮助人类完成工作。

陈运文在发布会上介绍了 AI 在处理发票任务上带来的速度提升:人工操作处理一张发票所需要的时间里,机器可以处理 30 张,正确率可达 100%,而且计算机全年无休。

据介绍,目前的智能 RPA 系统已经可以承担一些复杂的任务。在很多合同的审阅工作上,人类需要很多天时间才能完成的任务,机器人都可以在几分钟内自动完成。

「票据的自动化处理,需要计算机能够识别非结构化信息,其中还有逻辑判断的一些流程,」陈运文介绍道。「达观智能 RPA 可以自动登陆国家税务局网站自动进行发票验证工作。随后自动填写 Excel 或 Word 文档。我们只需要在管理系统中通过托拉拽图标的方式生成处理方法,随后计算机就可以自动完成任务。」

达观智能 RPA 目前可以完成图片验证码识别、证件识别、纸质文档识别、合同抽取、财务报表抽取、报告生成等业务需求,延伸了企业自动化链条。「对任何一个业务流程自动化而言,都需要串接许多技术模块。RPA+OCR+NLP 的融合,减少了业务流程中人机交互、人工复核的环节,更全面的满足企业自动化的需求。」陈运文表示。

在智能化、低门槛的工具背后是达观数据深厚的技术积累。达观智能 RPA 中的 NLP 组件由达观数据自主研发,采用 CRF、HMM、HAN、Bi-LSTM、BERT 等最新算法,为企业工作流程中的关键信息抽取、合同预审、合规检查等需要认知参与的复杂任务实现自动化、全流程、可调控的 AI 应用效果。

在达观智能 RPA 自研的 OCR 组件中,通过融合 CRNN、Attention OCR、 Faster-RCNN、Mask-RCNN 等数十种算法,解决了图像识别与转换的难题,可实现对通用文字、证照、财务报告、复杂表单、合同、图纸等各种类型文档的识别与处理,完成更大程度的自动化。

加码 RPA:更智能、更具兼容性

达观引以为傲的优势在于自然语言处理技术。Transfomer XL、BERT 等方法是在自然语言处理技术里如今最流行、最优秀的算法模型,达观是国内最先把 BERT 模型从英文移植到中文的处理过程中的。

「我们发现在中文处理过程中,像 Transfomer learning 等国外先进的算法经验在中文数据里也非常有效,」陈运文说道。「但我们结合中文的语言特点,又加入了很多中文语言模型和特有的算法去改造这些技术,使得它们能在文本处理领域的效果再上一个台阶。这些先进 NLP 技术可以帮助达观智能 RPA 完成困难、复杂的工作,将企业日常办公、业务流程处理中的很多工作都让计算机自动化完成。」

「我认为计算机正在超越人类。在未来,企业或许会雇佣人类和机器人两类员工共同来完成工作。今天很多公司还心存顾虑,但我们认为这是未来,人类和机器人能够更好地完成工作。」

为了实现更复杂任务上的自动化,人工智能系统还需要理解很多专业知识,达观表示,公司也正在知识图谱等领域上进行探索。 

传统 RPA 产品由开发平台、控制中心、终端机器人组成。达观数据副总裁,智能 RPA 产品负责人金克表示,面向企业级用户,达观数据从其擅长的 NLP 与 OCR 所覆盖的场景切入,在产业设计层面结合两者的易用性与准确率,同时针对企业级用户的特点,打造了兼容性、灵活性、开放性和稳定性更强大的 RPA 产品。

达观数据副总裁金克介绍了达观智能 RPA 产品的细节。

 金克向我们介绍了达观智能 RPA 具备的五大优势:

  • 更兼容:支持跨平台部署,适用 Linux、Windows、Mac、国产 OS 等操作系统;
  • 更开放:支持 Chrome、IE、Firefox、App、Email、Office、ERP 等各类应用程序的自动化;
  • 更灵活:在开发平台支持自动排版拖拽和编程开发;控制中心支持多种定时任务和角色权限管理;
  • 更稳定:7×24 小时长时间正常运行,实时监控机器人和任务执行状态;
  • 更智能:融合自研的 OCR 和 NLP 组件,支持非结构化数据的转换和理解。

「我们在与政府合作的项目中发现,政府部门的计算机需要使用 Linux 系统,」金克介绍道。「我们的系统在开发之初就考虑了跨平台、兼容性的问题。智能 RPA 系统不光可以在 Linux 上跑,也可以在国产操作系统上跑,这也是我们具备的独特优势。」

打通数据孤岛

RPA 能实现快速落地,最根本原因是企业无需对现有的系统和流程进行改造,只需通过非侵入式技术,就能实现系统间的快速对接、业务流程的自动化部署。

「很多企业、政府部门现在都存在数据孤岛的现象,」陈运文介绍道。「各部门采购的软件系统各不相同,甚至会是不同厂商开发的。企业数字化升级改造时,发现怎样对接和打通各种数据是非常痛苦的事情,我们发现 RPA 是非常好的连接器。」

智能 RPA 可以不改造客户原有 IT 系统,自动读取不同来源的数据,并将其汇集在一起,从而解决数据孤岛和企业数据中台的建设工作。达观数据认为,智能 RPA 就像一个连接器,可以把各个系统串连在一起,而且不用对原有系统做任何改造,这对很多客户来说是非常有意义的事。

截至目前,达观智能 RPA 已推出银行、财税、政务、保险、证券基金等数十种不同岗位的机器人员工。在售后工单处理、商业案例报告生成、供应商准入核实、智慧政务行政审批、金融文档的抽取验查和填写等场景中,机器人员工已在稳定高效地开展各项工作。

今年,国内 RPA 创业公司已呈现出快速发展的趋势。「国内的 RPA 发展势头正盛。在这个过程中,任何企业都可以给自己贴上 AI 或 RPA 的标签,」陈运文表示。「但关键在于开发出真正的智能 RPA 产品、真正可交付的机器人系统,它需要具备强大的能力,而不只是贴个标签。达观的 RPA 系统,是实实在在能够落地应用起来的。我们愿意踏踏实实地做事,开发出真正能够应用的系统。」

产业数据科学智能物联网达观数据自然语言处理
相关数据
陈运文人物

达观数据创始人和CEO,复旦大学博士。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~