达观数据完成1.6亿元B轮融资,刷新中国NLP领域融资记录

11月22日,达观数据宣布成功完成1.6亿元B轮融资,由宽带旗下基金晨山资本领投,元禾重元、联想之星、钟鼎资本及老股东等跟投,华兴资本担任本轮融资的独家财务顾问。达观数据累计融资额超2亿元,刷新了中国自然语言理解领域的融资记录,成为语义识别领域融资额最高的企业之一。

达观数据CEO陈运文博士表示,此轮融资将帮助达观数据进一步扩大在文本大数据分析领域的领先优势,提升语义分析核心技术研发能力,并推动文本智能化软件系统在金融、法律、传媒、政府、军工等行业的广泛应用,为提升中国企业的运营效率发挥关键作用。

达观数据总部位于上海张江高科技园区,目前已在北京、成都、深圳、西安等地开设分支机构。曾于2015年获真格基金领投,众麟资本和掌门科技跟投的1000万元天使轮融资;2017年获软银赛富和方广资本5000万元A轮融资,自创立以来企业经营业绩持续保持高速成长,此次B轮融资也获得了多家知名投资机构的青睐。

宽带资本董事长田溯宁表示:“达观数据是一家在语义分析领域非常优秀的人工智能企业,很高兴宽带资本旗下的早期投资平台晨山资本这次能有机会与达观数据共同合作”。宽带资本合伙人、晨山资本创始合伙人蒋健表示:“自然语言处理技术有广泛的应用场景,达观数据是该领域最优秀的企业之一,无论是技术研发还是商业落地的能力都非常突出,我们看好达观数据在中国企业服务领域的未来发展”。

本轮跟投方元禾重元执行合伙人李莹表示:“达观数据的产品和技术在企业智能化转型升级中提供了非常大的价值,我们非常欣赏达观数据团队的技术情怀和务实的作风,相信通过持续发展,达观数据一定能做出非常伟大的成就”。

本轮跟投方钟鼎资本创始合伙人汤涛表示:”达观数据基于NLP技术构建的产品矩阵对企业的效率提升起着非常明显的作用。我们非常高兴地看到达观数据已经拥有一流的客户口碑,坚信在陈博士的带领下公司发展越来越好“。

联想之星主管合伙人王明耀,钟鼎资本创始合伙人兼CEO严力等新投资人,赛富亚洲管理合伙人阎焱,以及真格基金创始人徐小平,方广资本管理合伙人、原华为常务副总裁洪天峰,众麟资本管理合伙人朱海彤等以往投资人也均表示欣赏达观团队精益求精的态度和扎实稳健的作风,期待达观数据早日发展壮大成为行业独角兽。

利用先进的文字语义分析技术,达观数据为客户提供文本自动化处理软件系统,功能涵盖文本要素抽取、智能审核、舆情分析、知识搜索、推荐引擎、自动写作等,广泛用于金融,传媒,制造,政府,法律,军工等领域,成功服务了数百家客户,让计算机代替人工实现文本自动处理,大幅提高效率。

今年达观数据自主研发的文档智能审阅系统,是一款集文档关键信息抽取、文档比对、风险审核和智能纠错于一体的文字语义分析系统。该系统支持多种文档形式处理,利用机器学习及自然语言技术,自动从企业文档中抽取出关键信息,企业可借此将合同信息结构化,便于后期管理;信贷审阅则可借此一目了然净利润、主营业务收入等信息,以便进行后续评估。

文档智能审阅系统可将多种文档形式对同类文件信息进行比对,并提供可视化的比对结果展示;同时自动识别出合同中不规范的内容和缺失的必要条款,加强企业风险控制。

据了解,达观数据凭借语义分析领域的先进技术,摘得了中国智能科技最高奖——吴文俊人工智能科学技术奖;在近年来举办的各类算法竞赛中达观数据也屡获殊荣,包括最高人民法院的“法研杯”司法文书自动处理挑战赛的“刑期智能预测”系统,军委装备部的“军事智能-机器阅读”竞赛等。达观数据也曾勇夺“创青春”中国青年创业大赛全国总冠军,“阿里巴巴-诸神之战”全球创客大赛季军,“寻找独角兽”全球亚军等优异成绩,并顺利被微软加速器、联想之星、青腾大学、百度AI加速器、SAP创新联盟、张江895营等国内外知名孵化机构选拔培育。

达观数据创始团队来自盛大、腾讯、百度、阿里巴巴、搜狗、SAP等知名企业,创始人兼CEO陈运文博士毕业于复旦大学,为ACM和中国计算机学会高级会员,曾担任盛大文学首席数据官,腾讯文学高级总监,百度核心算法工程师等职务,多次参加国际数据挖掘竞赛并获得冠军荣誉。陈运文表示,中国企业的智能化应用还在初始阶段,大量书面文字工作目前还依赖人力来完成。不论是基础性的文档分析审阅,还是在知识搜索和信息推荐等应用层面,都还很薄弱。如何将文本语义理解技术,结合行业的知识图谱,形成自动化的处理系统,无缝嫁接到企业的业务场景中去,提高企业效率,是达观数据一直在探索和努力的方向。

人工智能的落地应用不是一蹴而就的事情,从理论到应用有很多的困难要克服,而语义分析又是其中挑战特别大的方向,因为语义是人类智慧的高度抽象和浓缩,让计算机去理解文字语义需要日积月累、精益求精的不断升级优化”,陈运文表示:“新一轮的资金投入,一方面将用于公司加强技术研发和团队建设,积累超大规模语料数据库;另一方面也将资助业界优秀的科学家们进行基础技术研究,并肩攻克难题。”

“文本语义理解的技术创业没有捷径可走,厚积薄发是必须经历的过程,也是达观数据一直坚持在做的。”陈运文说。 

产业语义理解融资创业公司达观数据
3
相关数据
搜狗机构

搜狗成立于2003年,是中国搜索行业挑战者,AI领域的创新者。目前搜狗月活跃用户数仅次于BAT,是中国用户规模第四大互联网公司。2004年8月,搜狗推出搜狗搜索,现已成为中国第二大搜索引擎。2006年6月,推出搜狗输入法,重新定义了中文输入,目前搜狗输入法覆盖超5亿用户,是国内第一大中文输入法。2017年11月9日,搜狗在美国纽约证券交易所正式挂牌上市,股票交易代码为“SOGO”,开盘价为13.00美元,市值超50亿美元。

http://corp.sogou.com/
达观数据机构

达观数据成立于2015年,是中国领先的文本智能处理企业,利用先进的文字语义自动分析技术,为企业、政府等各大机构提供文本自动抽取、审核、纠错、搜索、推荐、写作等智能软件系统,让计算机代替人工实现业务流程自动化,大幅度提高运营效率。 达观数据为企业提供完善的文本挖掘、知识图谱、搜索引擎和个性化推荐等大数据服务,是国内唯一一家将自动语义分析技术应用于企业数据化运营的人工智能公司。

http://www.datagrand.com/
陈运文人物

达观数据创始人和CEO,复旦大学博士。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

语义分析技术

语义分析是编译过程的一个逻辑阶段, 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查,进行类型审查。语义分析是审查源程序有无语义错误,为代码生成阶段收集类型信息。比如语义分析的一个工作是进行类型审查,审查每个算符是否具有语言规范允许的运算对象,当不符合语言规范时,编译程序应报告错误。如有的编译程序要对实数用作数组下标的情况报告错误。又比如某些程序规定运算对象可被强制,那么当二目运算施于一整型和一实型对象时,编译程序应将整型转换为实型而不能认为是源程序的错误。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

信息抽取技术

信息/数据抽取是指从非结构化或半结构化文档中提取结构化信息的技术。信息抽取有两部分:命名实体识别(目标是识别和分类真实世界里的知名实体)和关系提取(目标是提取实体之间的语义关系)。概率模型/分类器可以帮助实现这些任务。

推荐文章
机器之心・CEO
恭喜运文总~
机器之心・市场
厉害了
厉害了