微胖撰文

AI首次公开击败人类法律翻译,前猎豹首席科学家为何跨界创立法律AI公司?|独家

在查理·芒格口中巨头唯恐避之不及,但他们很喜欢的法律科技创新领域,又多了一家新的AI公司秘塔科技。上周这家成立仅一年的公司推出了两款初步成型的法律AI产品。其中,法律翻译AI(「秘塔 MT」)最让人意外,在此之前几乎没人听说这类产品。在良好的数据清理、结构化与算法设计的基础上,AI有望彻底变革当前法律翻译市场高收费、低效率的现状。另一款法律搜索产品,则完全在意料之中,毕竟,合同文本处理和搜索工具是目前最为硬核的法律科技创业方向。不过,这款工具的独特之处不仅在于能够揣摩用户搜索意图,它还将律师经常用到的数据源集中在一个平台上,实现一站式搜索,提升搜索效率。然而,任何法律科技创新都不可能一步而就,惊艳业界,而需要生态关注与支持。虽举步维艰,所幸的是,律师界正逐步形成一个共识:除了体制与管理改革,人机耦合是否成功也将是律所在未来竞争中胜出的关键因素。

采访、撰文 | 微胖

坦白讲,4月12日之前,我从来没听说过哪家创业公司在做法律翻译AI,直到那天下午在北京大学法学院模拟法庭观摩了中国第一场法律翻译人机对抗赛。

第一轮比赛中,清华大学、人民大学以及对外经贸大学,从八所北京顶尖高校(其他几所包括北京大学、外交学院、北京外国语大学、中国政法大学以及北京师范大学)队伍中脱颖而出,获得组成「人类精英」团队、迎战上海秘塔网络科技有限公司(以下简称秘塔科技)推出的法律翻译AI(「秘塔 MT」)的资格。

在人机对抗环节中,经过三份合同条款翻译(中译英)的较量,「秘塔MT」(辅以一位大学生选手修正机翻结果)最终以88.33 vs 79.22的比分战胜「人类精英」队。

人机对抗环节的赛题之一

你能分辨出哪一个是「秘塔MT」战队的翻译吗?

距离我不远处的北京外国语大学法学院国际法教师赵理智在整个赛程中都显得很兴奋。


「没想到国内的人工智能技术水平已经到了如此水平,」他说道。比赛结果出来后,他更放言人类「要从狼嘴里抢肉」了。

据公司CEO闵可锐介绍,「秘塔 MT」训练用数据包括两大类,通用领域高质量翻译数据和法律领域的数据。

不过,和我们的直觉相反,通用数据体量最大,大约千万级别,而法律特定领域数据仅几万、十万左右。

「90%不是法律领域的数据。」闵可锐告诉我们,「我们在算法上花了一番功夫,使用了迁移学习,对两个领域的数据同时加以了利用。」

「其实,纯粹使用法律数据,训练效果并不好,通用领域的高质量翻译数据同样不可或缺。」他补充解释道。

公司CEO 闵可锐

和赵理智不同,我本人并未对这个结果感到特别意外。

AI与律师的较量已经不是第一次了,而且每次都是AI获胜。比如,京东法律咨询机器人、阿里的合同审查AI以及以色列创业公司LawGeex的合同审查AI。

既然机器翻译是成绩最为斐然的NLP领域之一,那么,机器在法律翻译方面取得的效果,应该会比合同审查、法律咨询的结果更好。

但问题在于,为什么之前很多人没有留意到这块市场?

公司COO 王益为(左)与北大法宝总经理赵晓海(右)

法律翻译:从90%到10%

传统行业在享受技术红利上存在周期。

「拼技术的公司,会首先将先进技术集成到自己产品中。」 闵可锐说,「最新技术通常也首先倾向于规模最大、最容易用得上的领域。」

这也是为什么互联网巨头同时也是最强人工智能公司的原因。从这个角度来看,传统法律服务行业并非一眼看上去就能产生变革的领域。

不过,这位深度参与过猎户星空智能语音技术研发的前首席科学家对一度白热化的智能音箱和语音技术市场,有着自己的判断。在他看来,这类产品在未来可能会收敛到这样一种状态:

所有产品会做到70到80分之间。低于这个区间的产品显然不合格,但要做到超出80分,也会非常困难。

但是,法律翻译领域不会出现这样的情况。

秘塔团队在机器翻译方面一直有着比较强的技术积累。根据他们对最近两年翻译技术的理解,「机器翻译法律文本的准确性完全可以倒过来」 :

现阶段律师需要修改基于谷歌翻译初稿90%的内容,如果使用AI,初稿可用率可达90%,也就是说,人类律师仅需在这个基础上修正余下的那10%。

「做好数据清洗、结构化和算法,法律翻译质量会产生巨大飞跃。」 闵可锐说,「不过,做到90%并不容易,谷歌、DeepMind并没有这方面现成算法,必须自研。」比如,法律合同中一句话超过四百个字的情况比较常见,这个长度已经超过新闻类口语长度,给算法设计提出了挑战。

但这也正是法律领域吸引闵可锐的重要原因,它「是一块典型的纯技术洼地。

一年前,这位前猎豹移动首席科学家离开东家,成立秘塔科技。

技术洼地,仅仅是锁定市场的一个方面。法律翻译市场本身也具有高频、需求量大、高价值的特点。

目前,中国法律翻译市场主要包括两大类用户群:法律翻译公司和好的律所。

法律翻译公司一般从事一些格式法律文书的翻译,比如合同、章程、证明、法规等。

除了服务律所之外,他们也服务很多其他市场主体。比如,商业银行、投资银行、VC/PE基金、对冲基金、担保公司、资产管理公司、房地产公司、以及大型跨国公司的法务和财务部门等。

由于法律文本,特别是合同对翻译准确性要求非常高,客户需要支付每千字300到1200元,也是收费最高的一类服务。

「这个市场貌似小是因为非常分散。比如一些法律翻译公司,一年翻译一亿字的公司就算比较大的,但这样的公司有很多,比从事涉外事务的律所多多了。」王益为说。

律所,特别是业务比较复杂的优秀律所,是另外一个非常重要的用户群体。

这些律所业务大多涉及公司法、外商投资、境内企业对外投资、并购、合规、尽职调查、企业上市、知识产权等常见的非诉讼法律业务,法律翻译是工作不可或缺的一部分。

一位资深律师告诉我们,中国「红圈所」(一个对应英国魔圈所的提法,指中国最顶级的律所,比如金杜、君合、中伦、方达、环球等八家)一到三年的初级律师的很多时间都是在做翻译。

无论招实习生还是全职,绝大多数顶尖律所笔试的第一题都是翻译,后面还会有英文撰写起草合同部分。可以说,法律英语的掌握程度关系着是否能拿到这些律所的offer。

笔者也发现,君合在自己的网站中明确写道,「已在海内外拥有......一支由220多位合伙人和顾问、510多位受雇律师和法律翻译组成的逾730人的专业团队」。

「方达,中伦也有专门的翻译团队。」王益为说。创业之前,他已经在红圈所从事并购、境外上市等业务十多年。

这些律师事务所服务的客户比较高端(以财富500强为主),这些客户愿意给高质量的法律翻译服务支付较高的价格,因此,翻译文件报价在每小时上千人民币,法律翻译也成为许多外资所和大型内资所的分支收入来源之一。这也是为什么他们一般会设置全职法律翻译职位。

通常,初级律师会花费50到60个小时(约为一周的时间)来处理一份长度约为70页的合同。如果使用AI,效率有望提升5到6倍。也就是说,处理70页合同所需时间,将由50个小时缩减到约20小时(一天的时间)。

一位从事法律翻译的业内人士告诉我们,由于法律行业的高度专业性以及八股性,一般做了5年的翻译,基本上可以做到一个合同拿出来,50%以上的内容都是耳熟能详的。尤其是碰到长期客户和大型项目,雷同率非常高,这也意味着用机翻提升效率的可能性很高。

更为重要的是,律师的工作性质从劳动密集型升格到更考验知识技能的文件修改和起草,同时,初级律师也有更多时间和精力从事更加创造性工作,律所维系翻译团队的运营成本也大大降低。

亚马逊上海人工智能研究院院长张峥曾在人机对抗赛现场讲话中,将法律领域比喻成一条裂缝。

不同应用场景就像地面上不同的裂缝,人工智能技术就像水。

「(法律翻译)这条裂缝,水渗透的速度会特别快,」张峥说。

「会对既有工作模式的颠覆。」闵可锐说,这是一个有付费意愿的真正需求。

法律检索:所见即所需

半年前,笔者曾采访过LegalZoom联合创始人Brian Liu ,这位伯克利毕业的法律高材生曾妙喻法学教育:本质上就是告诉你如何在那么多文本中,准确定位到你需所需的信息。

闵可锐做了一个简单分析。

中国法律法规数据体量已达180万量级,这个数字已经超过人脑可以记忆的数量。这意味着律师提供法律服务的核心服务,很大程度上是信息搜索、整理和加工。

实践中,这些工作通常会被交给初年级律师。「一个低年级律师的30%时间都是在做legal research。」王益为说。

问题在于,这个时间花得值吗?

假设一位客户希望了解自己公司推行「996」工作制是否触犯劳动法。

在某法律数据库搜索栏中输入「996」,律师发现,排在列表第一位的是1996年发布的谋份法律文书。显然,这仅仅是字符串意义上的相似,与满足律师所需还差很远。

然后,这位律师会转战谷歌,输入「996」后,这位律师会得到关于「996工作制」的百度百科。


「他会根据这个搜索结果,找到合适的法律关键词,再回头进入数据库查询。」王益为说。整个过程需要往返于不同信息源,不仅大费周章,也对关键词的斟酌,提出了很高要求。

秘塔的搜索引擎,展示了新的可能性。

输入「996」,系统会自动推出劳动法。系统已经揣测到这位律师可能是想搞清楚某家公司如果实行996,是否存在法律问题,所以推荐了劳动法。

再比如,输入「范冰冰」,系统会将涉及偷税、漏税的法律规定置于首位。显然,系统推测用户是想了解迫使范冰冰淡出人们视线的「阴阳合同」所涉及的相关法律问题。


这种可以揣摩用户意图的检索,叫做预测性检索,采用了秘塔自主研发的异构非结构化分析引擎。

秘塔的技术团队有着比较强的分词技术,也将语义联想、实体识别等知识图谱相关技术应用到了分析引擎中。

除了这些通用领域比较常见的先进技术,王益为还强调了生成式摘要技术和 Learn to rank 技术。

和抽取式摘要技术不同,使用了深度神经网络的生成式摘要技术,更接近人类思维方式:

先理解,在提取概要。系统在理解文本的基础上(比如只关注知识,对其他内容选择性忽视),重新生成更有针对性的摘要。

这种基于查询(Query)的自动文本摘要技术会帮助用户尽快找到目标内容。

而「我们的 Learn to rank技术可以让系统自动学习更合理的排序。」王益为说。由于记录了每次使用的点击情况,学习使用者的习惯,系统会自动提升排序质量。

目前,预测性检索技术应用到了分析引擎的所有模块中。不过,仅对法律法规、知识经验模块做了优化。

针对笔者感兴趣的类案推送的优化,闵可锐表示,因为「不同数据源,排名优化细节存在差异,这要留待接下来的工作。」

其实,除了搜索体验的与众不同,律师一眼便会看出这款搜索产品的另一个不同:

一站式服务,除了诸如法律法规、案例、办事指南等常规模块,还包括诸如资讯和知识经验等内容。

根据王益为多年的红圈所经验,律所所需信息源通常有好几个。

比如,中国法律法规,大多使用的是北大法宝;案例搜索,会用无讼和裁判文书网;政策规章,会去不同政府网站搜索。

但是,王益为特别强调了知识经验对律师行业的重要性。

「律师经常会针对热门法律问题写些文章,或者就自己处理某类案件的经验写篇文章,这是做市场推广的一个重要手段。」王益为说,「对于同行来说,也是很宝贵的参考资料,同时也是业务捷径。」

然而出乎意料的是,尽管有些律师会去知乎等公号搜索这类同行见解,但也有不少律师甚至连可以搜索微信公众号文章都不清楚。

因此,秘塔尝试将所有这些重要数据来源整合到一起,实现一站式搜索,提升律师工作效率。

「一个账号500元包年」

当问及最为关心的产品定价时,王益为给出一串并不令人咂舌的数字:

今年的产品定价是,法律搜索一个账号,一年500元;法律翻译,每千字30块。

「希望今年可以拓展五万律师和公司法务的用户,有了这些对业务要求非常严格的用户背书,我们就能继续去做更大、更复杂的产品。」

如果秘塔能在小范围内证明方案的有效,其他律所可能会被迫紧跟趋势。与此同时,通过产品在实际场景中的应用,反哺得到更多的数据,形成商业闭环,也有助于公司进一步打磨产品,实现技术迭代。

不过就在一周前,一组最新数据透露出过去五年法律创新领域的惨淡:

过去五年中,法律行业至少涌现出159家创新公司(广义上创新,不止于AI技术创新),其中,28家已经宣告失败。

法律大数据公司华宇元典即将推出一份过去五年法律创新行业的报告。相关数据来自这份尚未完全公开的报告。
来源同上。
来源同上。

中国的法律服务市场规模,约为一千亿人民币,并以每年20%的增长。但是,法律科技投入不到其中的1%。相比之下,美国律所对法律科技投入大概在7%左右。

「律所很关心如何将自己做大做强,但他们主要是考虑走精品所还是大所道路、如何规模化或者提升管理效率,很少有律师关注法律科技。」王益为说。

由于目前面向消费者群体的法律咨询服务的标准化和产品化还比较遥远,因此,从事法律科技创新的公司大多服务B、G端客户。这意味着,这个领域短期内不会出现类似消费者应用场景下的那种爆发性增长,这也多少导致资本的兴趣索然。

尽管如此,仍有不少业内人士看好这个市场。

2019年 Daily Journal 年会上,查理·芒格谈到了这家公司的法律自动化服务业务线:

「我们做的这种软件生意,IT 巨头们避之唯恐不及。」

「这个生意就是这样,根本快不起来,而且还很磨人。我们倒是一直很喜欢这生意,因为能做这个生意的公司必须有钱、有决心、能坚持下去。」

最近,美国创业公司 Pare 联合创始人 Dave Lu 在《如何让你的创业项目估值10亿美元》一文中,特别提及了法律创新项目的潜力。同时,也一针见血地指出了这个领域的棘手之处:

「与经年累积的商业模式竞争,并非易事。如果你还不是业内人士,则难上加难。」

因此,对于市场新生力量来说,如何将点子化作产品落入目标用户群,这一点至关重要。

就秘塔团队来说,一方面,王益为是一位非常资深的法律圈内人。从北大法学院本科毕业后,他继续在伦敦大学与哥伦比亚大学深造,获得硕士学位后进入红圈所。

正如 Dave Lu 在文章中建议的,「积极寻求拥有广泛资源及良好信用的业内专家合作,比较容易获得行业信任,赢得关键用户。」

另一方面,闵可锐认为,圈内人的口碑相传也是一个很重要的销售渠道。

「法律群体对新的知识和产品会比较有好奇心,也有比较好的消费能力,这是有利的地方。而且,律师之间的信息互通做的比较好,有利于形成口碑相传。」他说。前提就是,对自己技术和产品的自信。

法律创新至今举步维艰,甚至有人说2019年会是未来五年最好的一年。所幸的是,就笔者获取到的信息来看,经过这几年的市场教育,至少那些优秀的律师和律所正逐渐趋于一个共识:

除了规模化与管理效率提升,人机耦合是否成功也将是未来竞争中胜出的关键因素。至于中国市场,查理·芒格说了这样一句话,「中国的水可以。有些聪明人已经蹚进去了。时候到了,更多人会进场。」

这也是今年他在Daily Journal 上发言中,在法律业界流传最广的一句。

产业语言翻译法律AI人机大战
2
相关数据
亚马逊机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

收敛技术

在数学,计算机科学和逻辑学中,收敛指的是不同的变换序列在有限的时间内达到一个结论(变换终止),并且得出的结论是独立于达到它的路径(他们是融合的)。 通俗来说,收敛通常是指在训练期间达到的一种状态,即经过一定次数的迭代之后,训练损失和验证损失在每次迭代中的变化都非常小或根本没有变化。也就是说,如果采用当前数据进行额外的训练将无法改进模型,模型即达到收敛状态。在深度学习中,损失值有时会在最终下降之前的多次迭代中保持不变或几乎保持不变,暂时形成收敛的假象。

数据清理技术

数据清理(data cleansing)指删除、更正数据库中错误、不完整、格式有误或多余的数据。数据清理不仅仅更正错误,同样加强来自各个单独信息系统不同数据间的一致性。专门的数据清理软件能够自动检测数据文件,更正错误数据,并用全企业一致的格式整合数据。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

强人工智能技术

强人工智能或通用人工智能(Strong AI或者 Artificial General Intelligence)是具备与人类同等智慧、或超越人类的人工智能,能表现正常人类所具有的所有智能行为。强人工智能是人工智能研究的主要目标之一,同时也是科幻小说和未来学家所讨论的主要议题。相对的,弱人工智能(applied AI,narrow AI,weak AI)只处理特定的问题。弱人工智能不需要具有人类完整的认知能力,甚至是完全不具有人类所拥有的感官认知能力,只要设计得看起来像有智慧就可以了。由于过去的智能程式多是弱人工智能,发现这个具有领域的局限性,人们一度觉得强人工智能是不可能的。而强人工智能也指通用人工智能(artificial general intelligence,AGI),或具备执行一般智慧行为的能力。强人工智能通常把人工智能和意识、感性、知识和自觉等人类的特征互相连结。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
联想机构

联想集团是1984年中国科学院计算技术研究所投资20万元人民币,由11名科技人员创办,是中国的一家在信息产业内多元化发展的大型企业集团,和富有创新性的国际化的科技公司。 从1996年开始,联想电脑销量一直位居中国国内市场首位;2005年,联想集团收购IBM PC(Personal computer,个人电脑)事业部;2013年,联想电脑销售量升居世界第一,成为全球最大的PC生产厂商。2014年10月,联想集团宣布了该公司已经完成对摩托罗拉移动的收购。 作为全球电脑市场的领导企业,联想从事开发、制造并销售可靠的、安全易用的技术产品及优质专业的服务,帮助全球客户和合作伙伴取得成功。联想公司主要生产台式电脑、服务器、笔记本电脑、智能电视、打印机、掌上电脑、主板、手机、一体机电脑等商品。 自2014年4月1日起, 联想集团成立了四个新的、相对独立的业务集团,分别是PC业务集团、移动业务集团、企业级业务集团、云服务业务集团。2016年8月,全国工商联发布“2016中国民营企业500强”榜单,联想名列第四。 2018年12月,世界品牌实验室编制的《2018世界品牌500强》揭晓,排名第102。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

知乎机构

知乎作为中文互联网知名知识内容平台,致力于构建一个人人都可接入的知识分享网络,让人们便捷地与世界分享知识、经验和见解,高效获得可信赖的解答。 目前,知乎已经覆盖「问答」社区、一站式知识服务平台「知乎大学」、短内容分享功能「想法」等一系列产品和服务,并建立了包括音频、视频在内的多元媒介形式。截止 2018 年 8 月底,知乎用户数已突破 2 亿,回答数超过 1.2 亿。未来,知乎进一步加大对 AI 技术和应用的投入,构建一个由 AI 驱动的智能社区,让知识普惠每一个人。

https://www.zhihu.com
暂无评论
暂无评论~