微胖撰文Meghan(李九喻)、微胖采访

听闻它击败20位顶尖律师后,我们和法律界的「AlphaGO」聊了聊

「人类的易错性,让我印象深刻。」LawGeex 市场营销副总裁(VP of Marketing)Shmuil Goldberg 在谈及那份研究时说道。

今年 2 月底,以色列法律科技创业公司 LawGeex 联手杜克、斯坦福等大学进行了一项研究。结果,在标准商业合同审查(五份保密协议,NDA)中,二十位拥有数十年公司法和合同审查经验的美国顶尖律师,输给了公司研发的人工智能系统。

AI 平均准确率 94%,人类平均准确率只有 85%。其中一份 NDA(保密协议)审查中,AI 的正确率达到 100%。

LawGeex 团队

人工智能协助人类工作,已经有二十多年历史。比如,帮旅行社订机票、医生诊断、金融从业者交易。

「其他行业都相信人类会犯错。」Shmuil Goldberg 说,「法律却是唯一的行业,仍然坚信人类可以把事情做得很完美。只要是律师审核过的合同,似乎就没有问题了。」

结果,我们都被结果震慑到了。「律师们不知道为什么人工智能可以做到这么棒。」

Shmuil 告诉我们,为了这次较量相对公平,他们选择了保密协议(NDA),「因为这是一项最基础的法律工作,也用不上人类创造力。」

纽约数据公司 CB Insights 的一份报告显示,2017 年,风险投资公司对法律行业人工智能技术的投资比 2016 年猛增了 43%。这表明,法律行业使用人工智能技术的趋势发展得比任何时候都快。

其中,合同领域是一个非常活跃的创新领域。刚刚结束的全球法律黑客松的第一轮比赛中,两个夺冠项目都与合同有关。

其中一个项目旨在帮助当事人在跨国买卖合同中,更加准确地使用国际贸易术语以降低风险。另一个旨在自动提示合同文本中的模糊内容。

而「我们希望每个人都能以简洁、高效而低成本的方式获得法律服务。」公司 CEO Noory Bechor 曾这样谈及公司设立的初衷。

2017 年 3 月,LawGeex 完成 7 百万 A 轮融资,开始组建销售团队,推广产品。而在此之前,作为一个产品为先的公司,他们将全部精力用于了产品研发。

LawGeex 市场营销副总监(VP of Marketing)Shmuil Goldberg

你不需要在自己看不懂的合同上签字

几乎每个人都有过这样的经历:租房,签了一份租赁合同,却不知道怎么审查;签了份劳务合同,却不知道公司条款是否苛刻。

最典型的是,竞业禁止条款。由于太想得到某份工作,人们常常没有仔细阅读合同就签字,却忽略了一个基本事实——协议具有法律效力。竞业禁止条款会限制雇员从事具有竞争性质的业务,或者自己创办这类业务。(大家可以脑补一下最近自动驾驶领域的两大「世纪之案」。)

「这就是我创办这家公司的初衷——让没有法律背景的人也能看懂合同,自己做出好的决定,避免付出代价的错误。」Noory Bechor 曾告诉媒体。2014 年 12 月,他和以色列人工智能专家 Ilan Admon(CTO)共同创办了 LawGeex,开始研发这款基于 AI 的合同审查系统。

2016 年 4 月,为了获取更多合同数据,提升产品体验,公司开始向个人免费开放平台服务。

用户登录网站,注册并上传自己的合同后,系统就可以分析合同,并将之与数据库中的合同进行比对。

系统会标记出可能漏掉的条款、可能需要移除的异常条款,并标记出需要认真阅读的重要条款。系统给出的反馈非常简单,浅显易懂,没有法律背景的用户读起来,也毫不费力。

产品界面

一位曾经试用过这款平台的记者提供的产品截图

最初,公司开放出雇佣合同审查服务。接着支持更多合同服务,比如租赁合同等。

由于产品的易用性和高性价比,平台刚上线几个月便通过口碑传播,审查了数以千计的文件,其中包括 Apple、Google、facebook 等公司的劳动雇佣合同。

这一年(2016 年),他们获得了来自以色列著名天使投资人 Eilon Tirosh 和 Rami Lipman 等人 250 万美元的投资。

月收费 1 千美元的 B 端产品

审查的合同越多,算法才能理解地更好。但是,对于一家创业公司来说,做一款满足普通用户的 2C 法律科技产品,并不现实。

普通人每年需要审核的合同数量非常少,需求也属低频。「我们不会卖给个人用户。他需要有足够多的合同,购买才是经济可行的。」Shmuil 说,理想中的客户,每年会有 500 以上的合同审查需求。

他们将目光锁定在了公司法务。国际商务律师从业经历也让 Bechor 看到了行业痛点:合同审查仍然是一项枯燥的劳动密集型工作。

典型财富 1000 强公司管理的合同平均数量,高达 2 万到 4 万份。但是,83% 的公司都对现有组织合同管理流程不满。尤其是保密协议,通常需要耗费一个礼拜甚至更长的审查时间。

「最佳目标用户是公司法务,大中型公司的法务。」Shmuil 说。这样规模的团队,一年要处理一千多件合同,也就是说,至少每个礼拜都会用到这个平台。而提升这些人的工作效率,意味着公司能在不增加风险的情况下,快速推进业务。

相较于 C 端产品,B 端用户既保证了需求的体量与频次,对产品价格也不会特别敏感,更适合一款新的法律技术产品落地。

公司 CEO Noory Bechor(左)以及 CTO Ilan Admon(右)

至于产品要实现什么样的智能功能,Bechor 认为,标准就是用户对公司法务的要求。

「你希望公司的律师做什么?你希望他们标记出那些本不该出现的内容,标记出本来应该出现的内容,你希望律师能够解释你不懂的内容。」

LawGeex 就是这样设计平台的。

使用产品时,用户首先要决定「剧本(playbook)」比如,我希望能有这些条款,这是我们想看到的一些先例,比如术语的定义是这样的。一旦定义完后,经过预训练的 AI 就可以根据这个剧本来审查合同。

「我们的这个系统已经学习了 40 多万分合同,而且可以识别出合同要素。比如,这是准据法,这是禁制令,准据法条款是纽约,禁制令是两年时间。我们会比对用户设定的需求,然后确保匹配。」Shmuil 说。

「如果律师设定了一个非常严格的模本,哪些是我们希望看到的,哪些不是我们希望看到的,什么时候应该怎么写等。那么其他部门,比如人力资源、销售部门和业务拓展部门就可以自己审核合同了。」他补充道。

平台大大缩短了合同审核周期。过去可能要花一个礼拜甚至一个月的时间,现在,一个小时就能完成工作。

与此同时,还能保持合同审查的高度一致性。「如果你邀请同一位律师分别在周一和周五早上审查同一份合同,结果会有很大的不同。」Shmuil 说。

目前,LawGeex 为个人用户提供免费服务,为企业提供有偿服务。而客户几乎全是大中型企业,包括德勤这样的大企业。绝大多数用户来自美国。

「我们也不会把产品卖给律所。」Shmuil 补充道,公司产品的主要价值是效率,而节省时间与根据时长收费的律所规则相悖。

产品定价会根据很多因素,大约每月收费 1 千美元。

独门秘籍

由于法律科技领域并没有一个类似 ImageNet 这样的标准赛事,用户通常很难直观地看出哪款法律 AI 产品的精确度更高。比如,同样是在线合同审查平台,Legalsifter 和 LawGeex 的 AI,谁的精准度更高?

在 Shmuil 看来,这不是一个很难回答的问题。

一方面,在精准度方面,LawGeex 使用了 F-measure。这是一种非常严格的精确度定义,也是机器学习常用的指标之一。「近几个月,我们只用这个指标,因为这是最严格的精确性指标。」

另一方面,所有其他工具,在输入大量数据后,只会回答一到两个问题。比如,能不能签或者做不做这笔生意。

「这些工具的特点是,在输入大量数据后,只给你一个答案。」Shmuil 说,「我们的工具在给你一个终极答复前,会问上千个问题。它也是唯一一个会询问这么多问题、并标记出相关部分、不相关的部分,并将之交给律师的工具。」

而所有这些与众不同,都离不开公司花费三年多时间研发的「秘密配方」:算法模型 LLP 和 LLU。

「法律语言非常规范,如果你只说一件事,那就意味着一件事。这在自然语言中是非常不同的,它可以有十种表达方式,如果你想说一件事,会有 25 种不同的说法。」

为了解决这个难题,公司研发一种叫做 LLP 的算法,作为法律语言处理器。

「我们的办法就是尽可能用许多合同训练神经网络。首先,我们会教会系统理解法律术语,而不是自然语言。一旦做到这一点,接下来就能训练系统理解法律概念了。」Shmuil 说。

「当提到某个法律概念时,系统会明白这个概念是什么,比如竞业禁止、披露等。如果要求系统浏览合同找到披露相关内容,系统不会找『披露』这个词,而是所有表达披露意思的法律术语。」

可见,LLP 的构思和 NLP 的基本架构类似,但是,基础信息和算法本身还是存在根本不同。毕竟,系统是被训练用来理解更加严格的语言,而不是流畅的语言。

在回顾这段艰辛的研发历史时,Shmuil 感叹道,NLP 对法律术语几乎不起作用!

「所有现成的 NLP 解决方案都是建立在自然语言的基础上的,但法律术语(legalese)不是自然语言,传统的自然语言处理器不起作用,我们必须从头开始。」

另一个算法模型是 LLU,它可以理解法律术语,并像谷歌翻译一样把它们翻译成法律概念。

比如,一组文本中有五个法律单词、或者某个段落、句子指的是某个法律概念。

「如果系统发现这五个单词意思相同,它就会明白他们指向同一个概念,这就是这个平台的重要价值。」Shmuil 说。「即使是之前从未见过的,也能基于对所涉法律上下文的理解,搞清楚这个法律概念的意思。」

据 Shmuil 介绍,公司研发团队拥有本国顶尖的机器学习和 AI 专家。其中,联合创始人兼 CTO Ilan Admon 就是知名人工智能专家,在过去 20 年里一直在研究机器学习算法,具有丰富的技术背景经验。

「人工智能已经接管世界」

打造一台基于 AI 的合同审查系统,需要大量合同文本。然而,合同与公开的判决书不同之处在于,合同会涉及公司敏感和隐私信息,如果没有公司授权,无法使用这些数据训练系统。

这也是研发基于 AI 的合同管理工具所面临的主要挑战之一。Shmuil 也承认,没有一套类似 ImageNet 这样的数据集,「这也给我们带来了额外的挑战。」「一开始,数据确实是一个挑战。」

随着公司的不断壮大和成熟,LawGeex 设立了专门的合同采集部门,主要负责采集签署过的执行合约,包括 DNA,订购合同等。公司也会搜索一些公开的数据,公共信息,开放公司的分享等。

其实,不仅仅是数据量,整个前期工作(标记、清理数据等)的体量之大与繁琐,直到今天都让他记忆深刻。

为了正确标记数据和训练系统,他们采用了和国内法律科技公司类似的做法:成立了自己的法律专家团队。包括执业律师、兼职律师以及不再执业但仍有执照的律师。

「团队成员包括有经验的美国律师。有的来自哈佛大学、有的来自世界上最大的律师事务所,有的来自公司法务。」他介绍道。

「过去几年,都在寻找、清晰和标注这些合同,为训练做准备。」现在,系统已经「消化」了 40 多万份合同。

但是,40 多万份合同的敏感信息如何得到保障呢?

对此,Bechor 表示,这些合同不会成为公司数据库的一部分。公司只会保存用户上传的合同一段时间,不会和任何人分享。

「但是,引擎确实会搜集相关统计信息,用以提升系统的准确性以及反馈质量。比如,可以为用户提供更为详细的统计数字,什么是标准条款,什么不是。」比如,我们数据库中 80% 的合同并不包含类似的条款。他说。

如今,公司团队已经由几年前的 20 多人发展到 50 人左右的规模。其中,最多的仍然是数据研究人员和工程师。

在谈及 AI 如何变革法律领域这个老生常谈的问题时,Shmuil 似乎显得信心十足:

「与我们合作客户的规模,越来越大。我们发现,法律从业者采用法律人工智能技术,不再是一个问题。过去几年,大公司都在采用这种技术。担心丢饭碗的,只是市场中的小咖玩家。」

自动化和机器学习已经在法律领域发挥了关键作用。「我们不认为人工智能正在接管世界,应该说,人工智能已经接管世界。」他说。

产业LawGeex人工智能系统标准商业合同审查
返回顶部