前腾讯74号员工带队,上演网络反欺诈的「生死时速」

某个二线城市的午后,一场网络欺诈与反欺诈的「生死时速」正在上演。

采访、撰文 | 寓扬

同一个地址同一个 WiFi 下,一个订单流进后台后,又一个不同用户 ID 的订单流入,紧接着又有连续数个不同的订单涌入。单看每一单似乎都正常无误,一只黑色的「爪牙」已经在悄无声息地行动了。

只有机器敏锐地捕捉到了这一切,只见每个订单的风险分都在上升,系统亮起鲜红色的警示,当机立断拦截了这一地址下的订单,冻结「用户」的消费金额,一次别有预谋的黑产行动被粉碎。

然而如饿狼一般的黑产,保持着敏锐的嗅觉,一旦嗅到金融风控的「口子」,便会扑上去狠咬一口。

作为一家金融科技公司,与隐匿在暗处的黑产「相搏」,大概是乐信每天的日常。

人工智能正在成为乐信的一柄利器,不仅仅应用于惊心动魄的反欺诈,更有来自一线千亿级业务的大规模 AI 实践。

对乐信而言,这不仅仅是一场事关公司 2000 多号人生存的斗争,更是一场关乎信任的斗争,在乐信的身后是 5000 多万的消费者与近百家金融机构。

1 一场寻找最优解的求索

2013 年,彼时在腾讯财付通做产品总监的肖文杰,发现了一个年轻人的「尴尬」,他们成长潜力巨大,消费需求旺盛,但往往囊中羞涩支付能力不足,并且小额信贷也不被传统金融机构重视,他们的消费需求一直得不到满足。

能不能通过互联网金融改写这一局面?正是对这一问题的探寻,肖文杰于当年 8 月创立了乐信的前身分期乐商城,聚集消费者、商品、资金方,开启分期购物的早期探索。

「分期购物」这一概念在今天看来似乎稀疏平常,可是放眼 2013 年,对于一家创业公司,这无疑是一次冒险的尝试。当年被称为「互联网金融元年」,一切都刚起步,呼声最高的 P2P 金融如今最是惨淡。至于消费金融,市场更没有成熟的模式供参考。即使是天然具备电商场景的阿里与京东,也才在接下来的两年中,分别携花呗与白条入场。

简单来说,乐信所做的核心事情就是匹配,消费者希望贷款购买想要的商品,金融机构希望把钱借给合适的人,核心就变成了如何在消费者、平台、资金方三者之间寻找一个利益「最优解」。

真实的场景是这样的,比如刚刚工作的小明想要买一台无人机,因为不想让生活太过紧巴而选择分期购物,他希望可以快速(实时响应)获得借款,并且用更多的分期来减轻生活的负担。

作为资金方的银行或金融机构,每家对于人群、风控、额度、分期等的要求都不同,比如说一家河南的消费金融公司,它可能只承接本省周边几个地区的借款,额度控制在 1500 元以内,分期不要超过 12 期;并且有的银行对坏账的容忍率极低,有的则相对宽松一些。

另一方面,作为平台,乐信金融科技的特点是小额借贷,大多在 2000 元以内,但订单量大,日订单往往达百万量级。这意味着乐信必须尽可能把金融成本做到最低,才能实现平台收益最大化。

面对三方不同的利益诉求,靠人工去匹配显然不现实,一方面业务量巨大,等人工审核匹配完了,用户可能已转身离去;另一方面,即使是诸葛亮在世,也很难在近百家金融机构间周旋,找到一个三方之间的最优解。对乐信而言,这无疑是一道商业模式能否跑通的坎。

这时乐信将目光投向 AI 技术,邀请前腾讯 74 号员工、拥有丰富履历背景的史红哲加入,担任公司副总裁,全面管理公司技术体系。

彼时,乐信已形成了一个明星管理团队,除了 CEO 肖文杰外,还有同为腾讯财付通的战友,曾经微信支付总经理的吴毅,担任集团总裁,二人可谓是首批既懂互联网又懂金融的行业精英;首席金融官乔迁和首席风控官刘华年均是拥有十多年从业经验的行业资深专家;史红哲的到来则补上了技术这块「板」。他们将各自的势能叠加,将互联网、金融、风控、技术这些元素融合在一起,构成了乐信最核心的力量。

吴毅(总裁,上排左一),肖文杰(CEO,上排左三),刘华年(CRO,上排左四)

史红哲(VP,下排左一),乔迁(首席金融官,下排左四)

回到技术线,在史红哲的带领下,乐信于 2017 年 10 月成立人工智能研究院,系统布局机器学习等 AI 技术,开启一场寻找最优解的数字旅程。

史红哲介绍,运筹学机器学习在智能匹配中发挥了重要作用。分期乐商城中的每一笔订单流入平台后,通过机器学习、梯度分配等 AI 算法和规则引擎,系统根据消费者状况对资产进行分级、定价,再结合资金方的要求,系统会根据各种权重计算出一个匹配值,可以类比推荐系统,分数越高越符合最优解,乐信选取分数最高的几家,依次推荐给金融机构做选择,直到完成最优匹配。

这一技术最终演进成乐信的「虫洞」系统。虫洞是一个物理学概念,意为连接宇宙中两个遥远时空的最短路径,也代表乐信对技术的追求。

虫洞 图片来自 Shutterstock

使用 AI 自动匹配消费者和资金的另一个优势是效率的极大提升。目前,「虫洞」系统已经可以做到人工「零干预」,百万订单秒级对接,全年承载资产管理规模达千亿级。

正是这一役,让乐信站稳了脚跟。

2 与黑产相搏

然而用技术探寻最优解的过程总有「黑天鹅」发生,黑产涌入,欺诈随之而来,在一次次欺诈与反欺诈「惊心动魄」的战事背后,AI 正在成为乐信的「神兵利器」。

2013 年前后,在消费金融的初期,行业基本没有欺诈行为。然而随着消费金融逐渐走热,嗅到可乘之机,早期的信用卡欺诈团伙、羊毛党等纷纷转入,2015 年后整个黑产迅速壮大。

据《中国数字金融反欺诈报告(2019)》显示,截至 2018 年,我国黑产从业人员已超 200 万人,市场规模达千亿。金融欺诈也呈现出数字化、专业化、小额高频、团队作案的特征,涉及几百号人的欺诈案件时常发生。

史红哲指出,欺诈可以分为十多种类型,其中最严峻的就是中介诈骗和电信诈骗。而诸如伪造身份之流,则随着人脸识别技术的成熟,已不再构成欺诈的核心。

以中介诈骗为例,诈骗团伙往往租一个房子,打着「刷单冲业绩」之类的旗号,怂恿附近的年轻人用自己的身份信息注册贷款,比如分 24 期购买一台 iPhone 手机,骗子会承诺由他们负责还款,并许以对方一定的好处,之后卷货走人。一些人警惕意识不强,或被一些小恩小惠遮蔽了双眼,就很容易上当。

更为严峻的是,从单个订单来看,这些欺诈订单与正常订单基本无异,使用的是用户的真实信息,依靠传统风控的人工审核或专家规则很难发现。反欺诈能力已经成为消费金融企业必须跨过的一道「鸿沟」。

在与欺诈行为的斗智斗勇中,乐信依托 AI 技术,从数据洪流中练就一双「火眼金睛」。

史红哲指出,乐信构筑了一个四重反欺诈模型「试炼」体系,通关者(信用良好)才能获得借款它是 AI、专家规则、黑名单等的有机结合,是真正从实战中磨砺出的 AI 反欺诈法则

首先第一层是黑名单,乐信通过对互联网失信记录的爬虫、外部合作数据,构筑了一千多万的黑名单,还有上千万的灰名单体系。当一个订单进入系统,命中黑名单的「玩家」直接淘汰出局。

第二层是专家规则,在与欺诈势力相搏的过程中,技术团队同风控团队共同协作,用「脑容量」构筑的一道防线。

第三层是 AI 模型,通过对历史数据,尤其是欺诈样本的学习,机器学习算法就会自动学习欺诈的相关特征,比如交易时间、地点、金额、行为序列等等,然后用这些特征细致入微的审视每一个订单。

比如当一个正常用户下单时,他通常会浏览不同的商品,货比三家后下单,其行为数据在浏览页面时长、下单间隔等方面会呈现出不规则的特点。但如果一个用户出现规律性下单,相比正常用户的「离群特征」,这部分用户就属于「高危用户」。

这种「离群特征」靠人工审核几乎很难发现,只有通过机器学习,经过大量的计算分析,才能识别。

如果把第三层历练看做个体微观式的观察,那么第四层就是「全景敞视监狱」。一些订单如果从单个订单的维度来看,可能完全正常,但如果上升一个维度,放到订单洪流中去观察,往往就会别有洞天。


比如通过「复杂网络」,可以计算下单人与黑名单或灰名单的相关性,相关性越高代表风险越高;再比如通过聚类分析,如果同一个 WiFi 节点下出现数十个订单,或者大量订单涌向一个地址,都很可能是欺诈行为,一些订单就会「原形毕露」。

这四重「试炼」是乐信反欺诈技术体系的核心,纵向构筑了乐信反欺诈的壁垒。而在横向上,乐信还引入了反欺诈实时监控、反欺诈实时排查、反欺诈信息库、反欺诈舆论收集体系,构成了乐信反欺诈的横向数据基础。

经过四重考验,系统会根据不同的权重,给予每一个订单一个风险分,风险分高的系统会自动拒绝,风险分合格通过审核,中间的少部分则交由人工二次审核,从而做到效率与风险的最优解。

史红哲透露,使用了 AI 技术后,乐信平台的年欺诈资产迅速下降了七八成左右,过去一年帮助消费者挽回近 5000 万损失

《中国数字金融反欺诈报告(2019)》也显示,2018 年银行卡欺诈率约为 1.16BP,而乐信平台的欺诈率仅为 0.003BP,即三百万个交易中可能有 1 单发生风险,坏账率远低于银行。这正是 AI 所带来的价值。

这些技术最终都沉淀在乐信的 AI 风控引擎「鹰眼」中。史红哲称,「鹰眼」引擎目前已拥有 7500 多个数据变量,98% 的订单机器自动完成,日均处理百万笔订单,相当于 3000 名审核员的工作量

正是在这一领域亮眼的表现,今年 3 月,哈佛大学推出首个 Fintech(金融科技)精品课,乐信作为中国金融科技公司代表入选课程案例。7 月乐信再获得有金融「奥斯卡」之称的《亚洲银行家》「中国最佳信贷技术项目大奖」。

人工智能,可谓构筑了乐信关于信任的「生命线」。

3 技术的背后

用 AI 技术守护乐信信任「生命线」的,不仅有技术团队攻坚克难,更有风控团队与业务团队的紧密配合。在企业一线的实战中,技术的关键不仅是用了什么模型,取得了什么效果,更重要的是如何与业务协同配合,让技术内化为全公司的信仰。这是乐信 AI 实践的另一个维度。

技术与业务的均衡发展,以及在发展的不同阶段动态调整二者的关系,对于任何一家公司都是一个挑战

传统金融机构进行数字化转型时,往往会引入一个统一的科技部,由业务部门提技术需求,IT 部门进行实现,它更像是一个「后勤」部门。但这一模式的弊端在于敏捷度不足,不同业务部门的需求难免「撞」到一起,先做哪个后做哪个,难免产生需求排期,业务很难快速迭代。

2017 年初史红哲以技术副总裁的身份加入乐信后,所做的第一件事就是技术平台与业务、业务与业务之间的解耦,将技术团队分为横向的平台团队(即中台),和纵向的业务研发团队。

其中平台团队的关键是进行基础研发,为业务团队提供统一的工具平台,比如应用开放框架、信息安全、云服务、服务器等基础设施。业务团队可以方便的调用 API 接口,敏捷、快速的实现业务构想,在保持迭代速度的同时,形成一个业务闭环。

尤为重要的是,乐信的业务与业务之间有很强的耦合关系,比如从前端的获客,到风控,再到后面的资金匹配等,虽然各个环节的技术研发掌握在业务线手中,但它们共同构成一个大的消费信贷业务。这还需要在技术的平台层面进行顶层的设计与协调,才能在研发效率与质量上做到一个平衡。

作为一家创业公司,在市场早期阶段,业务的高速增长与快速迭代尤为重要,技术落地第一步,首先是业务导向,服务于业务的增长。当业务稳步增长后,技术又要能够驱动业务,让技术内化为全公司的信仰。

最初乐信的业务迭代中也会用到一些机器学习模型,但并不系统。史红哲认为,作为一家金融科技公司,特别是在风控、商品推荐、资金匹配等环节,如果没有一个强有力的 AI 团队做算法的基础研究,仅靠业务线的能力很难做好。

于是 2017 年 10 月,乐信成立 AI 实验室,隶属技术平台下,围绕风控系统、智能推荐、智能匹配、深度学习等方面进行系统的技术研发。

技术团队扩展至今天,已形成五六百人的规模,主要分为三个中台,分别是 AI 中台、数据中台、业务中台。史红哲还透露,近期公司也在将大数据团队和 AI 团队做进一步整合,成立一个大数据智能部,将数据和 AI 的力量进一步集中,驱动业务的发展。

除了前文重点介绍的反欺诈应用外,从前端的用户增长,中端的商品推荐与运营,后端的智能匹配等,乐信已经将 AI 引入业务的全链条,依托大规模 AI 场景实践,推动效率的提升。

这一成果也反应在乐信近期公布的 2019 年第二季度财报中,营收达 25 亿。这是公司自 2017 年底上市以来,连续七个季度营收呈双位数增长。

而在研发上,乐信第二季度投入达 9970 万,比去年增长 27%,这在金融科技企业中,已属较高水平。其中大数据和 AI 就是重点投入板块。

4 下一步,打破「数据孤岛」

乐信的大规模 AI 场景实战仍在继续,下一步史红哲认为,应该打破「数据孤岛」。

在他看来,当下金融科技行业最大的挑战是数据的挑战。当下 AI 的流行,核心仍然是基于数据,拥有优质的、海量的数据,相应的模型的训练效果就会好。

但企业往往只拥有用户的某一类数据,这就好比一个个「数据孤岛」,即使是 BAT 级别的互联网巨头,数据也不健全,画出的也只是用户的部分画像。如何打破数据孤岛,获取更多维度的数据信息,也是学术界前沿的研究领域。

史红哲也提出两种解决办法,一种是类似联邦学习的联合建模方式,企业间在保护用户隐私的基础上,共享加密后的数据参数。另一种是如何在小数据的情况下,进行更精准的机器学习

此外,在算法层面,面向具体应用也存在很大的优化空间。比如复杂网络,它的特点在于数据量大,但数据较为稀疏,即信息量较少,如何用更先进的算法从复杂网络中提取更多元的信息,乐信也会不停的探索下去。

毕竟关于信任,这是一场永无止境的构建过程。

产业机器学习人工智能安全智慧金融反欺诈
1
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

权重技术

线性模型中特征的系数,或深度网络中的边。训练线性模型的目标是确定每个特征的理想权重。如果权重为 0,则相应的特征对模型来说没有任何贡献。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规则引擎技术

与基于规则的专家系统(rule-based expert system)涵义类似,通常是依据设定好的规则作出决策的引擎。在计算机科学中,基于规则的系统被用作存储和操纵知识的一种方式,以有用的方式解释信息, 它们经常用于人工智能应用和研究。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

运筹学技术

运筹学,是一门应用数学学科,利用统计学和数学模型等方法,去寻找复杂问题中的最佳或近似最佳的解答。运筹学经常用于解决现实生活中的复杂问题,特别是改善或优化现有系统的效率。研究运筹学的基础知识包括矩阵论和离散数学,在应用方面多与仓储、物流等领域相关。因此运筹学与应用数学、工业工程专业密切相关。

聚类分析技术

聚类分析(CA)是一种典型的无监督学习方法,这种方法是根据对象的特点将它们分成不同的组。K-均值是应用最广泛的聚类方法,其它方法还包括 k-Medoids、分层聚类和 DBSCAN。期望最大化法(EM)也是聚类分析的一种解决方案。聚类分析在数据挖掘、市场调研、异常值检测等许多领域都有应用。另外,降维技术也是一类类似于聚类分析的无监督学习方法,其典型的代表有主成分分析(PCA)、线性判别分析和 Isomap。

无人机技术

无人机(Uncrewed vehicle、Unmanned vehicle、Drone)或称无人载具是一种无搭载人员的载具。通常使用遥控、导引或自动驾驶来控制。可在科学研究、军事、休闲娱乐用途上使用。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

腾讯机构

腾讯科技股份有限公司(港交所:700)是中国规模最大的互联网公司,1998年11月由马化腾、张志东、陈一丹、许晨晔、曾李青5位创始人共同创立,总部位于深圳南山区腾讯大厦。腾讯由即时通讯软件起家,业务拓展至社交、娱乐、金融、资讯、工具和平台等不同领域。目前,腾讯拥有中国国内使用人数最多的社交软件腾讯QQ和微信,以及中国国内最大的网络游戏社区腾讯游戏。在电子书领域 ,旗下有阅文集团,运营有QQ读书和微信读书。

http://www.tencent.com/
聚类技术

将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。

联邦学习技术

如何在保护数据隐私、满足合法合规要求的前提下继续进行机器学习,这部分研究被称为「联邦学习」(Federated Learning)。

暂无评论
暂无评论~