拍拍贷推出CIKM2019长文:基于复杂网络的反欺诈利器

11月3日-7日,CIKM 2019在中国北京举行,拍拍贷与浙江大学、加州大学洛杉矶分校(UCLA)联合发表的论文“Understanding Default Behavior in Online Lending”被CIKM 2019录用,并作为口头报告(Oral)论文在大会中进行介绍。

CIKM(ACM International Conference on Information and Knowledge Management)是全世界计算机领域影响力最大的专业学术组织ACM旗下年度会议,每年聚集全球学术界和工业界的顶级专家和研究人员,围绕大数据和人工智能的最新进展和研究热点进行深入探讨。据悉,今年会议投稿数目远超上届,最为严格的Research Track长文收录率仅为19%。

首次通过社交网络验证不良中介

欺诈是金融行业面临的严峻挑战。对于借贷业务而言,用户欺诈与违约的表像相似,如何更有效地识别欺诈用户并进行预防是一个很具挑战性的课题,也受到金融机构的广泛关注。传统的反欺诈方式以规则为主,可以较好地将一些具有明确特征的欺诈分子挡在门外。然而,在杀伤力最为巨大的团伙欺诈中,由于团伙成员各有分工,核心的组织人员往往很爱惜自己的羽毛,表现得很有迷惑性,用常规方法很难识别。

拍拍贷与浙江大学杨洋老师团队和加州大学洛杉矶分校孙怡舟老师团队合作完成的论文“Understanding Default Behavior in Online Lending”,不再把用户看作孤立的、遵从独立同分布假设的个体,而是还原了用户之间的社交网络关系,构建由千万节点组成的复杂网络,利用网络结构特性去发现团伙欺诈中的不同角色和关系,进行有效识别和预防。

用户的社交关系跟是否欺诈很难有直接的关联,然而不良中介是团伙欺诈的始作俑者,跟欺诈有直接的关联。论文中创造性地引入不良中介这一特殊社会角色作为桥梁,并基于1100万用户的大规模数据集,揭示了不良中介不同于逾期用户和普通用户的社交网络特点。这也是就目前所知,第一次从社交网络特性角度对不良中介的存在进行验证,并且深入研究这一团伙欺诈关键角色在社交结构上区别于其他用户的特点。

论文还提出了一个全新的半监督学习框架——双任务因子图模型(如下图),对不良中介(y)和违约(z)这两个高度关联的预测目标进行联合建模,引入一个传导因子()来刻画这两个任务相互的影响,从而可以通过跟违约用户的关联情况来帮助更好地识别不良中介,通过跟不良中介的关联情况来更好地预测可能出现的违约。双任务因子图模型 

拍拍贷AI团队技术人员表示,这个框架提供了一个很强大的优势:当大量缺失其中一个预测目标标签数据的时候,可以通过另一个关联的任务对该任务进行增强。由于不良中介的标签往往依赖反欺诈专家进行调查来获取,十分昂贵,而这个框架可以在几乎没有已知不良中介标签的情况下实现对这一隐藏身份的有效识别,并且帮助提升对违约的预测。

据了解,该文工作的有效性在多个实验中得到了验证,并且作为拍拍贷明镜反欺诈系统的重要一环已逐步投入实际业务应用,大大提升了反欺诈的有效性和效率。

创新算法提升复杂网络表示学习质量

此外,由同一团队推出的另一篇论文“A Unified Network Embedding Algorithm for Multi-type Similarity Measures”中的工作也将在CIKM workshop GRLA上进行介绍。

据了解,该论文则是关于复杂网络表示学习,即,将庞大的社交关联网中的一个个节点,描述为向量,并且保持原网络在结构、语义、邻近等方面的性质。这个向量化的表示一般是复杂网络存储和查询、建模等下游应用的起点,表示学习的质量直接影响应用,所以受到广泛关注。

经典方法一般采用网络连通或者结构相似来作为节点相似的度量标准,而对不满足这种相似度量的数据和应用场景则效果不佳。比如逾期用户节点往往具有连通相似的特性,而不良中介往往具有结构相似的特性。

拍拍贷研究人员表示,在这篇文章中,提出了一个统一的算法框架,可以灵活学习不同相似度量的重要程度,从而可以方便使用同一套算法来应对不同的下游应用,对业务工程实践很友好。

作为头部金融科技平台,拍拍贷相关研究人员均来自海内外顶级高校和知名科技企业,并拥有来自加州理工大学、加州大学洛杉矶分校、浙江大学等高校的多名教授作为科学顾问,长期保持积极的合作。本次CIKM介绍的2篇论文也展示了几方良好合作的阶段性成果。

目前,拍拍贷自研技术已实现业务流程的全覆盖,如人脸识别、多场景OCR、声纹识别等多模态核身技术,语音识别、意图识别、语义理解等全流程智能对话机器人技术,基于复杂网络的不良中介识别和团伙识别技术等。未来,拍拍贷还将在智能投放、精准营销、核身、反欺诈和智能客服等金融场景推出更多的应用和研究成果。

产业CIKM2019拍拍贷
相关数据
拍拍贷机构

拍拍贷成立于2007年6月,是一家由工商部门批准,获批“金融信息服务”的经营范围,得到政府认可的互联网金融平台。拍拍贷用先进的理念和创新的技术建立了一个安全、高效、透明的互联网金融平台,规范个人借贷行为,让借入者改善生产生活,让借出者增加投资渠道。拍拍贷相信,随着互联网的发展和中国个人信用体系的健全,先进的理念和创新的技术将给民间借贷带来历史性的变革,拍拍贷将是这场变革的领导者。

http://www.ppdai.com/
孙怡舟人物

加州大学洛杉矶分校计算机科学系助理教授,之前曾担任美国东北大学助理教授,2012年博士毕业于美国伊利诺伊大学香槟分校,师从数据挖掘领域领军人物韩家炜教授。研究方向包括信息与社交网络分析、数据挖掘、数据库系统、统计、信息检索、机器学习等。

相关技术
半监督学习技术

半监督学习属于无监督学习(没有任何标记的训练数据)和监督学习(完全标记的训练数据)之间。许多机器学习研究人员发现,将未标记数据与少量标记数据结合使用可以显着提高学习准确性。对于学习问题的标记数据的获取通常需要熟练的人类代理(例如转录音频片段)或物理实验(例如,确定蛋白质的3D结构或确定在特定位置处是否存在油)。因此与标签处理相关的成本可能使得完全标注的训练集不可行,而获取未标记的数据相对便宜。在这种情况下,半监督学习可能具有很大的实用价值。半监督学习对机器学习也是理论上的兴趣,也是人类学习的典范。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

机器人技术技术

机器人学(Robotics)研究的是「机器人的设计、制造、运作和应用,以及控制它们的计算机系统、传感反馈和信息处理」 [25] 。 机器人可以分成两大类:固定机器人和移动机器人。固定机器人通常被用于工业生产(比如用于装配线)。常见的移动机器人应用有货运机器人、空中机器人和自动载具。机器人需要不同部件和系统的协作才能实现最优的作业。其中在硬件上包含传感器、反应器和控制器;另外还有能够实现感知能力的软件,比如定位、地图测绘和目标识别。之前章节中提及的技术都可以在机器人上得到应用和集成,这也是人工智能领域最早的终极目标之一。

独立同分布技术

在概率论与统计学中,独立同分布(缩写为IID)是指一组随机变量中每个变量的概率分布都相同,且这些随机变量互相独立。一组随机变量独立同分布并不意味着它们的样本空间中每个事件发生概率都相同。例如,投掷非均匀骰子得到的结果序列是独立同分布的,但掷出每个面朝上的概率并不相同。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

推荐文章
暂无评论
暂无评论~