京东数科智能反欺诈技术新突破,超20篇AI论文入选国际顶会

“兵来将挡,水来土掩”。随着科技发展,利用智能反欺诈技术对黑产党进行有效防范,做到防患于未然已非难事。京东数科基于机器学习、大数据、实时计算、图计算等技术,打造了完整的智能反欺诈平台,一站式解决营销拉新、广告投放、账户安全、支付安全、资产安全等场景欺诈问题。平台覆盖600多个业务场景,采用高可用性AI集群保证业务正常运转,目前每日超过1000亿次复杂计算,计算速度达到毫秒级,更是经历了数次618、双11的大促考验,为广大用户安全提供了坚强的后盾保障。

与此同时,京东数科智能反欺诈平台利用积累的经验、系统及人工智能模型能力,对外提供反欺诈综合解决方案,科技赋能数十家银行和金融机构,提升金融业的反欺诈管理能力。

图1 京东数科智能反欺诈平台那么,京东数科打造的智能反欺诈平台,是如何守护用户安全的呢?据了解,在京东数科打造的这套机器智能学习的反欺诈体系中,以AI为引擎的自动对抗机器学习平台担当起了与黑产自动搏斗的重要角色。反欺诈对抗的难点在于黑产也在利用高科技技术在不断突破反欺诈策略,攻击方式变换多端,快速调整攻击模式绕过线上拦截,这就意味着防止黑产自动攻击的模型策略也需要快速更新。自动对抗机器学习平台采用小样本学习图神经网络等算法,实时捕捉欺诈动态信息,可达到特征自动衍生、模型自动选取、策略自动推荐和欺诈自动对抗。自动对抗改变了原来的被动防御欺诈的模式,将被动防御转变为了主动出击。

例如,图神经网络技术可以对黑产建立超大规模用户、设备关系的复杂图网络,但是会面临如何从多种类型节点和节点间关系中学习到有效特征表示是一技术难题。京东数科创新性地提出了一种无监督异构图神经网络嵌入模型,利用图节点表示学习算法得到既可以保留节点属性又能保留图结构的节点特征表示。在此基础上,发现高度关联的群体,通过采用异常检测技术识别出欺诈团伙。基于图数据和创新算法的反欺诈系统在实际业务中针对5亿点、10亿边,算法可分钟级返回,对欺诈团伙识别精度达到99%以上。

图2 京东数科自研无监督异构图神经网络算法HDGI

当前,很多算法都依赖于大量的训练数据才能较好地学习到知识图谱中各类节点间的关系。黑产刻意篡改设备、IP等信息所导致的关联稀疏的问题、训练数据缺失的情况普遍存在。为了解决该问题,京东数科提出了一种基于小样本的知识图谱关系学习架构来预测在知识图谱中各类实体节点间的连接关系。通过自动对抗机器学习大幅度提高了反欺诈模型的开发效率,由原来的天级别缩短到分钟级别,为用户带来无人值守的实时安全守护。

图3 京东数科自研基于小样本学习知识图谱补全算法作为智能反欺诈平台中的重要环节,智能安全平台也搭载着众多AI技术。以人脸识别为例,京东数科自研自研多模态人脸活体检测算法近期已正式通过国家金融IC卡安全检测中心-银行卡检测中心(BCTC)的技术认证,达到国家认证的金融支付级安全标准。该算法有效拦截多种人脸识别攻击手段,切实保障用户账户安全。

智能反欺诈平台的建设,离不开京东数科在科技创新和技术研发方面的不断投入。近一年来,京东数科超过20篇AI研究论文在NeurIPS、ICML、WWW、KDD、AISTATS、AAAI、IJCAI,SDM、ICDM等知名国际顶级会议上发表,其中多项创新算法应用于反欺诈,开启了AI驱动的智能反欺诈新篇章。例如,基于成对比较样本标注的鲁棒条件生成对抗网络RCGAN、针对鲁棒支持向量机的快速数据筛选算法等技术研究论文入选AAAI 2020,该技术为欺诈情况下模型快速迭代提供了有力保障。

AI技术的不断突破,助力反欺诈实现了从经验方式到机器自学习的全面进化。作为数字科技公司,AI已经在京东数科的基因中深深扎根。智能反欺诈平台将以协同方式与合作伙伴一起保障用户安全,为科技生活提供多元化、更加安全的保障服务。

产业AI京东数科
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

异常检测技术

在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈、结构缺陷、医疗问题、文本错误等类型的问题。 异常也被称为离群值、新奇、噪声、偏差和例外。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

支持向量机技术

在机器学习中,支持向量机是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

对抗机器学习技术

对抗机器学习是一个机器学习与计算机安全的交叉领域。对抗机器学习旨在给恶意环境下的机器学习技术提供安全保障。由于机器学习技术一般研究的是同一个或较为稳定的数据分布,当部署到现实中的时候,由于恶意用户的存在,这种假设并不一定成立。比如研究人员发现,一些精心设计的对抗样本(adversarial example)可以使机器学习模型失败输出正确的结果。

图神经网络技术

图网络即可以在社交网络或其它基于图形数据上运行的一般深度学习架构,它是一种基于图结构的广义神经网络。图网络一般是将底层图形作为计算图,并通过在整张图上传递、转换和聚合节点特征信息,从而学习神经网络基元以生成单节点嵌入向量。生成的节点嵌入向量可作为任何可微预测层的输入,并用于节点分类或预测节点之间的连接,完整的模型可以通过端到端的方式训练。

图网技术

ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。

京东机构

京东(股票代码:JD),中国自营式电商企业,创始人刘强东担任京东集团董事局主席兼首席执行官。旗下设有京东商城、京东金融、拍拍网、京东智能、O2O及海外事业部等。2013年正式获得虚拟运营商牌照。2014年5月在美国纳斯达克证券交易所正式挂牌上市。 2016年6月与沃尔玛达成深度战略合作,1号店并入京东。

京东数科机构

京东数字科技集团是一家为数字化服务而生的科技公司, 前身为京东金融, 创立于京东集团内部,2013年10月开始独立运营,2018年11月实现品牌升级。 京东数字科技集团以数据技术、人工智能、物联网、区块链等时代前沿技术为基础,建立并发展起核心的数字化风险管理能力、用户运营能力、产业理解能力和B2B2C模式的企业服务能力。公司经营的宗旨是从数据中来,到实体中去,通过数字科技来服务金融与实体产业,助力相关产业实现互联网化、数字化和智能化,通过降低成本、提高效率、提升用户体验和模式升级,最终实现新的增长,并在这个过程中创造公平与普惠的社会价值。 截至目前,公司完成了在智能城市、数字农牧、金融科技、资管科技、数字营销、数字乡村、智能机器人等领域的布局,服务客户纵贯个人端、企业端、政府端。截至2019年6月,公司已累计服务涵盖4 亿个人用户、800万线上线下小微企业、700多家各类金融机构、17, 000家创业创新公司、30余座城市的政府及其他公共服务机构。 2018年,公司完成B轮融资,估值超过 1, 300亿人民币。

https://www.jddglobal.com/?from=jrad_2264897&loc=2
图网络技术

2018年6月,由 DeepMind、谷歌大脑、MIT 和爱丁堡大学等公司和机构的 27 位科学家共同提交了论文《Relational inductive biases, deep learning, and graph networks》,该研究提出了一个基于关系归纳偏置的 AI 概念:图网络(Graph Networks)。研究人员称,该方法推广并扩展了各种神经网络方法,并为操作结构化知识和生成结构化行为提供了新的思路。

小样本学习技术

人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是 Few-shot Learning 要解决的问题。

知识图谱补全技术

知识图谱补全(Knowledge Graph Completion)的目的是预测出知识图谱中事实三元组 (主体, 关系, 客体)缺失的部分,从而使知识图谱变得更加完整。

推荐文章
暂无评论
暂无评论~