360金融王安滨:日处理百亿数据背后的秘诀

数据中台被誉为大数据的下一站,核心思想是数据共享。不同的公司提出了不同的概念和定义,对360金融而言,围绕用户需求实现数据价值向业务价值的转化是中台的核心使命。

王安滨,360金融首席架构师,数据中台负责人,拥有近20年大数据分析和分布式计算架构经验。2007年底以合伙人身份于美国创建μOrge,在开发分布式渲染技术和实时三维模型构建上有多项专利。2011年加入360集团,先后负责构建360安全大数据体系,分析系统,核心安全分布式消息组件,以及360搜索一级引擎系统。加入360金融后,负责集团数据中台的建设。

360金融首席架构师,数据中台负责人王安滨

2019年是数据中台从概念升级至大规模应用的元年,对科技公司应用数据的技术能力和对数据资产的管理能力提出了考验。作为企业的基础平台,数据中台贯彻了整个数据生命周期。然而究其根本,数据中台不是一门技术,而是一种数据治理的方式,是把原来分散在业务系统中的各种数据进行集中管控,统一分发,从而真正的将组织积累的数据变成流动资产,进而变数据为生产力。

如果要为数据中台贴上标签,毫无疑问是业务导向。数据中台由需求驱动,功能在于为前台业务创造数据产品能力,从而实现数据价值。而这恰恰又是数据中台以终为始,基于前台业务系统或BI分析的数据需求的价值导向。在360金融数据中台首席架构师王安滨看来,数据中台的核心使命是实现数据价值向业务价值的转换、促进社会升级、让公众的生活更便利。

数据中台究竟是什么?如何贯穿不同业务起作用?从数据到社会整体便利程度增强,中间要经历怎样的转化途径,王安滨进行了如下解答。

以“用户为中心”的数字化转型

数据中台被誉为大数据的下一站,核心思想是数据共享。不同的公司提出了不同的概念和定义,对360金融而言,围绕用户需求实现数据价值向业务价值的转化是中台的核心使命。

——数据中台是什么?

王安滨:数据中台是数据平台发展到一定阶段的必然产物,也是企业级数据能力泛化的服务体系,其最现实的价值之一,是为企业各业务线提供快速复制的数据能力。但因为数据中台的最显著标签是业务驱动,而不同行业、不同企业的业务也不尽相同,因此数据中台都是各家企业自身业务与企业发展阶段的产物。数据中台并不是标准化产品,而是一种数据思维的集中体现,内部架构依据不同行业的业务需求有不同的设计。

对于360金融来说,我们将其简单定义成,能够将数据有效组织并将数据作为业务价值进行转化的过程,简言之数据中台是将数据价值转化为业务价值的一个过程。

在这样的定义下,数据价值的作用更好理解。业务价值最直观的表达是业务上的突破或者是增长。具体来说比如广告投放点击率或者转化率的提升,运营能力的提升,用户关系维护的提升,以及用户黏度的提升等。另外还包括基于对整个市场的预测和判断,提供战略和舆情上的支持。这些都是由数据中台,通过数据的组织来进行研究。

——数据中台解决了哪些问题?

王安滨:在我们的定义中,首先数据中台解决了数据到业务价值的整体提升,这是最核心的结果。没有中台的话,无法快速、高效的达到这样的结果。第二,没有数据中台的话数据资产无法完全资产化,数据质量便无法保证。第三,整个智能化资产没法进行有效合理性的复用,包括人员能力、运营能力、策略能力和对产品的理解没法进行复用,所以中台需要解决这个事情。再者,就是降低了用户使用数据的门槛。

同时,数据中台是在数据中间层提供服务的一个环节,其本身也在创造价值,甚至会产生价值完整的一个闭环。但是多数情况下,数据中台是在提供核心服务,核心的数据支持。我们可以把它比喻为弹药,甚至可以说是已经入膛的弹药,随时准备为公司的其他团队提供服务。

——你和你的团队主要做了哪些工作?

王安滨:我们的工作主要有两方面:一是按照不同的业务需求,建立不同的数据仓库或者主题库。二是统一并优化同一口径的计算方式。

从另外一个角度讲,整个大数据隐私的安全需要统一的优化和治理,什么样的数据应该以什么样的形式进行合理的存储、处理、收集和使用,都有统一规划的。目前,我们每天大概会处理4亿左右用户的数据,涉及上百亿规模业务量。我们的目标只有一点,就是公司无论是谁要的数据,一定是从这个团队去拿。我们团队的数据是第一口径,也是唯一的口径,保证数据的统一非常重要。

未来我们工作的方向拓展更偏重于业务上的拓展或者战略上的规划,基于数据驱动,这可能会支撑我们未来新的一些产业研究或者是创新。

经验的传承和维护

对于科技公司来说,瞬息万变是公司的常态,其中既包括来自外界的挑战、技术的演进以及内部的业务变革,如何快速应对外界及自身的快速发展和改变,并做出相应的应对,是科技公司不得不思考的问题。

——在数据特征和业务需求不断变化的背景下,如何保证数据复制的有效性?

王安滨:数据复制的有效性,取决于已知模型与目标需求模型的相似度。从技术角度看难度并不大,更多的是经验的传承和维护,这样经验会变成我们数据化资产的一部分,我们称之为智能资产。这是数据中台今后的工作重点,即如何把经验以数据化的形式传承下去,而不是变成一个冷冰冰的规则。

以营销端的具体应用举例,我们做的并不是针对特定产品的简单构建,而是基于用户的唯独特征复制原来的模型。具体操作来看,首先选取一个在特定产品中表现出明显效果的营销模型,之后通过替换一些标签或者是生成更有效的特征来完善推动这个模型的运转。这样的建模,启动成本非常低,并适用于针对业务进行独立化处理的情况。

——对于数据安全和隐私保护您这边采取了哪些措施?

王安滨:我们在一个私域的空间处理数据。这个私域空间内所有的数据都是经过加密的,而且有着严格的控制,工作人员只能操作数据但是无法读取这些数据。数据输出则会经过另外一个隐私探测程序,经过系统的检测判断没有冲击到核心隐私的一些数据之后,才能通过审批流程允许这些数据导出,上述所有的操作过程,都是在不和数据接触的环境下进行的。

除了有严格的行政程序,也有技术上的约束。比如说我们接触的所有数据都是加密的,系统也会对所有的异常行为进行记录,然后会有行文感知程序来检测是不是有危险操作,也就是说所有的操作行为都处于被监控的状态。

——数据量必须达到一定的级别才能做数据中台吗?

王安滨:不是这样的,数据中台的存在并不是因为数据量够大。中台实际上是数据的集中、是一个有效的融合过程。当然,数据量越大表明服务的用户更多,数据中台的应用价值也更大,但这并不是中台的唯一价值。中台的核心使命是支持企业的创新发展和业务突破,为我们提供了在创新领域快速试错的可能。有了中台以后,很多基础的服务、基础的组建,或者说基础的接口平台能够交互使用之后,企业可以快速的做很多创新尝试。

对科技公司来说,核心价值即不断的创新。数据、创新经验的价值如何快速复制到一个新的业务和应用中是很重要的。如何把这些东西沉淀成公司的数字化资产,是数据中台未来需要考虑的一个很大的课题。

让生活更加便利

科技的使命是促进社会的升级、让公众的生活更加便利,在这个过程中,数据能够发挥无与伦比的优势。

——用户的需求有何变化?

王安滨:我们之前的产品定位是用于家庭周转和消费支出,因此产品的设计,比如额度范围和整体的受众人群是基于这个基础的。但是目前通过大数据分析用户画像分析,我们发现了更多来自小微企业的需求,资金额度需求也更大,所以我们正在不断丰富我们的产品,以帮助私营业主以比较低的利息从正规渠道借到自己经营所需的资金。

——360金融数据中台的应用情况如何?有何案例?

王安滨:中台这个概念是一个跨行业、跨业务的存在,所以它本身需要支持很多不同的业务场景和业务线,而且是深入支持。从产出来看,我们输出的是一个服务性的成果。每个业务都会因定制化需求而衍生复杂性,所以我们需要把全公司的数据梳理成通用的模式。从长远角度来说,公司的运营经验、运营能力和相关模型、数据的最佳实践都会经过整理后以数据的形式去保留,并且可以复用到其他的业务线上,这是中台本身就有的知识复用的一个能力。

另外就是整个数据服务。我们会针对不同的业务,比如说360借条产品,从最开始的市场调研,包括这个产品的利率,产品类型,到之后的市场营销,到底在什么样的场景下进行投放,投放渠道如何,如何投放既定人群,这些都是由中台的数据进行支撑及分析研报的。

再比如360保险产品,我们用数字化方式将过往经验进行整理,之后再通过机器学习做有效扩充,由此,可以代替人工自动进行人群的精准投放。在整个运营体系内,我们把这种方式称为数据化运营,数据化运营解决了人工运营经验上的短板,甚至在一些尚没有足够运营经验的新兴行业,更好的借鉴已经拥有的、已经建立的模式,快速的复制到新的人群,这种复制的成本低,但非常有效。

——如何看待行业发展现状和意义?

王安滨:中国社会信用体系尚不完善,信用制度包括信用卡的发放程度,银行端的支持是不足的。此外,一边是无法快速下沉的传统金融服务,另一边是日趋迫切的小额资金需求,在无抵押贷款领域,金融科技公司的出现是社会发展的必然产物。我们的产品本身针对这样一些人群的临时借贷或者这个群体的小成本生意的启动资金和周转,我们借出去的每一分钱都是救命钱。

从行业的整个发展过程来看,监管在不断完善,行业也将向更加良性和正向的方向发展。在银行无法完全覆盖征信白户的前提下,我们的存在是对整个金融市场的一个很好的补充。另外一点,我们的风控能力在整个行业内处于领先地位,和银行相比我们的优势是非常明显的。所以对整个终端用户来说我们的产品是非常有价值的,今后肯定会有更长足的发展,包括产品的多元化,解决市场上产品的匮乏和使产品更有效的覆盖整个市场,以可持续的满足用户的需求。

360金融技术委员会委员

360金融
360金融

打通金融智能全链路,破局金融科技新十年

理论360数据科技数据中台金融科技
2
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

数据仓库技术

用户画像技术

用户画像(persona)的概念最早由交互设计之父Alan Cooper提出:“Personas are a concrete representation of target users.” 是指真实用户的虚拟代表,是建立在一系列属性数据之上的目标用户模型。

推荐文章
暂无评论
暂无评论~