产业资讯方案大厅机构大厅

瑞莱智慧

非监督学习
https://www.realai.ai

机构介绍

RealAI是孵化自清华大学人工智能研究院的产学研技术公司,由清华大学人工智能研究院院长张钹院士、清华大学朱军教授担任首席科学家。RealAI致力于研究和推广安全、可靠、可信的第三代人工智能,不断突破AI发展的边界。 在探索“真正”的人工智能同时,RealAI聚焦传统AI难以解决的新应用领域,依托贝叶斯深度学习等核心技术,赋能工业、金融等垂直行业。目前,RealAI与国内多家大型工业制造企业、金融机构开展合作,提供工业智能诊断分析、金融资产智能提升和人工智能系统安全防护等服务,助力企业智能化升级。

一、机构定位与发展历史

RealAI是孵化自清华大学人工智能研究院的产学研技术公司,于2018年7月正式成立。清华大学人工智能研究院于2018年6月揭牌成立清华大学校级单位,清华大学计算机系教授、中国科学院院士张钹出任首任院长,清华大学交叉信息研究院院长、图灵奖获得者姚期智担纲学术委员会主任


人工智能技术发展至今,大致可分为两代第一代知识驱动的AI与第二代数据驱动的AI。但是以深度神经网络为代表的第二代AI存在不可靠、不安全、不可信等缺点,在数据知识缺乏、非完全信息、不确定性等情况下存在局限,导致当前的AI技术在自动驾驶、工业检测及AI医疗诊断等实际应用场景下面临巨大的困难。


为了满足未来人工智能发展的需要,清华大学提出“后深度学习时代”的概念,并由张钹院士首先提出发展「第三代人工智能」,即安全、可靠、可信的人工智能技术。作为清华大学人工智能研究院核心孵化企业,RealAI致力于第三代人工智能技术研究与应用拓展,构建基于贝叶斯深度学习的人工智能算法平台,探索第三代人工智能技术的产业落地方向,克服已有人工智能技术在实际应用中的关键难题,通过安全、可靠、可信的AI技术赋能各行各业。


二、创始团队与核心管理成员背景

RealAI由清华大学人工智能研究院院长张钹院士、清华大学人工智能研究院基础理论研究中心主任朱军教授担任首席科学家,由清华大学专业博士田天担任首席执行官核心管理团队来自包括百度、腾讯等知名互联网企业的中高层管理者,以及工业巨头、传统金融科技企业的业务专家。


张钹院士

首席科学家

中国人工智能领域首批研究者、CFF终身成就奖获得者、中国科学院院士、清华大学人工智能研究院院长,曾获ICL欧洲人工智能奖、国家自然科学三等奖、国家科技进步三等奖等奖项

朱军教授

首席科学家

清华大学计算机系长聘教授、清华大学人工智能研究院基础理论研究中心主任兼院长助理、MIT TR35先锋者、IEEE AI 10 to Watch学者、入选国家“万人计划”青年拔尖人才

田天博士

首席执行官

清华大学人工智能博士,机器学习、知识聚合领域专家,获评西贝尔学者、清华大学特等奖学金,入选AI青年科学家联盟“青年AI科学家”


三、团队规模与机构人数

RealAI一群对未来AI充满热情的算法科学家、工程师和业务专家组成,包括来自清华大学、北京大学、中科院的人工智能专家,以及金融、工业等不同领域的业务专家。RealAI团队多年来一直从事贝叶斯深度学习、可解释学习、AI对抗攻防等新技术的研究与探索,拥有世界顶级AI技术研发和应用落地的能力。目前RealAI团队总人数超过50人,约20%为博士,研究生占比约50%,技术团队中超过50%的成员毕业于清华大学、北京大学和中科院等一流学府。


四、主营业务与商业模式、盈利模式

商业模式:依托贝叶斯深度学习等核心技术,RealAI致力于打造第三代人工智能平台,为企业提供针对不同场景开发AI应用的能力。同时,深入工业、金融等垂直领域业务需求,打造行业属性的企业级AI通用平台与AI应用解决方案,为企业提供全套智能化升级方案。输出技术能力的同时,RealAI整合清华大学人工智能研究院在AI领域的科研、教育、实践资源,打造系列AI课程与培训体系,传播第三代人工智能技术与理念。


盈利模式(不可对外宣传):目前RealAI的盈利模式分为两类,一类是平台产品,比如金融业务下的RealBox可解释建模平台,可供企业直接采购;另外就是开发服务,比如零售贷款风控回捞方案能够直接给商业银行带来价值,所以会采用分润的形式,既可以会给银行带来价值提升,额外的利润,我们也可以获得相应的比例。


五、核心产品与技术优势

(1)工业领域在工业领域,依托第三代人工智能技术,RealAI致力于打造自主智能制造决策系统。在制造环节,通过智能检测技术提升质检稳定性、降低成本;在运行环节,通过对设备检测信号的分析,利用算法找出潜在异常,从而实现对设备健康状况的评估和预测,提高使用寿命,找到引发故障的原因;并通过AI算法自动控制提高整体运行效率。主要产品包括:

l石油管道缺陷检测在与某大型石油天然气公司合作开展的石油管道缺陷检测项目中,通过采集运行信号,进行无监督学习分析,自动发现管道上的各类已知缺陷以及未知新型缺陷。

l大坝安全智能评估平台在与某水利电建公司合作的大坝安全智能评估项目中,基于部分常规传感器信号,对非常规信号进行补全与生成,进而对大坝安全进行整体评估,保证安全的前提下,提高水利设施经济效益。

l光伏组件EL智能缺陷检测传统光伏组件EL缺陷检测采用人工判断,存在误判漏判、耗时长等局限。采用RealAI自研算法可降低漏检率、减少组件识别耗时、分辨像素点级别的缺陷,极大提升检测效率、准确率。


(2)金融领域在金融领域,RealAI应用贝叶斯深度学习实现小样本、无监督、半监督建模,有效解决金融领域中面临的无标签、少标签、冷启动等业务困境;通过对不确定性建模,对脏假数据与数据缺失等有更高容忍度,并从概率角度刻画真实数据,模型表现大幅超越传统机器学习方法;能够将模型由“黑盒”转成“白盒”,输出模型层面与实例层面的解释,为业务人员提供充分的决策支持,确保算法安全性主要产品包括:

lRealBox:端到端自动建模平台

RealBox是一套自动化机器学习AI应用平台,提供智慧建模和模型部署。通过“一键建模”覆盖贝叶斯概率学习从模型训练到应用的全流程,快速响应业务需求,无需数据清洗与向量工程,流水类数据导入即模型,解决建模流程慢、模型评估困难、迭代成本高等问题。

l风控回捞方案

目前在信用风险评估领域,基于线上获客的贷款产品,由于客群构成复杂,信用记录缺乏等原因,信用评估的通过率非常低。而未通过贷款审核的用户,由于不知道其潜在可能的还款表现,因而难以被放入传统模型训练。因此,传统机器学习数据建模过程中基于全监督技术用到的样本为通过审核的用户数据,但这部分为筛选过的有偏群体,其训练样本相对全部申请的人群十分有限且有偏。

针对该现象,RealAI推出风控回捞方案,采用生成式模型等技术,可以对全体贷款申请群体进行建模,摆脱了目前技术对于数据标签的依赖,风险识别更加精准。通过RealAI的独有算法可以做到从被拒绝贷款的“坏”客户中“回捞”出一部分用户,并且保证回捞出的用户放款后的整体风险水平与原本就通过审核的用户风险水平一致,具有相同的不良率表现。


(3)安全领域随着AI技术应用越来越广泛,潜在的安全风险也越来越多,AI安全面临着严峻的挑战。RealAI可以检测AI算法的漏洞并加以修复,保障AI技术的成功应用。此外,基于领先的AI对抗攻防技术,RealAI与清华大学人工智能研究院联合开发除出人工智能安全平台—RealSafe。RealSafe在对抗攻击和防御算法方面具有领先优势可以对多种AI算法进行漏洞检测和漏洞修复

l漏洞检测:支持白盒攻击和黑盒攻击,具体包括自定义目标函数、寻优方法、针对特定防御模型的攻击;

l漏洞修复:支持对抗训练、数据去躁、攻击意图检测等防御技术。

RealSafe 平台提供前沿的AI攻防演练模拟器,通过攻击算法和防御算法不断对抗来提升漏洞检测和漏洞修复的能力。RealSafe 平台具备一定的可解释性,能够进行决策追溯,并输出AI算法的安全性评测报告。与Google、IBM旗下的安全平台相较,RealSafe平台功能更加全面,支持更为通用的模型、更丰富的对抗攻击和防御算法,具有领先优势。


(4)技术优势:RealAI将贝叶斯方法引入传统的深度学习,充分发挥贝叶斯方法在描述问题复杂特性和环境不确定性方面的优势,能够将数据和预测结果中天然存在的不确性纳入考虑,提升模型的泛化能力解决传统深度学习普遍存在的数据要求苛刻、无法适应高度不确定性环境等问题。针对深度学习模型在对抗环境中容易受到“对抗样本”干扰这一安全漏洞,RealAI从全新的角度出发设计防御策略,通过对“对抗样本”进行识别并拒绝做出有效预测,使得模型返回更加可靠的预测信息,鲁棒性得到提升。相较于以深度学习为代表的AI技术,RealAI第三代人工智能算法平台更适用、可解释、更安全。

l更适用:重点关注无监督、半监督学习、小样本机器学习、自动机器学习等场景,提高算法在未知场景适应能力

l更可解释性对复杂深度模型提供人类友好的解释方法,并对单样本提供模型预测依据,使系统更可依赖

l更安全:检测AI算法安全漏洞,提供AI防火墙,使人工智能系统安全运行


六、外部合作、联合研发情况(不可对外宣传)

(1)工业领域:

lEL缺陷智能识别系统(与鉴衡研究院联合开发):传统的智能识别系统尤其是采用专家系统会面临以下问题:无法对形态多样的缺陷有效识别;缺陷种类多,每种缺陷形状随机,如隐裂(线状,交叉、树状);多晶的晶界花纹对判别有较大干扰;判定准则根据客户需求变化。而RealAI与鉴衡研究院联合开发的“瑞鉴能源大脑”利用深度学习算法,从更高维度对特征进行学习,具有更好的效果:具有小数据训练优势,算法迭代速度快;预测精度高,漏检率实现1%;模型的识别尺度与人眼所能识别的极限尺度基本一致;定制化可接受质量水平;算法兼容性强,单多晶组件均适用;能够进行实时在线检测和远程离线检测。目前该平台已经完成了产品开发阶段,并在中欧头部组件生产企业成功应用(晶科、天合、协鑫部分产线试用)EL缺陷检测的自动化效果显著。


l基于AI的大坝安全智慧评估平台(与中国电建联合开发)RealAI与中国电建联合开发的大坝安全智慧评估平台主要分为参数补全与安全评估,参数补全:水坝建造年份不同,传感器类型不同,许多老旧水坝没有传感器,也无法补充安装,传感器信号是对水坝安全进行评估的基础,尝试采用人工智能算法,基于部分传感器信号,补全其它传感器信号。安全评估:通过参数补全,使得所有水坝都具有相同类型的参数,基于共有的传感器参数,结合领域知识,构建安全评估指标体系,采用人工智能与专家系统相结合的技术路线。目前该平台已完成了模型算法开发阶段,并基于已有数据完成模型效果验证。值得一提的是,该合作项目荣获“2018中央企业熠星创新创意大赛”二等奖


(2)金融领域:

l风控回捞方案(与中原银行合作):行方某线上信贷产品通过率只有10%,迫切需要提高通过率,扩大放款规模。RealAI通过策略全面诊断,无用剔除,有用添加,在无需替代原模型的基础上构建拒绝回捞模型,挑选优质客户进行回捞。最终,该信贷产品原通过客群为5万,经过RealAI风控回捞解决方案,从拒绝样本中,回捞出2.5万的优质客户,使通过率提升至15%。


l一键端到端建模:某银行信用卡部提供了70万余条信用贷款数据,包含上百维特征。但随着卡部逾期率上升,急需进行风控模型迭代与部署。RealAI基于RealBox平台提供迅捷建模:在建模过程中,无需数据清洗与预处理,无需向量工程,直接导入数据一键建模并生成API部署接口,传统建模流程所需的1个月优化至5天。从效果上来看,RealBox建模效果的AUC为85, KS为55,远高于卡部传统建模的AUC 75, KS 35


l授信额度预测与某银行风控部门合作,根据18万条历史信用数据,进行授信额度的预测。在这个任务中,除了需要实现尽可能高的预测准确率,还需要对模型的输出结果进行准确的解释。RealBox的可解释定额模型相较于简单但解释性较强的决策树、逻辑斯蒂回归等模型,预测效果提升 10%+相较于最先进的深度模型,预测效果相当。但为白盒输出,具备可解释性基于原始数据进行建模,未做特征衍生,预测效果超过 GBDT+ 特征工程的方法一个百分点。最终可以输出模型级与个例级的解释依据,更好的辅助业务决策。


七、代表客户及简要介绍

(1)鉴衡研究院:北京鉴衡认证中心(简称CGC)是经国家认证认可监督管理委员会批准,由中国计量科学研究院组建,于2003年4月成立的从事产品认证和相关科研工作的第三方中介服务机构。具有独立法律地位,并于2004年4月通过了中国认证机构认可委员会(CNAB)的认可审查依托中国计量科学研究院在质量认证、检测及校准技术等领域的强大实力,依据国家认证工作的法律、法规和有关认可规范,站在公正的立场,以科学的手段,严谨的态度,开展包括燃气具、风能、太阳能在内的能源领域产品认证以及相关科技研发、标准培训工作。鉴衡认证中心通过认证工作推动所认证行业的规范发展和技术进步,成为促进我国能源产业的长期、稳定发展的一支重要力量。


(2)中国电建:中国电力建设集团有限公司(简称“中国电建”),是经国务院批准,由国务院国有资产监督管理委员会履行出资人职责,按照《中华人民共和国公司法》登记注册的国有独资公司。中国电建由中国水利水电建设集团公司中国水电工程顾问集团公司以及国家电网公司中国南方电网有限责任公司14个省(区域)电网企业所属的勘测设计企业、电力施工企业、装备修造企业改革重组而成。也是我国唯一提供水利电力工程及基础设施规划、勘测设计、咨询监理、建设管理、投资运营为一体的综合性建设集团。


(3)中原银行:中原银行是河南省唯一的省级法人银行,按照河南省委、省政府提出的“将中原银行办成一流商业银行”的发展目标,基于“贴近市民、服务小微、支持三农,推进区域经济发展”的市场定位,积极践行“传统业务做特色、创新业务找突破、未来银行求领先”三大发展战略和“上网下乡”布局,坚持改革创新发展,全力支持地方经济建设、服务社会民生,取得了良好的经营业绩和发展成果。截至2017年底,中原银行连续三年获评《金融时报》“年度十佳城市商业银行”,并荣获“最佳服务地方经济奖”、“最佳服务实体经济银行奖”、“最具贡献金融豫军”、“最具投资潜力上市公司”、“年度卓越城商行”等称号。


六、未来发展规划及方向

与目前主流的专注于应用层的AI科技企业不同,RealAI追求人工智能理论和模型研究若干重要范式的转变。未来,RealAI将聚焦AI基础技术的自主研发,此外也将持续深耕产业落地,寻求以新技术、新动能助推行业发展新格局,旨在掌握核心技术让世界更美好。

产品及解决方案

风控回捞解决方案

金融

在信贷场景下,优质资产流量愈加稀缺,获客成本越来越高,为扩大资产规模,提高利润,如何从拒绝客群中充分挖掘优质资产成为当下信贷业务的普遍需求。但传统机器学习数据建模过程中基于全监督技术用到的样本为通过审核的用户数据(筛选过的有偏群体),其训练样本相对全部申请的人群十分有限且有偏,这对金融机构而言意味着一定程度的资产流失。RealAI通过半监督学习、迁移学习、稳定学习等优势算法最大程度上进行模型纠偏,解决传统模型“数据有偏”难题,挖掘拒绝客群中的优质资产进行放贷,帮助金融机构在保证风险不变的情况下扩大资产规模。

端到端建模平台

金融

RealBox是一套自动化机器学习AI应用平台,集成RealAI自研算法及逻辑回归算法。提供智慧建模和模型部署,通过“一键建模”覆盖模型训练到模型应用的全过程,包含高阶无监督学习模块,贝叶斯半监督学习模块,可理解监督学习模块和知识图谱建模模块。用户可以简单、便捷的“用自己的数据训练自己的模型”,快速应用到业务场景,看到概率机器学习的效果提升。解决建模服务普遍存在前期投入成本高,建模流程慢,模型评估困难,迭代成本高等问题。

光伏组件缺陷智能检测

能源

光伏组件生产环节中,对于组件的检测依然依赖人工目检。瑞莱智慧光伏组件智能检测产品,可以对通过EL和普通拍照方式获得的组件图片进行检测,自动识别出表面缺陷、电池片/串排列问题、外观缺陷,从而指导返修操作。相比人工目检,准确率更高,判断速度更快,稳定性也更强。 2019年,中国光伏组件产能达到了177.87GW,并在2020年预测有两位数的增长。随着光伏产能扩张、对光伏组件质量要求的提高、工艺的逐渐复杂和成熟,以及人工检测成本的逐年增长,光伏组件智能检测产品拥有巨大的发展前景。

新冠肺炎疫情AI话题分析平台

公共服务健康医疗

新冠肺炎疫情AI话题分析平台由RealAI联合清华大学人工智能研究院共同研发并推出,该平台基于基于清华大学人工智能研究院、计算机系推出的WarpLDA主题提取算法,对多渠道海量媒体信息进行自动抓取采集、主题提取、识别分析,解决了传统信息检索过程中因消息源头繁杂、消息过多、检索意图不明确而产生的困扰。同时,基于大数据分析和AI建模,自动识别出近期热点话题、新闻追踪和话题导向、地区关注度变化,为用户第一时间推送全网话题最新动态,满足用户对疫情舆情监测的需求,为作出正确舆论引导提供分析依据。