聚焦产业变革新范式 第四范式发布企业AI转型战略和SageOne软硬一体系统

6月20日,人工智能企业第四范式“标新立异”产品发布会在北京召开,第四范式宣布将聚焦产业变革新范式,成为帮助企业实现智能化转型的重要伙伴,并发布了企业AI转型的“1+N”战略方法和企业级AI 软硬一体集成系统——SageOne,为企业AI转型提供“软硬”一体的全栈能力支撑。

发布会上,第四范式CEO戴文渊、首席架构师胡时伟、首席研究科学家陈雨强分别分享了对企业AI转型的战略思考、产品体系构建和技术研发方向等内容,向现场来自英特尔、百胜中国、工商银行、瑞金医院等产业和行业合作伙伴的重要领导,全面展现了第四范式未来发展目标和产业蓝图。

新范式,企业全面拥抱智能化转型

据Gartner 2019 CIO调查显示,过去四年中企业部署人工智能(AI)的企业数量增长了270%,并在2018年增长了两倍。Gartner预测,到2021年,70%的企业将通过AI来帮助员工提高工作效率。管理者正在考虑如何加速部署AI在企业整体运营和每一核心业务流程中。

基于如此趋势,戴文渊表示越来越多的企业开始进行全面的AI转型,进入到基于数据来制定决策、推出新产品和创造新商业模式的时期,称之为产业变革的新范式。在过去4年,第四范式助力7617个客户的12648个场景,帮助他们进入到新的范式。

在帮助企业转型及应用AI的过程中,第四范式总结出企业AI转型的“1+N”战略方法。“1”是指利用AI达到极致效果,在自己的核心业务上建立绝对优势;“N”是借力科技创新带来的基础设施成本的降低,规模化的落地于更多业务场景,提升整体经营效率。

企业的核心业务通常有1或数个,在实际经营中,核心业务创造的营收占比可达80%甚至更多,因而1%的提升就足以改变企业竞争格局。以互联网应用为例,“千人千面”的个性化服务就是AI化的结果,最终,用户活跃度有多少提升,有多少转化均取决于“千人千面”的程度与效果。而对于以“供应链”为核心的零售及制造业,其竞争力取决于AI能在多大程度上提升供应链效率,降低成本。面对核心业务,AI须做到极致效果,“毕其功于一役。”

N则是指企业在全面AI改造过程中,面对成百上千个分散场景时,如果每个都做到极致,投入产出比低,因而需要规模化、高效的AI落地能力。假设一个企业有一千个场景,其中一个场景提升10倍,对整个企业来说,只有百分之一的提升。而如果能高效地完成一千个场景的全面覆盖,即使每个场景只提升1倍,那也百分之百的提升。面对场景众多的企业,AI的“规模化落地”能力是企业全面智能化转型的关键。

新物种,SageOne软硬一体系统诞生

帮助企业实现核心业务AI应用的极致效果和大规模AI应用场景的快速落地,传统算力暴露了先天缺陷,解决算力问题成为企业AI转型的关键。第四范式联合创始人、首席架构师胡时伟表示:传统算力和AI应用负载之间存在天然的鸿沟,传统算力只是解决在计算、访存、I/O带宽的局部密集问题,而AI应用负载则需要解决全部密集的问题。发展企业级AI专用算力已经成为行业的普遍共识和大势所趋。

第四范式本次发布的企业级 AI 软硬一体集成系统——SageOne,是一个全新的企业级产品物种,摒弃了传统算力堆砌硬件的方式,而采用由软件定义的专用AI系统架构,更好的理解AI 算法的运算架构与逻辑,更深层次软硬件一体化的优化和加速,全面满足企业AI应用的算力需求。

SageOne内置第四范式领先的自研AI训练引擎、AI推理引擎和AI特征存储引擎三大核心引擎, 通过业界领先的“软件定义计算”软硬一体技术构建了闭环企业AI系统,贯通硬件基础设施、AI核心引擎、AI平台和AI业务应用的全价值链条,全面支撑企业AI"1+N "业务场景应用需求。

第四范式高维算法为基础,SageOne搭载第四范自主研发的硬件加速卡——4Paradigm ATX800,内置模型训练和特征工程等多种加速能力,支持自动优化训练参数、高位特征计算过程I/O加速和高维GBDT训练加速等应用,在企业应用场景中表现出高达10倍的训练性能。

SageOne内置第四范式自主研发的高维、分布式网络通讯协议Swift,集成pPRC自研网络通信框架、零拷贝数据交换协议等AI领先通讯技术,结合基于CLX-AP架构的参数服务器集群,展现出业界顶级机器学习性能表现。SageOne在高维特征计算过程I/O最大10X加速,高维稀疏场景模型训练比GPU提速5X以上,自研pRPC通信框架比百度bRPC和谷歌gRPC提速3-10X。

内置行业领先的自研实时特征计算引擎和模型预估引擎,SageOne为企业AI应用提供特征处理过程免开发上线、线下线上一致性保证、一键生成预估服务、异构模型统一服务等AI核心应用服务,结合非易失性存储的无限缓存和超低延迟内存存储等硬件技术,确保企业AI应用时具备海量量时序特征计算和万亿维模型实时推理能力的同时,提供百万级并发实时请求支持和99.9%请求毫秒级响应的高并发业务极速响应服务。

此外,第四范式英特尔联合实验室一直探索最佳优化技术,并针对最新Cascade Lake-AP处理器的全新AVX512指令集、多核心及主频利用率和CLX AP微架构IO总线的利用率进行全面优化。

胡时伟认为,解决企业AI应用算力负载问题,单靠增加硬件是无法完成的。只有通过AI算法对整个AI算力平台系统的重新定义,才能帮助企业支撑AI“1+N”应用场景的需求。

AutoML,产业变革加速器

今天,产业变革才刚刚拉开帷幕,还需要更多创新技术加速发展。第四范式每年投入超50%资源在未来科技研发上,不断探索、验证和投产真正的企业级AI应用技术,持续加速产业变革进程。第四范式联合创始人、首席科学家陈雨强为现场嘉宾和媒体记者详细展示了第四范式在GEN0(投产技术)、GEN1(验证技术)、GEN2(探索技术)的技术布局,勾勒出未来企业级AI技术的发展方向和蓝图。

AI应用规模化的前提是低门槛、自动化的AI技术,其中,关键性技术是AutoML。第四范式在AutoML技术研发和产品落地领域走在世界前列,现场陈雨强首次提出了全新特性的AutoML 2.0技术。AutoML 2.0不仅是世界首个交互式AutoML技术,同时具备自动跨表特征增强能力。在世界知名的Kaggle机器学习竞赛中,第四范式AutoML 2.0与数据科学家共同挑战多项竞赛,竞赛结果数据显示全世界平均每7-10位数据科学竞赛选手,只有1位能击败第四范式AutoML 2.0;而在结构化机器学习问题上第四范式AutoML 2.0比Google Cloud AutoML排名靠前61.2%,在图像分类问题上比它排名靠前64.2%。

基于目前企业AI应用的痛点问题,第四范式未来还将引入隐私保护迁移学习(AutoPTL)、自动半监督机器学习(AutoSSL)、自动正样本和无标签样本学习(AutoPU)、自动知识图谱嵌入(AutoKGE) 等众多Auto“黑科技”到产品体系中,提高企业AI应用率和价值。

新生态,第四范式发布启航计划

以AI For Everyone为企业愿景,第四范式致力于携手客户与行业伙伴,把AI带到每一个行业,普惠人们的生活。发布会上,第四范式宣布开启“启航”合作伙伴计划,着力打造基于“先知”平台的生态体系建设。

“推动各领域的企业AI转型,进入到新范式,仅靠第四范式一家公司的力量是不够的。”第四范式商务副总裁梁军在“启航”计划启动仪式上表示,第四范式面向合作伙伴和开发者的开放,将越来越全面和深入,让越来越多的行业和企业能够低门槛地获取AI能力。基于先知平台,第四范式建立起产品赋能、咨询赋能、交付赋能、营销赋能、技术赋能五大赋能中心,正与广大解决方案商、咨询服务商、实施服务商、渠道分销商及开发者开展生态合作,形成一个强强联合、互补共赢的AI合作伙伴生态,共同启航AI蓝海。

人工智能被认为是引领新一轮科技革命和产业变革的战略性技术,AI转型不仅是企业战略上的需要,更成为企业未来竞争力和创新力的关键。第四范式将继续发挥自身在算法研究、技术研发等方面的优势,融合领先硬件技术,为客户和合作伙伴带来更多的创新技术和产品,为AI在更多企业的落地贡献力量。

- END -

第四范式简介:

第四范式是国际领先的人工智能技术与服务提供商,以“AI For Everyone”为企业愿景。第四范式自主研发的“先知”平台是助力企业实现AI转型的企业级AI PaaS平台,致力于降低AI落地的门槛、提升AI创新的速度。第四范式迁移学习和AutoML领域居于世界领先地位——迁移学习领域的论文引用数排名世界第一;并在全球引领AutoML的研究、竞赛、会议和期刊,率先把AutoML技术落地到产业。

2018年12月,第四范式宣布完成C轮超10亿元融资,成为“中国五大行”联合投资的第一家创企。并于2019年2月入选CB Insights全球AI百强榜及领军独角兽榜单。第四范式在银行业的头部客户占有率已经超过70%;其模式可以快速复制到他行业领域,目前公司已在银行、保险、证券、零售、政务、能源、医疗、安全、媒体等领域成功赋能多个应用场景,助力各行业企业AI创新变革。

产业第四范式
相关数据
英特尔机构

英特尔是计算创新领域的全球领先厂商,致力于拓展科技疆界,让最精彩体验成为可能。英特尔创始于1968年,已拥有近半个世纪产品创新和引领市场的经验。英特尔1971年推出了世界上第一个微处理器,后来又促进了计算机和互联网的革命,改变了整个世界的进程。如今,英特尔正转型成为一家数据公司,制定了清晰的数据战略,凭借云和数据中心、物联网、存储、FPGA以及5G构成的增长良性循环,提供独到价值,驱动日益发展的智能互联世界。英特尔专注于技术创新,同时也积极支持中国的自主创新,与产业伙伴携手推动智能互联的发展。基于明确的数据战略和智能互联全栈实力,英特尔瞄准人工智能、无人驾驶、5G、精准医疗、体育等关键领域,与中国深度合作。面向未来,英特尔致力于做中国高价值合作伙伴,在新科技、新经济、新消费三个方面,着力驱动产业协同创新,为实体经济增值,促进消费升级。

https://www.intel.com/content/www/us/en/company-overview/company-overview.html
相关技术
第四范式机构

第四范式成立于2015年初,是国际领先的人工智能技术与服务提供商,已服务20多个行业完成上千个AI落地案例。目前国内重要的国有银行和全国性股份制银行,超过一半都是第四范式的客户,此外,公司在互联网、医疗、政府、能源、零售、媒体等行业均有涉猎,诸多案例取得百分之一百以上的效果提升。

https://www.4paradigm.com/
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

数据科学技术

数据科学,又称资料科学,是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品。它结合了诸多领域中的理论和技术,包括应用数学、统计、模式识别、机器学习、数据可视化、数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。

超参数技术

在机器学习中,超参数是在学习过程开始之前设置其值的参数。 相反,其他参数的值是通过训练得出的。 不同的模型训练算法需要不同的超参数,一些简单的算法(如普通最小二乘回归)不需要。 给定这些超参数,训练算法从数据中学习参数。相同种类的机器学习模型可能需要不同的超参数来适应不同的数据模式,并且必须对其进行调整以便模型能够最优地解决机器学习问题。 在实际应用中一般需要对超参数进行优化,以找到一个超参数元组(tuple),由这些超参数元组形成一个最优化模型,该模型可以将在给定的独立数据上预定义的损失函数最小化。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

特征工程技术

特征工程是利用数据所在领域的相关知识来构建特征,使得机器学习算法发挥其最佳的过程。它是机器学习中的一个基本应用,实现难度大且代价高。采用自动特征工程方法可以省去采用人工特征工程的需求。Andrew Ng 说“挖掘特征是困难、费时且需要专业知识的事,应用机器学习其实基本上是在做特征工程。”

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

推理引擎技术

推理机是实施问题求解的核心执行机构,常见于专家系统。它是对知识进行解释的程序,根据知识的语义,对按一定策略找到的知识进行解释执行,并把结果记录到动态库的适当空间中去。

图像分类技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
推荐文章
暂无评论
暂无评论~