有了CPU平台才做得了AI转型?英特尔认为既有IT基础一样能行!

亟待人工智能转型的企业,往往首先面临在技术硬件上的选择:

实际应用中,特别是在解决复杂问题时,不少人认为,需要先建立CPU平台,在此硬件基础上来实现路径的融合搭配,这是企业AI技术路径更佳的解决方案。

事实上,鉴于数据在AI应用中的重要性,亟待人工智能转型的企业,其实还有另一种更快捷、低风险、灵活的选择——在既有IT基础设施和数据应用平台之上构建AI。

这种再认识的过程,可以用《星球大战》中的一句经典台词描述:“原力一直与你同在!”

也就是说:适合多数企业开始AI之旅的平台、基石,其实一直就在他们的既有IT架构中。

那么,为什么企业对于这种能让他们使用熟悉且信任的基础设施,无需大量额外投资,还能平滑和低风险地构建AI应用的选择如此缺乏了解呢?

老牌芯片企业英特尔认为,企业这种“灯下黑”式的认知,主要是因为既有IT基础设施此前未能真正释放出它在AI应用上的潜能,毕竟,其算力的核心——CPU平台一直都需要同时满足多种应用的需求,在全新类别的应用出现时,往往需要一段时间来完成与之相关的优化,特别是软件上的优化。

图一,英特尔为AI提供端到端的、全栈式的技术支持,在以至强处理器为核心的硬件平台之上,还有立足于软件的三个层面的支持和优化,它们涵盖了基础层面、库的层面和工具层面。根据AI应用需求来充分利用它们,是释放既有基础设施潜能的关键所在

近日,英特尔完成了面向数据科学家的,针对Caffe、TensorFlow、MXNet、BigDL等主流深度学习框架的优化。这就为为使用库(Library)的开发者们提供了包括英特尔MKL、MKL-DNN,DAAL在内的优化支持,以及为AI应用的开发者们提供了OpenVINO、Saffron AI等工具包。

这一改进,使得企业既有基础设施在承载AI应用时已变得更为游刃有余。

京东图像检测提效3.83倍

京东在基于至强的集群上将图像检测和提取方案升级为英特尔开源的BigDL,其性能相比原有的基于专有架构的解决方案提升达3.83 倍。由于BigDL允许以Scala或Python编写深度学习应用程序,也为开发、运维人员带来了极大便利。

图二、了解一下:至强平台与BigDL“合体“后的优势。

UCloud人脸表情识别测试

UCloud基于至强平台构建的AI在线服务在搭配面向英特尔架构优化的Caffe 框架后,同时运行的线程数量显著增加,整体执行性能提高了10倍以上。它在人脸表情识别的测试中,在并发数为8-16节点时,性能可与专用架构的平台相媲美。

GE医疗集团的CT影像案例

GE医疗集团在使用至强处理器的四个或四个以下的专用内核对CT影像进行分类测试时发现,使用由英特尔深度学习开发工具包和MKL-DNN生成的优化代码,相比在同样系统上运行的基准TensorFlow模型,在推理吞吐量上平均提高了14倍。

图三,英特尔至强处理器E5-2650 v4在四个内容上的推理性能超过GE目标接近6倍

爱尔眼科智能阅片

国内爱尔眼科针对特定眼底病变的智能阅片平台在导入面向英特尔优化的Caffe框架和MKL-DNN 2017的优化后,不但将病变辨识准确率提高到了93%,处理速度也加快达70倍以上。

中国银联人工神经网络风控系统

中国银联电子商务与电子支付国家工程实验室基于至强平台、Cloudera CDH、Apache Spark和BigDL构建的人工神经网络风控系统,与基于规则的风控系统相比,能提供高达20%的正确度,并具备60%的涵盖率,从而在短短数月内就达到了最佳训练模式。由该实验室主导开发的GBDT→GRU→RF三明治结构欺诈侦测模型,在至强平台以及BigDL、面向英特尔架构优化的TensorFlow、英特尔MKL-DNN和DAAL等框架和工具的支持下,效率也得以大幅提升。

图四,GBDT→GRU→RF三明治结构欺诈侦测模型在信用卡伪卡侦测场景中的实测结果,其有效F1值(一种准确率和召回率的加权平均值,用于衡量侦测模型性能)超过0.4,远超其他方法或模型的性能

英特尔认为,企业既有IT基础设施在AI应用上的潜能还远未被开发出来。

只需对它稍做升级,如换用性能更强的至强处理器,并导入英特尔在框架、工具和库等软件层面的最新优化,即可充分释放这种潜能,而且此前谈到的至强平台在AI应用上的兼容性、灵活性、便捷和低风险等优势,也可照单全收。

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

产业CPU英特尔
相关数据
MXNet技术
MXNet

MXNet是开源的,用来训练部署深层神经网络的深度学习框架。它是可扩展的,允许快速模型训练,并灵活支持多种语言(C ++,Python,Julia,Matlab,JavaScript, Go,R,Scala,Perl,Wolfram语言)

深度学习技术
Deep learning

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

张量技术
Tensor

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

TensorFlow技术
TensorFlow

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

准确率技术
Accuracy

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

推荐文章