Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

徐丹作者

华为首发全生命周期知识计算解决方案,让钢企一年省2000万,合金成分预测精准度超 95%

AI 如何才能参与到企业生产系统,发挥更大价值?华为全联接 2020 给出了答案。

「AI 只有进入企业核心生产系统才能真正创造价值。」

去年开始,AI 行业投资就有遇冷的趋势,越来越多的观点认为,并不是「AI 凉了」,而是「AI 行业」其实是一个伪概念,AI 未来的发展趋势一定是「行业 + AI」,只有进入行业中推动行业变革,AI 才能发挥自身价值。

根据预测,到 2025 年,全球 AI 空间市场将达到 3800 亿美金,其中 90% 将来自于企业市场。

趋势大家都能看到,但问题就在于 AI 要如何与行业融合。

目前国内对 AI 的研究大多集中在芯片、算法等底层技术或者自动驾驶等顶层应用上。这样的行业 + AI 其实是非常浅层的,拨开不明觉厉的技术外表,在落地场景上可能只是人脸识别、语音 / 视频识别、智能推荐、人机对话等。

对钢铁、医疗、汽车等复杂行业而言,简单应用 AI 技术只能解决一些边缘的微痛点。真正赋能企业就必须融合行业知识,进入生产系统解决更关键的问题。

这对人工智能也提出了更高的要求。中国科学院院士张钹在今年的世界人工智能大会上提到,深度学习面临着许多瓶颈,我们即将要进入「第三代人工智能」时代。

第二代人工智能主要以神经网络深度学习为基础,但它是一种通用工具,不需要领域知识,使用的技术门槛较低,并且在理解环境、AI 安全和推理决策方面会出现不安全、不可靠、不可解释的情况。

正在到来的第三代人工智能目标就是完全解决计算机的智能性,让计算机拥有大规模、高质量的形式化知识。

但在知识应用阶段,国内市场仍然还是起步阶段。

张钹院士指出,在人工智能顶级国际会议 IJCAI 上,关于深度学习的论文只占全部论文的 1/3,其中 60% 的论文来自中国;而另外 2/ 3 的关于知识表示、知识推理等的论文中,则几乎没有来自中国的论文。业界致力于知识计算的公司也是寥寥无几。

华为云提前迈出了关键一步,2018 年就提出了行业 AI 的落地理念,致力于企业知识图谱和知识计算平台的构建。

9 月 24 日第五届 HUAWEI CONNECT,华为云发布了基于 AI 开发平台 ModeArts 打造的全生命周期知识计算解决方案,赋能企业打造企业级知识计算平台,推动了 AI 进入企业核心业务系统。


一、「行业 + AI」之痛:AI 如何学习行业知识?

华为认为,很多传统企业在知识利用方面都存在一定的问题。

大多数企业的核心的经验方法分布零散,会存在于历史性的总结文档,甚至是熟练员工和专家的脑袋中。这会让企业发展受限于核心员工水平,知识也很难传承。分散的数据很难融会贯通或参与计算,相当于「行业死数据」。

另外原有行业知识应用也存在一定的瓶颈。一些企业生产需要机理模型,即根据对象、生产过程的内部机制或者物质流的传递机理建立起来的精确数学模型。但对于很多对象和过程人们很难写出其数学表达式,导致机理模型无法考虑到现实中的所有场景,实际应用需要简化。

简化后的机理模型对现实流程控制或质量控制都无法达到最佳状态,这也是为何一些行业生产的控制精度达到一定水平后就很难再提升,即便只上涨一个百分点也都要投入大量的人力、物力。

知识图谱是行业知识应用的主要技术方案,其本质是一种语义网络,因为表达能力强,能同时兼顾人类认知与机器自动处理,在业界产生了广泛关注。

不过当前业界提供的知识化解决方案大多还是靠人工构建知识图谱和知识模型,这会涉及到很多问题,比如人力成本高、领域迁移困难、不能动态更新等。如何把行业中大量的非结构化数据进行结构化、知识化是业界普遍存在的困难。

但全面调动行业知识仅靠知识图谱并不够,还要面临着数据整理、数据存储等多方面的问题。

结构化后的数据普遍量级非常大,如何高效存储和查询是亟需解决的问题。业界普遍采用第三方或开源图数据库完成知识图谱的存储和查询,这其中也会存在一些难题,如无法完成端到端优化,存取查询效率低,资源开销大等等。

此外,企业数据普遍是动态变化的,实践过程中会不断产生新的知识和经验,如何将这些新的知识自动结构化、知识化,沉淀到平台中,完成知识的增量持续更新也是难点之一。

针对这些痛点,华为云知识计算解决方案可为客户提供一站式全流程全周期的知识计算服务,提供从知识获取到知识自动化流水线建模、管理及应用等能力。

二、从获取到应用,AI 打通「行业知识应用」经脉

具体而言,华为云知识计算解决方案结合了自然语言处理深度学习迁移学习知识图谱联邦学习等 AI 技术,可提供模块化、全生命周期知识计算服务。

包括知识获取、知识建模、知识管理、知识应用四个环节。

知识获取华为云利用多模态知识抽取技术对多源异构数据(包括结构化、半结构化、非结构化数据文本,语音视频图像等多模态数据)进行快捷便利的知识抽取与处理。同时,为了减少模型对训练样本的依赖,减少人工标注工作量,华为小样本学习技术能在少量训练样本情况下,生成模型效果接近业界最好水平,减少 60% 以上的人工。 

在知识抽取技术方面,华为集成了业界领先的自然语言处理技术,包括实体链接算法、基于领域知识图谱的情感分析和观点提取、基于领域知识图谱的文本自动生成 (Data2Text) 能力等,在业界有突破性的意义。

知识建模:使用领域前沿算法模型,探索知识图谱流程中知识获取、知识建模、知识融合以及知识推理的统一化构建算法。可为企业提供流水线式自动化构建知识图谱的能力,使得图谱构建时间由数星期缩短到数分钟;同时可以实现知识图谱的自动更新。

知识管理华为云图引擎服务(GES)能够支持百亿节点千亿边规模的数据进行查询与分析,并可以存储从大规模异构数据中抽取的知识图谱,提供高并发、秒级多跳的实时查询能力。 

知识应用:提供知识搜索、可视化分析、知识推荐等基础能力,以及智能对话、预测分析、知识推理等高级能力,匹配企业多样化的应用需求。

三、进入生产系统,打造「有用的 AI」

依靠全流程的知识吸收与管理,AI 可以进入企业核心系统解决业务问题。

在钢铁行业,以华新不锈钢应用实践为例,特种钢炼制需要精确配置各种配料,稍有差错就会对成本和质量产生很大影响。


传统特种钢原料配置大多依靠专家和熟练员工经验。一方面耗时长,需要反复多次调整配比才能实现最优;另一方面由于原料不同批次成分含量不同,每次配置的水平不一,无法每次都生产出达到最优状态的特种钢。

华为云知识计算解决方案可以帮助合金配料工程师进行优化决策,找到符合钢水质量和经济效益的最优合金配料比例。它会吸取一年以上的配料数据、行业模型、专家知识等数据,综合起来作为算法训练的输入,构建标准化的配置模型。

以往人工配料合金成分预测精准度在 80% 波动,而 AI 模型合金成分预测准确率可达 95% 以上,由于合金配料节省每吨特种钢可降低成本 100 元,每年节省成本 2000 万元。 

在医疗行业,食道癌一直是我国最为高发的恶性肿瘤之一,病人五年生存率仅 15%,如果能够早期诊断并进行手术,患者术后五年生存率可以提高到 84.1%。

华为云与中科院北京基因组所团队合作,通过知识计算,将 DNA 羟甲基数据和经过大量研究实验积累的基因知识图谱进行整合计算,更加准确地识别出血液中的关键生物标记物,将早期诊断的准确性提升了 9 个百分点,有助于对食道癌患者的早诊断早治疗,挽救患者生命。

在汽车行业,中国第一汽车集团有限公司(以下简称「中国一汽」)应用华为云知识计算解决方案构建的一汽知识计算平台,基于业务场景,将知识便捷地、以数字化的方式呈现在眼前,快速提升员工能力。

据介绍,今年中国一汽联合华为云专家,设计了一款「维修智库」手机应用,用于解决车辆维修过程中,技师经验不足、故障分析效率低、维修周期长、用户体验差等问题。使用这个 APP,维修技师通过语音交互描述故障现象,系统即可智能推荐故障原因和维修方案、查看相关零件的拆装图纸等关键信息。

这个应用上线后,一汽红旗某 4S 店的一次性修复率提升了 4%,用户维修等待时间平均下降了 23%,提升了用户体验;同时,厂家支持的介入率降低了 30%,技师的培养周期缩短了 30%,降本增效成果显著。


下一步,中国一汽计划面向汽车产业全价值链业务,持续不断地丰富知识计算平台的应用场景和功能,比如预测汽车零件故障,改善备件保障体系,产品的设计、生产和销售环节等等。

除以上三个例子外,华为云知识计算服务还已经在包括石油、化纤、煤焦化、钢铁等行业落地,赋能企业构建知识计算平台,运用于研发、生产、运营、销售、售后服务等企业核心流程。

「知识计算是具有划时代意义的。」华为云 AI 专家表示。当 AI 与行业知识结合后,真正属于「行业 + AI」的时代才会来临。

文为机器之心原创,转载请联系本公众号获得授权

✄------------------------------------------------

加入机器之心(全职记者 / 实习生):hr@jiqizhixin.com

投稿或寻求报道:content@jiqizhixin.com

广告 & 商务合作:bd@jiqizhixin.com

入门华为知识计算智慧医疗智能汽车钢铁产业
1
相关数据
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

语义网技术

语义网是由万维网联盟的蒂姆·伯纳斯-李在1998年提出的一个概念,它的核心是:通过给万维网上的文档蒂姆加能够被计算机所理解的语义,从而使整个互联网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

生成模型技术

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。 它给观测值和标注数据序列指定一个联合概率分布。 在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。

语义网络技术

语义网络常常用作知识表示的一种形式。它其实是一种有向图;其中,顶点代表的是概念,而边则表示的是这些概念之间的语义关系。

批次技术

模型训练的一次迭代(即一次梯度更新)中使用的样本集。

联邦学习技术

如何在保护数据隐私、满足合法合规要求的前提下继续进行机器学习,这部分研究被称为「联邦学习」(Federated Learning)。

机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
实体链接技术

在自然语言处理中,实体链接,也称为命名实体链接(NEL)、命名实体消歧(NED)。实体链接的任务是为文本中提到的实体(例如着名的个人,地点或公司)分配唯一的身份。

小样本学习技术

人类非常擅长通过极少量的样本识别一个新物体,比如小孩子只需要书中的一些图片就可以认识什么是“斑马”,什么是“犀牛”。在人类的快速学习能力的启发下,研究人员希望机器学习模型在学习了一定类别的大量数据后,对于新的类别,只需要少量的样本就能快速学习,这就是 Few-shot Learning 要解决的问题。

推荐文章
暂无评论
暂无评论~