工厂智能化改造遭遇的困境,可能会让一个程序员「武功全废」

技术大拿用亲身经历,讲述智能制造遇到的那些坑。


「智能制造」少不了一个步骤——程序员一定要到生产车间走一趟。这被很多算法工程师戏称为「新时代的上山下乡」。

在车间写过代码,或被老师傅围堵的工程师们都清楚,算法模型到了车间就能指点江山?不,有可能「武功全废」。

无论技术如何优良,都抵不过经过「现场」历练的 1%。

协鑫光伏良品率提升 1%,中策橡胶年利润增加千万……在阿里对外公布的诸多工业大脑的成功案例中,这些漂亮数字的确能在一定程度上代表智能化改造的价值,但却很难让人对技术落地的细节有更多体感。

根据工业大脑首席科学家闵万里博士用自己多次下车间的亲身经历,手足无措、「工厂数据指标之多把团队看傻」等状态在早期项目中经常出现。但这些在某种程度上被看作是「主观困难」,克服只是时间问题。

然而,车间很多意想不到的情况其实并不在工程师们考虑或者预测的范围内,因此,工厂智能化改造遇到的问题不仅多,而且几乎每天都能换一波。

「给协鑫的切片生产流程做改造就用了 140 多天,一开始啥都不懂,每天都在请教和学习,问题不断。而且前期和后期遇到的问题完全不同,所以我们陆续去了一大波人,我自己就带团队去了两次。

对闵万里来说,实验室可谓平静如水,但现场却总是充满意外。

其实如果用文字来叙述算法算法工程师们要做的这件事情,听起来非常简单,而且合情合理

按照让人工智能发挥作用的正常思路,凡是依赖老师傅经验,且具有重复性特征的工作,均可用算法的方式来代替。

「市面上用的计算机视觉方法,或者语音识别等等,其实都不是应该在工厂车间里发挥作用的主流方式。只有网络分析方式,也就是神经网络算法,才在生产流程中发挥着最重要的作用。」

目前,工业大脑与智慧城市项目都是延用同样的技术思路。

在智慧城市里,道路是网络,流动的有车流,信号灯就是节点;而工厂也一样,生产流程有多个环节,环节与环节之间流动的是数据,所以也可以被看作是一张网络。

「而我们要做的,就是考虑如何在这个网络上进行深度挖掘与广度挖掘。」

闵万里表示之所以「敢」去做这件事,还是因为相同的技术应用已经在电商领域沉淀过,譬如他们曾用同样的方式做了淘宝基于 10 亿用户的个性化推荐,用户 ID(节点)与商品(节点)仍然组成的是一个网络结构。

因此,走进协鑫的切片生产厂间,他们第一步是把标准化车间所有端口的数据上传至云端工业大脑,再通过算法对这个生产流程的关联参数进行深度学习运算,找出与良品率最相关的 60 个关键参数并进行学习和预测,搭建参数曲线,在生产流程中做到实时监测与控制变量。

听起来一点问题都没有,理论完全正确。

但是让工程师为效果而抓狂的开始,正是入驻切片生产车间的那一刻。

工程师们普遍认为的难题中的 No.1 便是「稳定性」。

当时在车间的端口都架接好后,让工程师最害怕的事就如约而至——数据断流。

因为只有数据源源不断地上传至云端进行学习,才能让大脑也源源不断地输出控制指令以及建议。此前在实验室里,稳定的数据流都是假定的,但在工厂,这个假定就是最大的 bug。

「一旦产线端口断流我们就没法做了,但这种情况经常出现,原因是什么?并不是什么联网问题,而是工人的误操作。特别是在他们交接班的时候,频繁出现这类事故。」

因此,为了应对临时数据断流,必须要有一个 plan B,而这项应急机制目前仍然在完善中。

第二个问题倒是在 AI 应用界很常见——「历史样本有多少才能见效果」。

即便工业大脑团队通过协鑫的数据训练好一个算法模型,然后把这个模型拿到第二家光伏厂,用这家工厂的数据去训练学习他们的参数,但是让这家工厂能用的「学习方法」究竟是需要过去三周的数据,还是过去三个月的数据,算法工程师自己也不知道。

「我们也不是行业内的专家。也就是说我们找到了一把武器,虽然这把武器曾经成功过,譬如用在中策橡胶上是成功了,但是另一家橡胶厂万一情况完全不一样呢?」

一切要取决于这个产线的复杂度。

如果这条产线有几千个参数,用一两周的数据根本不够,可能需要一两个月甚至是一两年。因为变量越多,就需要越多的数据去帮你学习这些变量之间的关系。

「所以有人说你用了第一家工厂的数据,会不会把算法模型提供给第二家工厂的时候,把第一家的参数泄露出去。然而真相是,即便直接把人家参数拿来,其他工厂也不敢用。」

实际上,以上两个问题本质上都是由数据引起的。而数据是否充沛,对于工厂的智能化改造是一个非常重要的前提。

工业大脑团队在前期走过的弯路基本都跟工厂数据的大量缺失有关。

闵万里坦言,有时候你选准了目标,但是那些数据都被删掉了,然后你只能站在那里无可奈何。

「两周删一次数据,经常有工厂这样干。因为保留这些视频或是其他数据主要是为了发生事故用来追责用的,所以如果这两周没有事故,那就删掉数据从新来,工厂也要节省磁盘存储。

但对于我们来说,你没有历史数据去学习,能怎么办?所以双方只能达成一致——那就等下一波再说吧,等数据多起来再做,但是时间都浪费掉了。」

数据的重要性

第二个问题自然就引出了第三个问题——老王工厂与老李产线的应用层都有特殊的要求,要怎么办?

事实上,每家工厂都有自己的独特性,甚至一家工厂内的产线与产线之间也存在巨大差异。

有的产线新一点,有的产线老一点,新老产线埋在地下的 IOT 终端设备密度都不一样,所以产出的密度自然不一样。

「即便你有这个算法能力,可能原材料的密度以及覆盖面有很大的差异,因此就存在怎么把这个技术嵌入到产线上,也就是安装适配的问题。

这就像我们买了一套软件回到家,如果电脑不兼容怎么办?」

做光伏项目时,闵万里团队就决定先自己去搞适配,整个过程都先自己干,到目前为止,已经掌握了这些适配的关键要素,并把它们做成一个标准的适配手册提供给开发者,告诉他们适配的时候需要看哪几个维度。

但另一方面,对产线和工厂管理人员最了解,更擅长做适配的人仍然是 ISV 们。

ISV 指的是独立软件供应商,在这里指专门面向制造业从事软件开发、生产、销售和服务的企业;扮演的角色类似于安防行业的集成商。

「我们最擅长的肯定是提供核心算法模型,但车间的张主任要用,他看到的界面必须是按照他们的管理习惯高度定制化的东西。他跟你提需求时会说,我这个车间的管理流程是几班倒,通常这样来管理云云。

而我们智能化分析与推荐的那些参数怎么按照他们既有的管理流程呈现出来,都是高度定制化的东西,需要让 ISV 来做,他们懂工厂喜欢什么。」

刚刚发布的飞龙工业互联网平台,一方面面向写代码的工业开发者,一方面面向 ISV 类开发者。闵万里认为,前者贡献的是平台输出的内容,后者贡献的是平台输出内容的方式。

有意思的是,此前很多报道都把『联网』问题看作是工厂上云以及智能化改造的困境之一,但闵万里恰恰认为这并不是一个技术难题,

「今天连网真的不是什么难题。你想连,第二天拉几个人,网线一搞,但工厂主没看到利益是不会动的,何况是在他们产线上动刀。

所以说这个问题不是技术难题,而是一个商业动机是否足的问题。今天你是工厂主,没有看到联网之后的好处,是不会花钱去联网的。」

一方面,他们怕给自己现有的产线搞出事来,另一方面,他们没有被智能化所创造的价值所打动。

在制造行业,特别是重工业领域,「停产」是一件绝对不被允许发生的事情。以石油与钢铁行业为例,停产可能会被看作是重大事故,仅重新启动就会花掉好长时间。

因此对于工厂来说,改造利用非侵入性植入方式是非常关键的。

「你会发现,我们做的所有案例都不停产,都绝不干扰它现有生产流程的前提下,给他增加智慧因素,告诉工人参数应该怎么调。

但在这之前,你需要它的数据能汇集在一起,其中包括联网问题,而这个只要解决他们的动力问题就好了。」

如何解决动力问题?当然是让他们看到这样做的价值空间到底有多大。

闵万里谈到了技术公司通常会向工厂主们抛出的两种「甜头」:

一种是防守型价值,另一种则是进攻型价值。

许多公司都会用「预测性维护」这种防守型价值来说服制造企业,但很多时候起到的作用非常小。因为在后者看来,成本预算是固定的,而降低成本的诱惑并没有那么大。

「举个例子,你说今年 IT 成本我帮你节省 20%,他会算多少钱,但是节省是有上限的。你每年的 IT 预算就那么多,如果有 500 万,你帮他们节省 30% 也就 150 万,他们可能没什么感觉。

但是进攻型价值则是没有上限的。」

工业大脑采取的策略便是用进攻型价值来打动工厂主。他们提出帮助工厂提升良品率,因为像能源、光伏等重工业制造产线的 GDP 非常高,稍微有 1% 的提升就会有成百上千万的价值。

「增值是无限的想象空间,因此制造业即便不相信,也必须要考虑。」

但必须注意的是,即便工业大脑团队在很多工业项目上取得了不错的成绩,但数据仍然是一个让制造企业们存在顾虑的东西。

譬如,我们都知道阿里工业大脑最早是在协鑫光伏的切割生产线上找到了机会,做了一个百分比的提升。

但一家工厂内部存在着诸多生产环节,「切割」只是其中的一环,数据尚在这一环里实现共享,但包含「供产研销」在内的整个制造流程尚不能被打通。

闵万里也坦言,工厂肯定不会把所有环节全部开放,也肯定在数据上有所保留,不过他不觉得这是问题。

「工艺师傅一定会把他们认为最痛的相关数据给到我们,某种程度上,他在选择哪些数据给我们的时候,就已经做出了一个价值的取舍。

这对我们肯定是个好事,我当然不希望把没价值的东西给我,干扰我们的努力。」

机器之心产业分析师认为,如果整体打通,工厂的整体管理决策能力就会再上一个台阶:

「一个需求端微小的定制化需求能多块反映到生产线上的变化,基本就代表了这个企业有多短平快,能否适应未来的时代。

从需求端到供给端链条很长的,原来要有各种经销商,销售,管理人员,采购,排期到生产研发。如果打通,会产生多少个阿里的价值?」

目前,工业大脑团队正在沿着产业链打通,寻找价值目标,按照产业链路的逻辑关系,通过解一个环节来找到其他环节的突破关系。

「其实从根本上说,往往不是技术决定成败,而是方向的选择上。我们可以信誓旦旦地说,很多技术难题和应用难题都是能解决的,没有我们解不了的技术。

但是如果选错了方向,就会累死人。

价值=技术+数据+行业。任何一个新技术的开发,你创造的价值是什么,这个公式如果不通,千万不要干。」

产业大数据智能制造
2
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

推荐文章
暂无评论
暂无评论~