日期:2021-11-23
作者:润滑卫士
浏览量:
上期回顾:小卫上期文章中谈到了通过润滑管理来采集润滑数据,从而展开工业大数据布局,从润滑场景入手推动水泥企业的大数据应用。
在确定了工业大数据应用场景的前提下。本期小卫基于CRISP-DM(Cross-Industry Standard Process for Data Mining,跨行业数据挖掘应用标准流程)方法论,阐述润滑管理领域中,工业大数据分析路径与实施步骤。(方法论详情参加本期知识分享)
- NO.1 -
业务理解
▼
工业数据分析中,最为重要且关键的一步是要将业务需求转化为可解且可达成的数据分析问题。这一步骤中经常会出现仅关注数据本身,不结合现实进行分析,导致分析结果和实际工况不匹配、无价值的情况。
为避免这种情况的发生,润滑卫士以自身于润滑领域30年的专业知识沉淀为基础,采集监测润滑数据,以数据结合场景、经验,获取高匹配、高质量的分析结果。理解业务需求目标,完成正确分析,然后制定相应计划,开始寻找需求和数据的相关性。
- NO.2-
数据理解
▼
对数据的初步探索过程中,首先要理解数据和业务间的关联关系,包括需要哪些数据、这些数据是从哪里来的、是哪一类数据、怎么采集等。
因此,润滑卫士以保证设备健康运行为目的,确定以润滑油液为数据采集场景的情况下,选择高度集成的物联传感器所采集的设备数据(设备自身的运行数据、可能影响设备运行的环境数据)为对象,进行数据分析。
为保障数据质与量,润滑卫士以28万台套市场现行设备积累的超过30万条真实的设备失效数据为质量基础,在数据采集时,以全面监测设备包括磨粒、温度、水分、粘液、介电常数等各项指标为补充。
再明确数据关联关系,如物联传感器采集的数据显示润滑油液中发生磨粒数据急剧增加,其隐藏信息为设备齿轮运行出现问题,导致剧烈磨损。润滑卫士一一对应数据和潜藏信息的联系特征,设立假设并进行实验验证。直至确定当前数据满足业务场景的需要。
- NO.3-
数据准备
▼
第三步,应对所需的数据进行加工与治理,包括原始数据抽取、多数据源融合、数据清洗与质量提升等。
润滑卫士数据准备与预处理环节不仅由数据分析师组成,还包括懂行业know-how的专家。他们通过经验结合数据对于一些不合理的数据进行判断。比如润滑油液中在极短时间内出现水分数据的急剧变化,这一现象必然是不合理的,然而引起该现象的原因却很多,如机器油箱进水、冷却器穿孔等。要明确造成该现象的原因,需要结合实际场景和数据变化趋势来共同分析。
为实现PHMS预测性设备健康管理及服务的全自动诊断流程,润滑卫士在设计、验证、完善预诊断系统时,采取AI智能算法+大量数据分析结合的方式,考虑环境、设备自身等各项因素,结合经验,全面准确地判断变化发生原因,采取多种类实验进行验证,直至假设与现实匹配,从根源保障设备诊断的准确性。
- NO.4-
模型建立
▼
如果说在实施工业大数据项目前,是通过历史数据估算润滑场景价值点,来判断是否可以通过场景数据采集实现最终目的。那么,到了具体的应用落地实施阶段,则需要依赖现有的大量预处理数据,对业务场景的价值进行更具体的计算。通过算法模型,得出一个可量化的值,从而验证基于润滑管理数据分析能够实现的价值。
润滑卫士借助统计学方法对数据进行转换、映射、分析,找到数据中的规律,并进行特征提取,即最大限度地从原始数据中找到特征规律以供算法和模型使用。然后基于基于统计模型、设备机理模型,结合客户具体工况条件,通过润滑卫士独有的设备润滑失效算法、油品劣化趋势的设备失效算法等,输出数据分析模型。
- NO.5-
模型验证与评估
▼
建立起合适的算法模型最终目的是为了解决业务实际问题。在此基础上,模型的验证尤为重要。模型的验证是对分析模型从数据和技术的角度进行充分检验评估,确认数据分析的结果或模型是否满足具体工业应用场景的使用需求。润滑卫士结合实际设备运行场景对数据分析的价值进行验证,达到最终识别设备健康问题的目的。
- NO.6-
模型部署
▼
模型在运行过程中,还应持续修正、迭代和完善。而润滑卫士模型的自适应,基于设备数据不断完善优化,形成自成长循环,该方式建立的模型能够适用于多种场景。另外,基于现有数据完成模型的上线后,还需进一步评估,进一步迭代模型,如此反复,不断优化模型,得到更可靠的分析结果。
工业大数据项目的实施与落地离不开方法指引,离不开场景选择、业务逻辑的深入理解,也离不开高质量的数据保障、大数据技术与业务流程的融合,更离不开算法模型的持续迭代和专业的战略合作伙伴与人才支撑。润滑卫士,为工业企业提供可靠服务的同时,孜孜以求,为实现行业大数据推进笃定前行。