基于随机森林和关联规则的烟支圆周影响因素分析

(整期优先)网络出版时间:2021-10-14
/ 2

基于随机森林和关联规则的烟支圆周影响因素分析

周峰 赵堂坤 饶颖 李孟亚

红云红河集团红河卷烟厂卷包部 云南 弥勒 652300

摘要:烟支圆周是一项重要的物理指标,在过去的研究中,主要关注点在于原辅材料及生产设备方面的因素,而对于生产组织层面的各种影响因素关注较少。文章通过运用方差分析、随机森立以及关联规则等统计学工具,充分分析了生产组织层面影响烟支圆周合格率的各个因素,为生产管理提供了一定的管理建议。

关键词:随机森林 关联规则 烟支圆周 合格率

1 引言

烟支圆周合格率是烟支物理指标的重要因素,在烟草行业高质量发展这一要求的大背景下,提高烟支圆周合格率,进一步提升卷烟内在品质就成为了卷包的重点工作之一。吴明毅[1]等,提出了通过偏倚值对烟支综合测试台的判定方法,王坤[2]等通过多元统计控制图对烟支的物理指标进行了分析。舒芳誉[3]等通过多变异分析,从多个角度对烟支物理指标的影响因素进行了分析。而针对生产组织层面的因素对烟支圆周合格率的影响,国内外研究略显不足。

在卷包车间的生产过程中,烟支圆周因为受到机型、操作人员水平、生产牌号等诸多因素影响,难以确定有效的提高方法。本文重点研究影响烟支圆周合格率的因素的重要性程度,同时探索质量改进的方向。

2 材料与方法

选取红河卷烟厂现有数量较多的中速卷烟机作为测试对象,包括ZJ17、PASSIM以及PROTOS90S三种卷烟机。使用烟支测试台对烟支圆周进行测量。以烟支圆周合格率作为因变量,以机组、班组、牌号、机型、班次、人员以及工龄段作为自变量,各变量设计如表1所示。

表1 变量设计

变量

说明

机组

机组编号(1#—32#)

班组

班组编号(甲乙丙)

牌号

生产卷烟品牌(红河(A7)、红河(软99)、红河(小熊猫)、云烟(紫)、红塔山(硬经典)等)

机型

卷烟机类型(ZJ17)(PASSIM)(PROTOS90S)

班次

每日生产的次序(晨早中)

人员

抽样时操作人员

工龄分段

以10年为一个工龄段(0-9年、10-19年、20年及以上)

根据上述变量设计,从MES系统中统计了5月6日至6月18日的生产数据,共计1405条。

3 圆周合格率影响因素分析

3.1 圆周合格率描述性统计

圆周合格率为一次抽样中,烟支圆周合格的数量占抽样总数的百分比,通过计算得到如表2所示数据。

表2 烟支圆周合格率描述性统计

变量

N

均值

标准差

最小值

下四分位树

中位数

上四分位数

最大值

众数

合格率

1405

0.96

0.0898

0.0000

0.9967

1.0000

1.0000

1.0000

1.0000

描述性分析显示,烟支圆周合格率最大值为1,最小值为0。下四分位数为09967,中位数为1、众数为1。可见圆周合格率总体保持在较高水平,较为稳定,但是有仍有合格率水平较低的情况发生。

3.2 影响因素分析

为了确定对烟支圆周合格率有显著影响的因素,通过方差分析,检验了不同影响因素的影响显著性,如表3所示。

表3 各影响因素方差分析结果

项目

P值

是否拒绝原假设

机组

0.000

班组

0.432

牌号

0.013

机型

0.122

班次

0.011

人员

0.022

工龄分段

0.398

在α=0.05的显著水平下,可以通过方差分析判断,生产组织层面对烟支烟周合格率有显著影响的因素为机组、牌号、班次以及人员。

3.3 随机森林回归分析

为了确定各个影响因素的重要性,通过随机森林进行回归分析,结果如图1所示。

6167d172a6f39_html_d19afddbb3b5678.png

图1 随机森林回归结果

结果显示,NMSE = 0.40039<1,说明模型是具有意义的。从图中可以看出,对烟支圆周合格率有显著影响的因素中,其重要度排序为人员>机组>牌号>班次。

3.4 关联规则分析

为了确定改进方向,通过关联规则,使用Apriori 算法对影响因素进行分析。因为生产组织中,人员始终工作于同一机组,所以在进行关联规则分析的时候不再将机组作为自变量。

因为每次抽样均为30支,所以定义“是一支以上”为抽样中烟支圆周合格率小于95%。根据强关联规则的定义,只要大于最小支持度和最小置信度的关联规则均属于强关联规则,为了满足卷包生产的需要,找出引起圆周合格率小于95%因素,设定如果该规则出现的概率小于 0.0025,或者给定条件下造成“是一支以上”的概率小于 65%,认为造成“是一支以上”的情况不会普遍发生。所以设定最小支持度为 0.0025,最小置信度为 0.65,并且筛选出rhs 为“是一支以上”的规则。通过R软件进行分析,结果如表4所示。

表4 关联规则分析结果

lhs

rhs

support

confidence

lift

count

{早,李睿}

=>

{是}

0.003909

0.833333

3.779551

5

{晨,念丽波}

=>

{是}

0.003909

0.833333

3.779551

5

{红河(A7),杨永兵}

=>

{是}

0.003909

0.714286

3.239615

5

{早,杨永兵}

=>

{是}

0.004691

0.666667

3.023641

6

{红河(A7),早,李睿}

=>

{是}

0.003909

0.833333

3.779551

5

关联规则计算得到的5条规则的提升度都大于 1,说明 X 对 Y 有促进作用。在生产组织时,要在李睿、杨永兵在上早班的时候,尤其是早班且开红河(A7)的时候,更容易出现烟支圆周合格率小于95%,念丽波在上晨班的时候,更容易出现烟支圆周合格率小于95%。因此,相关管理人员可以在满足以上条件时多加以关注,以减少不合格烟支的产生。

4 结论

本文通过统计分析工具,以烟支圆周合格率为因变量,以生产组织层面各个影响因素为自变量,层层推进分析烟支圆周合格率影响因素。其中影响显著的因素有机组、牌号、班次以及人员,其重要性为人员>机组>牌号>班次。并通过关联规则分析结果,为相关管理人员提供了一定的管理意见。

参考文献

[1]吴明毅, 刘波, 马秀娟, et al. MTS烟支综合测试台长度偏倚值的分析判定[C]// 云南省烟草学会2014年学术年会. 0.

[2]王坤, 堵劲松, 舒芳誉, et al. 多元统计控制图在烟支卷制品质控制中的应用[J]. 烟草科技, 2015(4):82-89.

[3]舒芳誉, 罗靖, 马明旻. 基于多变异分析的烟支物理质量影响因素研究[J]. 烟草科技, 2015(12):72-77.