摘要 知识约简包括属性约简和属性值约简。而目前关于属性值的约简方法是寥寥可数。本文在建立了粒与二进制数的基础之上,提出了粒度包含和粒度基数的概念,并应用于属性值的约简当中。最后,通过具体实例加以说明。
关键词 粒度,粒计算,属性值约简,Rough集
0 引言
Rough集理论是研究模糊性和不确定性的一种新的数学工具,它的重要特点是不需要预先给定某些特征或属性的数量描述而直接从给定问题的描述集合出发,在保持分类能力不变的前提下,通过知识约简,导出概念的分类规则,因此具有很强的定性分析能力[1]。
知识约简在Rough集理论中是一个非常重要的概念,包括属性约简和属性值约简。关于属性约简的方法已经有很多,这里就不一一介绍了,而关于属性值的约简目前仅限于文献[2]中的数据分析法。本文在建立了粒与二进制数的对应关系上,定义了粒度包含和粒度基数,并给出了相应的属性值约简算法。该方法通过二进制数的AND运算及粒度包含来判断哪个对象的哪个属性可被约去,不仅速度快,而且效率高,还有利于在计算机上实现。
1 二进制粒及相关定义
1.1 信息系统和粒度
表1 商务信息系统的知识表示(玩具)
1.2二进制粒及其计算
2 基于二进制粒的属性值约简方法
3 实例分析
1)把表1进行数字化形成表2如下:
表2 数字化表示的形式化决策表[3]
将表3进行二进制粒化,结果如表4,
表4 二进制粒化后的结果
其中xi表示属性为x,对应的属性值为i的的粒子。
3)下面进行属性值约简:
4 结束语
本文结合具体实例讨论了二进制粒在属性值约简上的应用,避免了传统方法中针对每个对象的每个属性值进行分析的弊端,而是针对每个属性值来判断哪个对象不需要它,最后对于每个对象形成了一个应约去属性值的集合,并且是建立在二进制的AND运算基础之上,通过二进制包含的定义来进行判断。方法简单易行,快速可靠。
参考文献:
[1]周庆敏,李永生,殷晨波,陆金桂.基于Rough集理论的知识约简与规则挖掘方法.南京工业大学学报,第25卷第4期 2003年7月
[2]刘清.Rough集及Rough推理[M].北京:科学出版社,2001
[3]陈晓红,陈岚.基于粗糙集理论的知识约简及应用实例.大学数学,第19卷第4期 2003年8月
[4]刘斓,刘清.基于粒的二进制运算的关联规则提取方法.南昌大学学报(理科版),第27卷第1期 2003年3月