简介:摘要:随着能源技术的发展,能源数据的种类和数据量增大,这给能源目录体系的构建和能源数据的使用带来挑战。为了对能源目录关键项进行提取,降低能源目录的冗余度,本文基于联合互信息的半监督特征选择算法,提出了一种能源目录关键项提取方法。首先,针对能源目录标签信息不完整的问题,采用半监督学习算法将半监督数据集转换为有监督数据集。其次,基于联合互信息对能源目录中所有项目进行重要度排序。然后,根据得到的不同特征子集,计算其分类准确率。最后,通过对比分析得到最终的能源目录关键项。算例结果表明,在数据样本标签信息不完整的情况下,本文所提方法可以在剔除较多特征的时候仍保持较高的分类准确率,验证了该方法的合理性、有效性。