简介:摘要在信息化时代,数据是企业生产和运行的基础,其质量好坏直接影响着企业的生存和效益。Internet已经成为一个巨大的数据仓库,为了确保我们所利用的Web文本资源的高质量,本文介绍了利用Web内容离群点挖掘技术审查Web文本内容,提高数据质量的方法,并且取得了较好的实验结果。
Web资源内容质量的离群点挖掘系统研究