网页指纹查重技术的研究

在线阅读 下载PDF 导出详情
摘要 摘要院网页查重技术是浏览获取有用信息的关键技术,传统的查重方法中,选取关键词在网页中出现的频率来判断网页是否重复,如果关键词相近,可能造成查重误判的情况。本文提出网页本身特有的指纹技术,设计新的查重算法,通过与网页特征库中的指纹比较,完成网页的查重工作,提高查重的准确率。
出处 《价值工程》 2014年5期
出版日期 2014年05月15日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献