简介:用户访问数据中往往存在大量无用或与当前信息挖掘无关的数据,我们通过数据清洗从挖掘对象中去除不相关的数据,并实现了用户识别、会话识别、格式化等步骤,对WEB信息进行预处理,为进一步的操作提供了较好的数据格式,提高了挖掘效率。同时,因特网上的信息往往具有非结构化或半结构化特性,难以得到传统数据挖掘技术的支持,我们通过事务识别技术解决了这一问题,将访问序列组织成逻辑单元以表示事务或用户会话,将所有事务组成一个事务数据库,识别出事务后就可以利用对传统数据挖掘的方法对WEB数据进行挖掘:事务识别技术有多种实现形式,不同形式有不同的应用场合,本文根据特定挖掘任务,实现了以时间维来分割事务的算法,并给出了一些实验数据。
简介:[目的/意义]在双一流建设和信息化建设的背景下,实现学科电子档案资源有效聚合有助于提高学科建设工作效率,引导学科发展。[方法/过程]通过简述学科电子档案和资源聚合相关概念,梳理资源聚合的范围内容和资源间的语义关系,并确定合适的资源聚合方式和工具,构建了基于关联数据的学科电子档案资源聚合框架。[结果/结论]框架包括资源层、语义关联描述层、关联数据创建层、关联数据聚合层以及应用服务层五个层次,可用于引导学科电子档案关联数据的创建与发布、指导基于关联数据的学科电子档案资源聚合的进行以及促进基于关联数据的学科电子档案资源聚合平台的设计与实现等,有助于布局将来的学科发展方向。
简介:国际计算机互联网络(Internet)的迅速发展,极大地推动了我国的网络建设。特别是中国教育科研网(CERNET)的发展,极大地促进了高校校园网的建设。目前已开通校园网的院校则普遍停留在网络使用的初级阶段:仅提供E-mail、FIP、Web、BBS等,还缺乏深层次的应用和开发。校园网的根本目的是为学校的教学、科研和管理提供先进实用的计算机网络环境,为学校的发展、全球信息资源的共享服务。就这个根本目的而言,目前高等院校校园网的应用系统还需要大大加强。我校的校园网刚刚建成,还未开通,设想建立一个网上图书检索系统将图书资料建库上网,方便教师在校园网上查找所需资料,同时,管理员也可在网上实现书库资料的