学科分类
/ 1
19 个结果
  • 简介:在文献信息工作中,文献标引是实现文献存贮和文献检索的重要手段。而文献标引学则是研究文献标引语言及其发展规律的一门新学科。它是信息时代的产物,是分类法语言与主题法语言相互渗透的必然结果,是分类标引工作与主题标引工作理论与实践相结合的总结和概括。

  • 标签: 文献标引 标引语言 文献检索 分类法 标引工作 新学科
  • 简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。

  • 标签: 自动标引 关键词提取 集成学习
  • 简介:对于影视资料分类标引的问题,提出了应以流行的、通用的、大众所熟悉的电影分类自然语言分类标引为主,并设置《影视资料分类标引参考主题词表》,旨在提高影视资料的检准率和检全率。

  • 标签: 声像资料 分类标引 主题标引
  • 简介:网络环境下,文献信息具有数量多、增长快、文献信息中的新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。为了比较受控标引、自由标引和自动标引三种标引方式的标引性能,本文从定量的角度对三种标引方式的相符度、专指度、标引深度及通用词数进行了测试对比,并分析了它们的综合性能。最后,分析讨论了网络环境下文本信息标引方式的选择和发展趋势。表5。图1。参考文献9。

  • 标签: 受控标引 自由标引 自动标引 手工标引 标引性能
  • 简介:黄页分类工作是电话号码簿编辑的主要工作之一。黄页公司一直致力于探索运用计算机技术对黄页数据分类进行自动标引。1998年开始进行人机对话的计算机自动切分工作,现切分结果的正确率达到了60%以上,标引速度达到了每小时1200条。

  • 标签: 黄页分类 电话号码簿 自动标引 计算机
  • 简介:本文叙述了目前人们可以通过网络数据库实现全文检索的情况下,自动标引的重要性,它可以针对海量信息进行检索和挖掘,可以把人类的思维同计算机技术相结合,使检索信息更完整、全面。

  • 标签: 中文数据库 索引 自动标引
  • 简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。

  • 标签: 《中国图书馆分类法》 分类矩阵 自动分类
  • 简介:图书分类标引工作是图书馆组织藏书和揭示藏书的一种手段,其目的是为了给读者(用户)提供馆藏信息,达到利用图书的目的。因此,图书分类标引工作非常重要,必须根据图书的内容及其论述的方面、著作目的、本馆的任务和读者需要来进行。图书分类标引工作是十分细致复杂的,对标引质量要求较高,如果标引质量不高,就会影响为读者服务,因此,图书分类

  • 标签: 图书分类标引 中学图书馆 标引质量 图书馆组织 读者需要 馆藏信息
  • 简介:主题标引是指根据文献内容及相关特征,赋予具有检索意义的相应语词标识的过程。《中国分类主题词表(第二版)》的使用,标志着我国图书编目工作进入了一个新的阶段,极大地提高了我国中文图书的分类、主题标引的一体化和文献检索的准确率,以及图书编目的质量和工作效率。同时,对从事标引工作的编目员来说,有了更高的要求,促进了我国文献标引工作向更高水平发展。

  • 标签: 《中国分类主题词表》 文献标引 电子版主题词表
  • 简介:简要介绍军用信息检索语言分类主题映射关系的概念、映射规则、隶属细则,《军用分类主题映射表》的映射方法、软件工具,专项审查、质量量化评估及今后研究方向。

  • 标签: 军用信息检索语言 分类主题一体化 科研方向
  • 简介:据国家标准化管理委员会网站2009年2月10日报道,由全国信息与文献标准化技术委员会第九分委员会、中国索引学会提出,中国索引学会副理事长侯汉清教授、黄秀文研究员主持编制的国家标准《索引编制规则(总则)》已于2008年11月3日由国家标准化管理委员会正式颁布,标准号为GB/T22466—2008,并将于2009年4月1日起实施。该标准设“主题内容”、“规范性引用标准”、“术语与定义”、“索引的功用”、“索引的类型”、“索引的设计”、“索引款目及其编制”、“照参系统”、“索引款目排序”、“索引的形式”、

  • 标签: 国家标准化管理委员会 中国索引学会 编制规则 总则 标准化技术委员会 索引款目
  • 简介:中华人民共和国国家标准《连续出版物著录规则(GB3792.3-85),以下简称《规则》)发布据今已有10个年头了。在这10年中,《规则》对规范期刊的著录,促进期刊工作标准化起了极大的推动作用,为当今迅速发展的计算机网络化打下了坚实的基础。但

  • 标签: 连续出版物 著录规则 期刊编目 图书馆 著录项目 期刊文献
  • 简介:《索引编制规则(总则)》作为国家标准正式颁布与实施后,广大索引工作者备感振奋,《光明日报》、《解放日报》、《文汇报》等主流媒体相继报导。《索引编制规则(总则)》之所以引起索引工作者和学术界的关注,我们想不外乎有以下三个原因:

  • 标签: 编制规则 索引 总则 前言 指南 应用
  • 简介:4月14日上午,《地方志索引编制规则》起草工作筹备会议在复旦大学图书馆召开。杨光辉常务副理事长兼秘书长主持会议,常务理事王彦祥、王雅戈,常务副秘书长温国强以及秘书处郭丽芳、仇琛出席会议。会议就《地方志索引编制规则(草案)》起草工作的组织方式、计划进度、编制原则、标准框架及分工事宜进行了讨论,形成了初步的工作方案。

  • 标签: 编制规则 杨光辉 复旦大学图书馆 计划进度 编制原则 学术顾问
  • 简介:索引是知识组织和信息检索的重要工具,索引(包括现代化索引——数据库)事业的兴旺发达是关系一个国家的文化产业和信息产业发展的因素之一。中国索引学会自成立以来一直以推进我国索引事业的普及和发展为己任,并在下列方面积极开展工作:

  • 标签: 索引编制 编制规则 前言 GB 手册 信息产业发展
  • 简介:叙词表中词间关系分为等同关系(EquivaLenceRelationship)、等级关系(HierarchicalRelationship)和相关关系(AssociativeRelationship),词间关系的控制是叙词表编制的关键技术,文章主要针对叙词表词间的等级关系和相关关系,比较国际标准ISO2788、中国标准GB13190—91以及关国标准NISOZ39.19—2005对其的规定,分析异同,总结联系,从三个标准的实用性、检索效率等方面予以分析,并为中国叙词表编制标准提出改进建议。

  • 标签: 叙词表编制 词汇控制 等级关系 相关关系 技术标准