学科分类
/ 1
3 个结果
  • 简介:传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分类模型,其性能显著优于直接使用标注数据构建的分类模型,同时降低了人工标注数据的成本。

  • 标签: 正例未标注学习 隐马尔科夫模型 命名实体识别 文本挖掘
  • 简介:一场SARS风暴让病毒成为了人们日常生话中的热门话题。大家可能关心更多的是攻击人体的病毒.但不知大家是否留意到,攻击计算机的病毒也在逐步进化。现在已达到了一个新的高度。防病毒已不再像往常一样.单单装个反病毒软件就可解决了。

  • 标签: 计算机 病毒 反病毒软件 病毒代码 自我复制能力 木马程序
  • 简介:WindowsXP比Windows9X稳定多了,但还是不能彻底避免系统崩溃。我们将从硬件故障,BIOS设置和内存错误等方面分析系统崩溃的原因,并提出崩溃发生以后的最佳处理办法,以及如何减少它对系统的影响。良好的维护程序可以降低崩溃发生的频率及其严重程度。一些简单的工作,例如磁盘碎片整理,备份和内存清理,可以让电脑变得更稳定,更不容易出错。你可以买防崩溃软件,但知识才是最好的武器,而且合理地处理系统崩溃还可以保证数据的安全。

  • 标签: 系统崩溃 预防措施 原因 Windows BIOS设置 磁盘碎片整理