充分挖掘语义检索,高效获取对比文件

(整期优先)网络出版时间:2022-07-29
/ 2

充分挖掘语义检索,高效获取对比文件

常杰

国家知识产权局专利局专利审查协作湖北中心)

摘  要语义检索相对于常规检索方式,在检索关键词不好表达、检索式不易构建时,从另一个方面提供了便利性、高效性,省时省力,在操作方式上、检出文件与被检文件的相关性上具有较高的效率。本文结合三个实际案例,来阐述智能检索系统中语义检索在检索方式上的思路拓展,检索效率和检索准确度均大大提高。

关键词语义分词  语义检索 关键词 权重值  

引言   

智能检索系统中的语义检索是预先把数据库每篇文献进行语义分词处理,而语义分词是将文本或句子拆分成相互独立、含义完整的关键词,即“切词”,然后,采用词频统计、词向量分析等技术,抽取一定数量的重要关键词,即“提词”,切词和提词得到的关键词作为特征关键词,用于构建语义检索模型,然后采用智能算法将关键词信息转化为向量值,进而求出向量值之间的余弦夹角,用于表示两两文献之间的相似度。当输入待检索的文献号或一段自由文本时,语义引擎将在数据库中搜索并按照相似度高低给出文本语义最接近的文献。相比较于传统的布尔逻辑运算,语义检索不再拘泥于文字信息的匹配,而是寻求获得文本语义最相关的文献。

一、案例分析

1.1修改语义分词和权重值高效获取对比文件

【案例一】

发明名称:一种降低熔喷布阻力的冷却装置和工艺

权利要求1:一种降低熔喷布阻力的冷却装置,包括安装平台(8),其特征在于:所述安装平台(8)上固定冷风箱(1),所述冷风箱(1)内设置空调或新风机组;冷风箱(1)一端连接送风总管(2)一端,所述送风总管(2)另一端连接送风三通管(3)进风端,所述送风三通管(3)第一出风端向下穿过安装平台(8)并连接第一送风弯管(4)进风端,送风三通管(3)第二出风端向下穿过安装平台(8)并连接第二送风弯管(5)进风端;所述第一送风弯管(4)出风端连接第一出风管(6),第二送风弯管(5)出风端连接第二出风管(7),第一出风管(6)出风口和第二出风管(7)出风口面对面设置;所述第一出风管(6)出风口和第二出风管(7)中间位置的正上方设有喷丝板(12),所述喷丝板(12)固定在安装平台(8)上;第一出风管(6)出风口和第二出风管(7)中间位置的正下方设有滚筒网筒接收机(11)。

语义检索过程分析:

在检索时,采用原始推荐的语义分词进行检索时,推送的400篇文献中未找出目标文献,接着在要素推荐中查看推荐的关键词,如下图所示,其已经对体现发明点的关键词加了蓝色的方框,方便快速查找定位。

结合上述推荐的关键词对语义分词进行修改,增加体现发明点的关键词熔喷、降温、冷却,并对不相关的关键词进行适当的删减,降低噪音,然后对体现发明点的关键词的权重值进行修改如下图所示,快速检索到对比文件CN111286794A。

由案例一可以总结,在实际检索中,不仅仅要拘泥于系统给出的默认语义分词,可以结合案例的发明构思,结合智能检索系统中要素推荐的关键词对语义分词进行扩展或删减,并对其权重值进行适当的修改,这样可以提高检索效率,快速获取对比文件。

1.2重复添加核心语义分词提高检索命中率

【案例二】

发明名称:一种全自动无纺填绒方法

权利要求1:一种全自动无纺填绒方法,其特征在于,包括以下步骤:在第一成网机(1)上方设置第一熔喷模头(2),第一成网机(1)下方连接第一抽吸风机(3),通过第一熔喷模头(2)牵引成型的纤维(4),第一抽吸风机(3)抽风使纤维(4)在第一成网机(1)上粘合形成熔喷底衬(8),第一成网机(1)连接第二成网机(5),第二成网机(5)下方连接第二抽吸风机(6),在第二成网机(5)上方设置填绒输送管道(7),通过填绒输送管道(7)在熔喷底衬(8)上喷绒材(9),第二抽吸风机(6)抽风使绒材(9)吸附在熔喷底衬(8)上,第二成网机(5)连接第三成网机(10),在第三成网机(10)上方设置第二熔喷模头(11),第三成网机(10)下方连接第三抽吸风机(12),吸附绒材(9)后的熔喷底衬(8)经过第二熔喷模头(11)正下方时,第二熔喷模头(11)牵引成型的纤维(4),第三抽吸风机(12)抽风使纤维(4)在绒材(9)上粘合形成熔喷表衬(13),完成填绒。

语义检索过程分析:

在该案件的检索中,权利要求的技术方案与现有技术的差别主要在于该技术方案在两层无纺布之间是填绒,即中间层的填绒是该技术方案的发明点,“填绒”是体现发明构思的关键技术特征,因此在语义检索中,重要的词添加3遍,如下图所示,来提高关键词“填绒”的权重值。通过上述调整,快速获取到对比文件CN1101388A。

由案例二可以总结,在智能语义检索中,系统会默认给出20个系统认为的最重要的特征关键词,并赋予初始权重值。权重值分为5个等级,5为最高级别。实际案例检索中,在准确理解发明构思的基础上,为了进一步提高体现发明构思的关键词的权重值,可以重复添加体现发明构思的关键词以提高整体权重值的级别,进而可以改变语义检索结果集。

1.3改写权利要求作为语义检索基准

【案例三】

发明名称:一种环形高性能合成纤维束

权利要求1:一种环形高性能合成纤维束,其特征在于由未改性的合成纤维和改性合成纤维分别形成纤维圈,且未改性合成纤维圈和改性合成纤维圈通过环形相套形成纤维束。

语义检索过程分析:

检索难点:该技术方案的发明构思主要是将两种合成纤维圈通过环形相套形成纤维束。采用扩展关键性进行检索时,噪音较大,文献不能聚焦到合成纤维丝束的制备领域,采用分类号进行检索时,均未很好的体现该技术方案的发明点。

语义检索思路 :智能语义检索能从词条间的关系上,更准确的把握发明点,提高命中率。对于该案的技术方案,在语义检索时,在以权利要求为语义检索文本的基础上,进行了进一步改写,增加了体现发明点的关键词,将其并列在关键词“环形”的后边,具体如下:一种环形高性能合成纤维束,其特征在于由未改性的合成纤维和改性合成纤维分别形成纤维圈,且未改性合成纤维圈和改性合成纤维圈通过环形,螺旋,圈状相套形成纤维束。以该改写过的权利要求作为语义检索的文本再一次进行语义检索,快速检索到对比文件CA1590645A。

由案例三可以总结,语义检索时,如果仅仅采用案件的申请号和原始的权利要求进行语义检索没有遇到相近的对比文件,不要轻易放弃,要进行不断的尝试和调整,必要时进行人工干预语义检索,改写权利要求作为语义检索的基础文本,对体现发明构思的关键词在权利要求中进行适当的添加调整,可以进行同义词、近义词的扩展,也可以不通顺或重复多次的添加,再进行语义检索,可以提高检索命中率。

三、结论

本文从三个实际案例着手,分析了智能语义检索的优越性,为了更好地检索到发明点,我们可以对语义检索结果进行深度的信息挖掘和发展,必要时进行适当的人工干预,结合技术方案的发明构思,灵活运用智能扩展方式,具体可以修改和扩展语义分词,增加关键语义分词的权重值以及降低次要关键词的权重值,重复添加关键技术特征词以大幅度提高权重值,以及改写语义语段的方式来提高检索结果的高效准确性,从而起到事半功倍的效果。

参考文献

[1]智能化升级系统(检索部分)常见问题及解答v1.7。

[2]智能化升级系统(检索部分)用户手册v2.5。