Patentics 搜索透镜---审查员必读


        在检索过程中,经常会看到一些中国申请的公开号表有不同色度的绿色背景。这是Patentics搜索透镜发生智能“聚焦”。
        Patentics独创搜索透镜的基本思想是,在原有中国专利中文申请库上,通过中、英文机器翻译,构造出一个中国专利英文申请库。如果考虑语言是对事物的表示,则中国专利中文库与中国专利英文库是对相同发明内容的不同语言表示。通过我们的大量实验证明,中国专利英文库,具有与中国专利中文库相似的相关性语言模型。这两个模型相关但不相同,信息互补而不冗余。我们发现,如果对两个模型的相关排序结果进行特殊处理,就像光学装置中透镜一样,系统会对相关度排序输出结果,产生智能“聚焦”作用!
        对二个语言模型进行自动测试。测试均无需任何检索策略,仅输入被审公开号,Patentics排序计算结果与中国审查员给出国际检索报告(ISR)中的X文献进行比对。其中,TOP-i表示前i篇自动计算排序结果中包含审查员给出X文献的命中率。如,TOP-1表示,仅输入公开号,Patentics计算排序第一位就有9%的可能是审查员给出X文献。必须注意,在测试中我们严格假设,没有被审查员引用的其它相关文献都不算命中。
        从测试中,我们可以发现,就单语言模型比较(中国申请中文、中国申请英文)中国申请英文模型略好于中国申请中文模型。将两个语言模型通过搜索透镜算法聚焦融合,同样是输入被审公开号、同样是没有任何检索策略,其TOP-20、TOP-100的X命中精度,均提高10%。
        搜索透镜不仅提供了一个新的合成检索源,更为重要的是,把两个相关的检索源通过搜索透镜算法融合,构建成一个全新的智能检索决策源。通过对两个语言模型相容的排序结果的智能融合处理,我们可以计算和捕获单模型不可能出现的事件。比如说,当两个模型都将某一篇文档排序在第1位,更一般地,当两个模型都将某一篇文档排序在前i位(简称为“第i锁定”),这些锁定事件对X命中率的影响将会如何?
        实际测试表明,如果某一篇文档被锁定在第1位,则该篇被锁定的文档是X文献的概率从9%跳升到20%!在单语言模型中要通过人工浏览近20篇才能达到的精度,现在只需浏览被锁定的第一篇即可达到。如果两个模型都锁定某一篇在前3位,则被锁定前3篇中为X文献的概率为34.3%,在单模型中要通过人工浏览40篇才能达到的精度,现在只需浏览最多3篇即可达到。如果两个模型都锁定某一篇在前20位,则被锁定前20篇中为X文献的概率为67.9%,在单模型中要通过人工浏览多于400篇才能达到的精度,现在只需浏览最多20篇即可达到。
        换句话说,Patentics搜索透镜技术,创建一个新的智能语义模型,从另一个语言视角自动理解文本意思,聚焦最相关文献,帮助用户节省阅读时间,提高检索、浏览精度!
        必须注意,为了使Patentics搜索透镜发生作用,目前支持数据库必须选“中国申请”库。这对检索中国对比文献,不是一个限制。因为,中国申请包含中国授权。