流检索挖掘基础专利详解


    在上2篇文章中,我们介绍采用流检索挖掘有价值专利的2种方法。一是检索出一组数据,直接进行被引用分析,根据被引用次数排序,如ns/中国 and g/ref-d, 另一是先通过检索式构建一个本领域的“专家组”,即专利发明人,然后通过他们的引用投票来找出本领域的最核心专利。看起来第二种方法是多余的,为什么多此一举去找出“专家组”,而不是像第一种方法,直接进行被引用次数排序?这是因为一般的技术领域,往往很难像方法一一样,用一个表达式确定全部专利,比如3d打印技术,很难用一个表达式来保证一定包含全部3d打印专利的集。而方法一要解决的是全部中国申请地址的全部专利,这样的完备专利集可以用Patentics的一个表达式获得,所以只需找出专利,对这些专利直接进行被引数排序分析。
    比如希望知道北京最有价值专利,我们可以用
       p:ns/北京 and db/cn and g/ref-d;
    希望知道哪些是过早放弃(付费期在0-4年间)的专利中的价值,
       p:ns/北京 and ls/3 and paid/0-4 and db/cn and g/ref-d

    非常有趣的是,第一篇申请人李刚,被引用115篇,也是过早放弃。点击标题,我们可以查阅该专利被哪些专利引用。结果是被113篇微软的美国、中国专利引用了。这显然是一篇不错的专利。可惜,这篇中国专利最终是被微软请求无效了。不然,微软需要向该专利权人付专利费了。


    对于特指技术领域,我们不能断定基础专利是否在检索结果集中。所以建议通过选该技术领域最相关的n个专利的发明专家。如3d printing,我们选了1000个。取最相关的n个也是一个可调参数。n太小,不易“集思广益”,n太大,许多不太相关的领域专家的投票开始干扰。不管如何,n太大与太小之间是有很大距离。
    除了采用概念排序方法找出一组“领域专家”,还可以用大家熟悉的各种检索方法。如阿托伐他汀,英文名为atorvastatin,是世界上最赚钱专利处方药 Liptor的关键成分。该技术的最核心专利是Warner Lambert的Dr.Roth的US5,273,995。许多检索分析教程都把找出该专利作为一个复杂的实战案例。Patentics,只需一步检索就可找出该专利。
       p:b/atorvastatin and g/cite-d

    就是说所有权利要求包含关键词atorvastatin的专利共引用了11092篇专利,其中11092篇中被引用最多为US5,273,995共126次。必须指出,126次仅为本检索集中的局部计数,如果希望知道该专利被全球专利引用的全局计数,可以点击该专利标题,点击“参考引用”,点击“引用本文的专利”即可,共为4762篇,包括许多全球专利。