华为与中兴相关度计算及专利申请方向的计算校正


    没看错,我们是在介绍华为与中兴两个申请人之间的相关度!大家知道,大数据的核心是相关。Patentics以语义相关度计算而闻名与世,我们精确定义了词与词、词与文章、文章与文章之间的相关度,即两个向量之间的内积。我们现在要把这个定义拓广到数万篇华为与数万篇中兴专利之间的相关度,就是说用相关度(一个数)来度量表示任意两组专利之间的相关性。
    Patentics大数据分析,为任意一组专利的向量化表示提供了非常方便的实现。每一个切分的节点和节点的值,就是向量空间的一个维度(坐标)和在该维度上的投影(值)。如果切分越细,则该向量表示越精确。我们造出了近40种的大数据分组方法,我们就有近40种的向量空间表示。最好的表示是根据IPC小组技术的向量空间表示。
    以华为、中兴为例,我们先取2组专利的和集,主搜索检索,ann/(huawei or zte) and na/1得87023篇。

    在分类器右键点击空白处,选择“大数据/分组”,采用分组命令
         ann%2%
         Icl2%1000%
    分组命令解释为,取主搜索结果最多申请量的2个申请人(华为、中兴),并对每一申请人按IPC小组切分出最多申请量的TOP1000个。

    这样,每个申请人都有1000维的IPC小组技术向量来表示。任意2组向量的相关度就可以用向量内积来表示。
    计算2组节点(申请人)间的向量内积,可以用组合来完成。
    右键点击根节点”ann/(Huawei or zte)”,选”组合“,得,

    经计算,得华为与中兴相关度为0.967623

    有了功能强大的”组合“运算,我们希望将相关度计算推广到任意N组向量间,例如,我们希望知道华为、中兴、爱立信、高通、腾讯、百度、小米、联想、奇虎、阿里巴巴间的两两相关度;
    输入10个申请人检索表达式
    ann/(华为 or 中兴 or 爱立信 or 高通 or 腾讯 or 百度 or 小米 or 联想 or 奇虎 or 阿里巴巴) and na/1
    得137933项结果。再在分类器空白处右键点击调用”大数据/分组“,修改申请人2为10(申请量最大top10个申请人);
    分组后,再选”组合/内积”,

    结果是一个相关度矩阵。由于相关度计算是对称的,所以两两之间的相关度可以用上三角矩阵表示。任意两个申请人间的相关度,就是对应行列交叉值。如小米与华为的相关度为0.407353,华为与爱立信的相关度为0.879734,华为与高通的相关度为0.68935,而爱立信与高通相关度为0.827548。从这里我们可以看出,小米与华为不相关,与华为最相关的除

    了中兴(0.967623)外,还有爱立信(0.879734),其次是高通(0.68935)。从这里可以看出,华为若希望提高在无线领域的竞争力,必须提高与高通的相关度,从现在的0.68935至少提高到像爱立信与高通间的相关度(0.827548)。如何提高,答案就在高通那个1000维向量中。中兴与华为几乎是镜像,对华为的分析几乎全盘可以用在中兴。
    小米不与华为相关,小米与腾讯、百度、奇智的相关度分别为0.824809,0.763511,0.810365,很有点像个互联网公司,实际是个移动互联网公司。曾有个服务商,硬要把小米与华为进行对比,那纯属井底观天,乱点鸳鸯谱。
    腾讯、百度、奇智、阿里巴巴这些标准互联网公司之间都是清一色的0.9相关度以上,两两都非常相关。
    这里,最令人困惑的是联想与众多申请人的相关度。除了与小米0.797819最为相关,与其余互联网公司、通讯公司、无线公司都相关度很低,几乎都不大于50%。究其原因,联想IPC小组技术向量的最主要分量上都是偏了。最多的H04M001/725虽说定义为“无绳电话机”,跑了522篇,但高通、爱立信都只有100篇左右。第二位G06F003/0488,高通、爱立信都只有7、8篇,而联想跑了520篇。难怪联想现在需要大批购置专利。

    所以大数据时代,专利申请的方向一定要把握住。几秒钟、几个点击,经常和自己的国内国外的竞争对手的申请方向做个比较,随时进行校正。不然闭着眼睛瞎跑一气,跑了大半天,发现跑偏了,那就晚了。以前,谁都不知道跑偏了方向,自己不知道,其他人也不知道,大家都不知道,糊里糊涂都过去了。现在可不,1000维、2000维的方向向量把你的申请方向算得一清二楚,你不想看,你的竞争对手在看,说不定你的老板也在看。自己前途是小事,关键是误了申请人的大事!
     Excel 下载