基于Doc2vec的专利与行业类目映射研究

被引:2
|
作者
马晓萌 [1 ]
徐峰 [1 ]
刘清民 [1 ]
封颖 [1 ]
机构
[1] 中国科学技术信息研究所战略研究中心
关键词
Word2vec; Doc2vec; 类目映射; 余弦相似度;
D O I
暂无
中图分类号
G254.1 [分类法];
学科分类号
1205 ; 120501 ;
摘要
[目的/意义]使用深度学习中Doc2vec文本向量化的方法进行专利与行业间类目相似度的计算,旨在为用计算机进行类目映射时提供新的方法和思路。[方法/过程]实验通过《国际专利分类表》的小类及其下级类目大组与《国民经济行业分类表》中的小类展开,通过Doc2vec文本向量化和余弦相似度的方法求取三组相似值(专利小类与行业小类、专利大组与行业小类、每组专利小类下大组与行业小类相似度的平均值),并以农业类目为例进行解释说明。[结果/结论]通过计算专利大组与行业小类相似度平均值的方法进行映射更具合理性。
引用
收藏
页码:67 / 74
页数:8
相关论文
共 14 条