国内中文自动分词技术研究综述

被引:95
|
作者
奉国和 [1 ]
郑伟 [2 ]
机构
[1] 华南师范大学经济管理学院
[2] 河北北方学院理学院
关键词
中文分词; 分词算法; 歧义消除; 未登录词; 分词系统;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
认为分词是文本自动分类、信息检索、信息过滤、文献自动标引、摘要自动生成等中文信息处理的基础与关键技术之一,中文本身复杂性及语言规则的不确定性,使中文分词技术成为分词技术中的难点。全面归纳中文分词算法、歧义消除、未登录词识别、自动分词系统等研究,总结出当前中文分词面临的难点与研究热点。
引用
收藏
页码:41 / 45
页数:5
相关论文
共 29 条