C4.5算法的优化

被引:16
|
作者
黄秀霞 [1 ]
孙力 [1 ]
机构
[1] 江南大学物联网工程学院
关键词
C4.5算法; 泰勒级数; 等价无穷小; GINI指数的均值; 非类属性间关联性; GC4.5算法;
D O I
10.16208/j.issn1000-7024.2016.05.029
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非类属性间冗余度问题导致的误差,提高算法属性选择的准确性,将改进后的算法称为GC4.5。对GC4.5、传统C4.5算法与其它改进算法进行对比实验分析,分析结果表明,GC4.5算法在分类效率和准确性上都有一定提高。
引用
下载
收藏
页码:1265 / 1270 +1361
页数:7
相关论文
共 8 条