首页
学术期刊
论文检测
AIGC检测
热点
更多
数据
数据清洗方法研究综述
被引:23
|
作者
:
论文数:
引用数:
h-index:
机构:
赵一凡
[
1
]
卞良
论文数:
0
引用数:
0
h-index:
0
机构:
宁夏医科大学统战部
宁夏医科大学公共卫生与管理学院
卞良
[
2
]
论文数:
引用数:
h-index:
机构:
丛昕
[
3
]
机构
:
[1]
宁夏医科大学公共卫生与管理学院
[2]
宁夏医科大学统战部
[3]
滨州医学院烟台附属医院门诊部
来源
:
软件导刊
|
2017年
/ 16卷
/ 12期
关键词
:
数据预处理;
数据清洗;
数据质量;
缺失值;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
1201 ;
摘要
:
数据是数据挖掘和应用的重要保证,"脏数据"会导致不可靠输出,这种输出导致的结果有可能难以弥补。因此,数据清洗方法研究意义重大。阐述了数据预处理过程中的数据清洗方法,介绍了缺失值填充及去除数据噪声的常用方法,总结了数据挖掘的应用前景,展望了数据清洗研究方向。
引用
收藏
页码:222 / 224
页数:3
相关论文
共 9 条
[1]
数据预处理在图书借阅中的应用
罗艳霞
论文数:
0
引用数:
0
h-index:
0
机构:
莆田学院信息工程学院
罗艳霞
王庭熙
论文数:
0
引用数:
0
h-index:
0
机构:
莆田学院信息工程学院
王庭熙
骆绍晔
论文数:
0
引用数:
0
h-index:
0
机构:
莆田学院信息工程学院
骆绍晔
[J].
莆田学院学报,
2016,
23
(02)
: 50
-
53
[2]
美国纵向调查中缺失数据的应对方法及对我国的启示
论文数:
引用数:
h-index:
机构:
于力超
论文数:
引用数:
h-index:
机构:
金勇进
[J].
现代管理科学,
2015,
(09)
: 33
-
35
[3]
缺失数据插补方法探讨——基于最近邻插补法和关联规则法
论文数:
引用数:
h-index:
机构:
于力超
论文数:
引用数:
h-index:
机构:
金勇进
论文数:
引用数:
h-index:
机构:
王俊
[J].
统计与信息论坛,
2015,
30
(01)
: 35
-
40
[4]
基于连续阈值函数的小波去噪方法
论文数:
引用数:
h-index:
机构:
王艺龙
论文数:
引用数:
h-index:
机构:
杨守志
[J].
汕头大学学报(自然科学版),
2013,
28
(04)
: 66
-
74
[5]
二分类Logistic回归插补法及其应用
论文数:
引用数:
h-index:
机构:
戴明锋
论文数:
引用数:
h-index:
机构:
金勇进
论文数:
引用数:
h-index:
机构:
查奇芬
论文数:
引用数:
h-index:
机构:
刘寅飞
[J].
数学的实践与认识,
2013,
43
(21)
: 162
-
167
[6]
一种条件函数依赖挖掘算法的分析与实现
论文数:
引用数:
h-index:
机构:
周健昌
刘波
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学信息科学与技术学院
暨南大学信息科学与技术学院
刘波
[J].
计算机与数字工程,
2012,
40
(09)
: 8
-
11
[7]
基于Logistic回归的近邻择优插补法[D]. 刘燕.天津财经大学 2013
[8]
数据清洗方法在电力企业数据中心的应用研究[D]. 张兴华.兰州理工大学 2011
[9]
MVC—a preprocessing method to deal with missing values[J] . A. Ragel,B. Crémilleux.Knowledge-Based Systems . 1999 (5)
←
1
→
共 9 条
[1]
数据预处理在图书借阅中的应用
罗艳霞
论文数:
0
引用数:
0
h-index:
0
机构:
莆田学院信息工程学院
罗艳霞
王庭熙
论文数:
0
引用数:
0
h-index:
0
机构:
莆田学院信息工程学院
王庭熙
骆绍晔
论文数:
0
引用数:
0
h-index:
0
机构:
莆田学院信息工程学院
骆绍晔
[J].
莆田学院学报,
2016,
23
(02)
: 50
-
53
[2]
美国纵向调查中缺失数据的应对方法及对我国的启示
论文数:
引用数:
h-index:
机构:
于力超
论文数:
引用数:
h-index:
机构:
金勇进
[J].
现代管理科学,
2015,
(09)
: 33
-
35
[3]
缺失数据插补方法探讨——基于最近邻插补法和关联规则法
论文数:
引用数:
h-index:
机构:
于力超
论文数:
引用数:
h-index:
机构:
金勇进
论文数:
引用数:
h-index:
机构:
王俊
[J].
统计与信息论坛,
2015,
30
(01)
: 35
-
40
[4]
基于连续阈值函数的小波去噪方法
论文数:
引用数:
h-index:
机构:
王艺龙
论文数:
引用数:
h-index:
机构:
杨守志
[J].
汕头大学学报(自然科学版),
2013,
28
(04)
: 66
-
74
[5]
二分类Logistic回归插补法及其应用
论文数:
引用数:
h-index:
机构:
戴明锋
论文数:
引用数:
h-index:
机构:
金勇进
论文数:
引用数:
h-index:
机构:
查奇芬
论文数:
引用数:
h-index:
机构:
刘寅飞
[J].
数学的实践与认识,
2013,
43
(21)
: 162
-
167
[6]
一种条件函数依赖挖掘算法的分析与实现
论文数:
引用数:
h-index:
机构:
周健昌
刘波
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学信息科学与技术学院
暨南大学信息科学与技术学院
刘波
[J].
计算机与数字工程,
2012,
40
(09)
: 8
-
11
[7]
基于Logistic回归的近邻择优插补法[D]. 刘燕.天津财经大学 2013
[8]
数据清洗方法在电力企业数据中心的应用研究[D]. 张兴华.兰州理工大学 2011
[9]
MVC—a preprocessing method to deal with missing values[J] . A. Ragel,B. Crémilleux.Knowledge-Based Systems . 1999 (5)
←
1
→