数据清理综述

被引:24
|
作者
杨辅祥
刘云超
段智华
机构
[1] 上海大学计算机系
[2] 上海大学计算机系 上海200072
关键词
数据清理; 数据质量; 异常; 记录重复;
D O I
暂无
中图分类号
TP311.131 [];
学科分类号
1201 ;
摘要
由于各种原因 ,数据中存在这样或那样的脏数据需要清理 (净化 )。特别是数据仓库、KDD及TDQM(综合数据质量管理 )中 ,必须对数据进行清理。介绍了数据清理的有关内容、技术与实现方案 ,着重介绍了目前的两个重点研究、应用内容 :异常发现与记录重复
引用
收藏
页码:3 / 5
页数:3
相关论文
共 4 条
  • [1] 决策支持系统及其开发[M].清华大学出版社,陈文伟编著,2000
  • [2] Real-worldDataisDirty:DataCleansingandTheMerge/PurgeProblem[J].MauricioA.Hernández,SalvatoreJ.Stolfo. DataMiningandKnowledgeDiscovery.1998(1)
  • [3] ARKTOS:AToolForDataCleaningandTransformationinDataWarehouseEnvironments.2PanosVassiliadis,etal..
  • [4] AnInteractiveFrameworkforDataTransformationandCleaning.2EsmondGNg..