流数据分析与管理综述

被引:151
|
作者
金澈清
钱卫宁
周傲英
机构
[1] 复旦大学计算机科学与工程学系
[2] 复旦大学计算机科学与工程学系 上海200433
关键词
流数据; 概要数据结构; 界标模型; 滑动窗口模型;
D O I
10.13328/j.cnki.jos.2004.08.009
中图分类号
TP311 [程序设计、软件工程];
学科分类号
081202 ; 0835 ;
摘要
有关流数据分析与管理的研究是目前国际数据库研究领域的一个热点.在过去30多年中,尽管传统数据库技术发展迅速且得到了广泛应用,但是它不能够处理在诸如网络路由、传感器网络、股票分析等应用中所生成的一种新型数据,即流数据.流数据的特点是数据持续到达,且速度快、规模宏大;其研究核心是设计高效的单遍数据集扫描算法,在一个远小于数据规模的内存空间里不断更新一个代表数据集的结构棗概要数据结构,使得在任何时候都能够根据这个结构迅速获得近似查询结果.综述国际上关于流数据的概要数据结构生成与维护的研究成果,并通过列举解决流数据上两个重要问题的各种方案来比较各种算法的特点以及优劣.
引用
收藏
页码:1172 / 1181
页数:10
相关论文
共 3 条
  • [1] Continuous queries over append-only databases[J] . Douglas Terry,David Goldberg,David Nichols,Brian Oki.ACM SIGMOD Record . 1992 (2)
  • [2] RANDOM SAMPLING WITH A RESERVOIR
    VITTER, JS
    [J]. ACM TRANSACTIONS ON MATHEMATICAL SOFTWARE, 1985, 11 (01): : 37 - 57
  • [3] Accurate estimation of the number of tuples satisfying a condition[J] . Gregory Piatetsky-Shapiro,Charles Connell.ACM SIGMOD Record . 1984 (2)