Web信息采集研究进展

被引:24
|
作者
李盛韬
余智华
程学旗
白硕
机构
[1] 中国科学院计算机技术研究所 北京100080
[2] 中国科学院计算机技术研究所
关键词
Web crawling; Web gathering; Search engine; WWW; Agent;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
1.简介随着Internet/Intranet的迅速发展,网络正深刻地改变着我们的生活。而在网上发展最为迅猛的WWW(World Wide Web)技术,以其直观、方便的使用方式和丰富的表达能力,已逐渐成为Internet上最重要的信息发布和传输方式。然而,Web信息的急速膨胀,在给人们提供丰富的资源的同时,又使人们在对它们的有效使用方面面临一个巨大的挑战。为此,人们发展了以Web搜索引擎为主的检索服务,并且随着
引用
收藏
页码:151 / 157 +171
页数:8
相关论文
共 1 条
  • [1] Mercator: A scalable, extensible Web crawler[J] . Allan Heydon,Marc Najork.World Wide Web . 1999 (4)