通用网页数据采集系统的架构和运行机理[8]

[入库:2005年8月19日] [更新:2007年3月24日]

本文简介:选择自 zhengyun_ustc 的 blog

目前采用的数据库是mssqlserver

 

架构图如下所示:

1-1 架构图


2 网页抓取层-spider.crawler

摘要:本章节简单介绍了spider.crawler层如何抓取网页并落地。

2.1.抓取背景知识

本文关键:通用网页数据采集系统的架构和运行机理
 

本站最佳浏览方式为 分辨率 1024x768 IE 6.0(或更高版本的 IE浏览器)

go top