由捕获到的数据包重组html页面技术[8]

[入库:2005年8月18日] [更新:2007年3月25日]

本文简介:选择自 duxianghe 的 blog

pt; mso-ascii-font-family: 'times new roman'; mso-hansi-font-family: 'times new roman'">数据包的序列号加和数据长度。

综上所述,要恢复某一页面,可根据确认号判定哪些tcp包是用来传输该页面的。先选中任一传输页面的tcp包,得到服务端传输该页面的ack,查找最近接收的包中有哪些tcp包的ack与此ack相同,如果相同,表示这些tcp包都是用来传输同一页面的。按包的seq(序号)顺序,解析这些包,把包中传输数据部分保存下来,这样就得恢复了页面内容。但在此过程中,要注意:是否捕获到了所有的数据包,数据包在传输过程中本身有没有错误等。

具体实现:

1.    如何得到要恢复文件的文件名和文件类型。

当你访问一网页时,很少出现全文本格式的html,大部分网站页面包含很多的图像文件:jpeggif等,flash动画:swf,还有的网站有背景音乐或其它类型文件,保存时不可能以一种文件格式来保存,命名时也是不能以同样一个名称来命名,这就需要我们在保存文件之前先得到文件名和文件类型。

本文关键:数据重组,捕获,
  相关方案
Google
 

本站最佳浏览方式为 分辨率 1024x768 IE 6.0(或更高版本的 IE浏览器)

go top