通用网页数据采集系统的架构和运行机理[16]

[入库:2005年8月19日] [更新:2007年3月24日]

本文简介:选择自 zhengyun_ustc 的 blog

                strhtmlfilepath:html文件路径

                strportalname:门户的汉语拼音

                strreceivedate:该单下载的日期

                strhandlerperiod:该单下载的时间段

                strboardtype:该单的类型

        */

        public string parsefile(。。。。。

 

比如,举个简单的例子,河南的门户可以用这样的正则表达式解析:

<。。。。

 

我们用这种c#代码遍历macthcollection,即可得到named groups(这种特性只有dotnet支持):

.........

本文关键:通用网页数据采集系统的架构和运行机理
 

本站最佳浏览方式为 分辨率 1024x768 IE 6.0(或更高版本的 IE浏览器)

go top