搜索引擎中用户行为特征分析[1]

[入库:2005年8月18日] [更新:2007年3月25日]

本文简介:选择自 hwalk 的 blog

搜索引擎维护的两类信息:

       网页相关信息(通过信息获取部分获取);用户行为信息(通过log记录获取)

 

传统ir技术:(information retrieval

       文档的向量空间模型

       tf*idf算法

              ╠╠╠利用web信息本身的特点和用户行为信息补充

              ╠╠╠分析网页通过超连接形成的有向图

       google    随机冲浪模型       pagerank技术排序

       ibm clever      权威型&目录型网页    hits计算权值

       天网       lhnlink hit number)计算权值

本文关键:搜索引擎中用户行为特征分析
 

本站最佳浏览方式为 分辨率 1024x768 IE 6.0(或更高版本的 IE浏览器)

go top