自学习智能搜索引擎算法概述

[入库:2005年8月18日] [更新:2007年3月25日]

本文简介:选择自 pclion 的 blog

一个大型的网页搜索引擎需要极高效的搜索算法。如果仅仅依靠数据库的全文搜索能力,效率是很低的。传统提高效率的关键,是优化网页数据库的存储结构和索引。然而,当面临巨大的数据时,搜索结果是十分令人不满意的。象google那样的搜索引擎,不是传统的搜索算法所能做到。

搜索的结果,是要提供给人们最有效的结果集。人脑的记忆与遗忘算法可以为我们提供借鉴。因为人脑不是把所有数据都当成一样重要地存储着,而是善于“遗忘”的。越多次被访问的数据,在人脑记忆中就显得越重要,也就越易于被人回忆(搜索)到;而长期未被访问的数据,就会被人脑遗忘。人脑的记忆遗忘机制为存储搜索提供了高效的搜索性能。

基于这个原理,我设计了一种高效的搜索算法。下面描述之。

(算法略)

本文关键:自学习智能搜索引擎算法概述
  相关方案
Google
 

本站最佳浏览方式为 分辨率 1024x768 IE 6.0(或更高版本的 IE浏览器)

go top