搜索:“搜索引擎 技巧 site:tech.sina.com.cn”
结果:已在tech.sina.com.cn搜索有关搜索引擎 技巧 的中文(简体)网页。 共约有163项查询结果,这是第1-10项 。 搜索用时0.07秒。
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
8.2、在某一类文件中查找信息
“filetype:”是google开发的非常强大实用的一个搜索语法。也就是说,google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,google已经能检索微软的office文档如.xls、.ppt、.doc,.rtf,wordperfect文档,lotus1-2-3文档,adobe的.pdf文档,shockwave的.swf文档(flash动画)等。其中最实用的文档搜索是pdf搜索。pdf是adobe公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前google检索的pdf文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。pdf文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索几个资产负债表的office文档。
搜索:“资产负债表 filetype:doc or filetype:xls or filetype:ppt”
结果:已搜索有关资产负债表 filetype:doc or filetype:xls or filetype:ppt的中文(简体)网页。 共约有481项查询结果,这是第1-10项 。 搜索用时0.04秒。
注意,下载的office文件可能含有宏病毒,谨慎操作。
示例:搜索一些关于搜索引擎知识和技巧方面的pdf文档
搜索:“"search engine" tips or tutorial filetype:pdf”
结果:已向英特网搜索"search engine" tips or tutorial filetype:pdf. 共约有12,600项查询结果,这是第1-10项 。 搜索用时0.22秒。
我们来看其中的一个结果:
[pdf]search engines tips
文档类型: pdf/adobe acrobat - html 版
... http://www.google.com/press/zeitgeist.html see what people are searching on at google.com
* search engine watch http://searchenginewatch.com/ some free tips ...
www.allvertical.com/promokits/searchenginetips.pdf - 类似网页
可以看到,google用[pdf]来标记这是一个pdf的文档检索,另外,它还给出了该pdf文档的html版本,该html版保留了文档的文字内容和结构,但没有图片。
8.3、搜索的关键字包含在url链接中
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“mp3”、“gallary”等,于是,就可以用inurl语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。inurl语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找midi曲“沧海一声笑”。
搜索:“inurl:midi “沧海一声笑””
结果:已搜索有关inurl:midi "沧海一声笑"的中文(简体)网页。 共约有27项查询结果,这是第1-10项 。 搜索用时0.34秒。
注意:“inurl:”后面不能有空格,google也不对url符号如“/”进行搜索。例如,google会把“cgi-bin/phf”中的“/”当成空格处理。
“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。
示例:查找可能具有phf安全漏洞的公司网站。通常这些网站的cgi-bin目录中含有phf脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
搜索:“allinurl:"cgi-bin" phf +com”
结果:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有51项查询结果,这是第1-10项 。 搜索用时0.11秒。
8.4、搜索的关键字包含在网页标题中
“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对url进行查询,而前者对网页的标题栏进行查询。网页标题,就是html标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 "写真集"”
结果:已搜索有关intitle:藤原纪香 "写真集"的中文(简体)网页。 共约有315项查询结果,这是第1-10项 。 搜索用时0.15秒。
8.5、搜索的关键字包含在网页的“锚”(anchor)链点内
所谓“锚”,就是在同一个网页中快速切换链接点。与url和title类似,google提供了两种对anchor的检索,“inanchor”和“allincnchor”。对此不作详述。
google从入门到精通 v4.0 (三)
9、其他罕用语法
9.1、搜索所有链接到某个url地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页 。 共约有920项查询结果,这是第1-10项 。 搜索用时0.12秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被google忽略。另外还要说明的是,link只列出google索引链接很小一部分,而非全部,所以如果你用google没有搜到链到你的主页的链接,也不必灰心丧气。 除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,也许可以找到更多符合你兴趣的内容。
9.2、查找与某个页面结构内容相似的页面
“related”用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:wwwsina.com.cn/index.shtml”。我到现在也不明白这个语法有什么作用,如果有谁知道,请不吝指教。预先感谢。:)
9.3、从google服务器上缓存页面中查询信息
“cache”用来搜索google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
其它罕用语法如info、stock等不一一介绍,有兴趣的读者可以参阅google大全。