GOOGLE从入门到精通

一,GOOGLE简介
Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Se
rgey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代I
nktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。
98年至今,GOOGLE已经得到30多项业界大奖。

二,GOOGLE特点
GOOGLE支持多达132种语言,包括简体中文和繁体中文;
GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE速度极快,听说有8000多台服务器,200多条T3级宽带;
GOOGLE的专利网页级别技术PageRank可以提供高命中率的搜索结果;
GOOGLE的搜索结果摘录查询网页的部分具体内容,而不只仅是网站简介;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;
GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。 html

三,基本搜索 windows

GOOGLE的基本搜索语法:+,-,OR
GOOGLE无需用明文的“+”来表示逻辑“与”操做,只要空格就能够了。 浏览器

示例:搜索全部包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有988项查询结果,这是第
     1-10项。搜索用时0.30秒。
注意:文章中搜索语法外面的引号仅起引用做用,不能带入搜索栏内。 缓存

GOOGLE用减号“-”表示逻辑“非”操做。 安全

示例:搜索全部包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 -吸星大法”
结果:已搜索有关易筋经 -吸星大法的中文(简体)网页。共约有6,030项查询结果,这是
     第1-10项。搜索用时0.20秒。
注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外
,操做符与做用的关键字之间,不能有空格。好比“易筋经 - 吸星大法”,搜索引擎将
视为逻辑“与”操做,中间的“-”被忽略。 服务器

GOOGLE不支持关键字为中文的逻辑“或”查询,但支持英文关键字的“或”操做,语法
是大写的“OR”。 cookie

示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者二者均有的中文网页
搜索:“britney OR beatles”
结果:已搜索有关beatles OR britney的中文(简体)网页。共约有19,800项查询结果,
     这是第1-10项。搜索用时0.35秒。
搜索:“布兰妮 OR 披头士”
结果:找不到和您的查询-布兰妮 OR 披头士-相符的网页。 网络

“+”和“-”的做用有的时候是相同的,都是为了缩小搜索结果的范围,提升查询结果
命中率。 antd

例:查阅天龙八部具体是哪八部。
分析:若是光用“天龙八部”作关键字,搜索结果有26,500项,并且排前列的主要与金
   庸的小说《天龙八部》相关,很难找到所须要的资讯。能够用两个方法减小无关结果。 工具

1,若是你知道八部中的某一部,好比阿修罗,增长“阿修罗”关键字,搜索结果就只有
995项,能够直接找到所有八部,“天龙八部 阿修罗”。

2,若是你不知道八部中的任何一部,但知道这与佛教相关,能够排除与金庸小说相关的
记录,查询结果为1,010项,能够迅速找到须要的资料,“天龙八部 佛教 -金庸”。

四,辅助搜索

GOOGLE不支持通配符,如“*”、“?”等,只能作精确查询,关键字后面的“*”或者“
?”会被忽略掉。
GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是同样的。
GOOGLE的关键字能够是词组(中间没有空格),也能够是句子(中间有空格),可是,
用句子作关键字,必须加英文引号。

示例:搜索包含“long, long ago”字串的页面。
搜索:“"long, long ago"”
结果:已向英特网搜索"long, long ago". 共约有24,600项查询结果,这是第1-10项。
      搜索用时1.23秒。
注意:GOOGLE对中文句子做智能化处理,会自动把句子分割成词语做为关键词。好比,
搜索包含“啊 个人太阳”这样句子,“"啊 个人太阳"”,并无搜到彻底匹配的结果
,可是,GOOGLE以“啊”、“个人”、“太阳”等词语为关键词,给出了符合诸如“啊
,个人太阳”这样的结果。

GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及
一些符号如“*”、“.”等,做忽略处理,若是用户必需要求关键字中包含这些经常使用词
,就要用强制语法“+”。

示例:搜索包含“Who am I ?”的网页。若是用“"who am i ?"”,“Who”、“I”、
     “?”会被省略掉,搜索将只用“am”做关键字,因此应该用强制搜索。
搜索:“"+who am +i"”
结果:已向英特网搜索"+who am +i". 共约有310,000项查询结果,这是第1-10项。搜索
     用时0.30秒。
注意:英文符号没法成为搜索关键字,增强制也不行。

五,高级搜索


GOOGLE的经常使用高级搜索语法:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu
.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。若是是要排除某网站
或者域名范围内的页面,只需用“-网站/域名”。

示例:搜索中文教育科研网站(edu.cn)上全部包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有3,780项查询结果,这是
     第1-10项 。搜索用时0.31秒。

示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有722项查询结果,
     这是第1-10项。搜索用时0.34秒。
注意:site后的冒号为英文字符,并且,冒号后不能有空格,不然,“site:”将被做为
一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“
/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”
方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
“link”语法返回全部连接到某个URL地址的网页。

示例:搜索全部含指向华军软件园“www.newhua.com”连接的网页。
搜索:“link:www.newhua.com”
结果:搜索有连接到www.newhua.com的网页。共约有883项查询结果,这是第1-10项。搜
     索用时0.23秒。
注意:“link”不能与其余语法相混合操做,因此“link:”后面即便有空格,也将被G
OOGLE忽略。

inurl语法返回的网页连接中包含第一个关键字,后面的关键字则出如今连接中或者网页
文档中。有不少网站把某一类具备相同属性的资源名称显示在目录名称或者网页名称中
,好比“MP3”、“GALLARY”等,因而,就能够用INURL语法找到这些相关资源连接,然
后,用第二个关键词肯定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在
于,前者一般能提供很是精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有21项查询结果,这
     是第1-10项。搜索用时0.01秒。

示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有23
     4项查询结果,这是第1-10项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对
“cgi-bin/phf”中的“/”当成空格处理。

allinurl语法返回的网页的连接中包含全部查询关键字。这个查询的对象只集中于网页
的连接字符串。

示例:查找可能具备PHF安全漏洞的公司网站。一般这些网站的CGI-BIN目录中含有PHF脚
     本程序(这个脚本是不安全的),表如今连接中就是“域名/cgi-bin/phf”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有48项查询结果,这是第1
     -10项。搜索用时0.06秒。

allintitle和intitle的用法相似于上面的allinurl和inurl,只是后者对URL进行查询,
而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言中<title>和</title>之
间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题
中。所以,只查询标题栏,一般也能够找到高相关率的专题页面。

示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有121项查询结果,
     这是第1-10项。搜索用时0.03秒。

GOOGLE的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面类似的网页。例:搜索全部与中文新浪网主页类似的页面
(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtm
l”。
cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,一般用于查找
某些已经被删除的死连接网页或者某些被ISP封掉的网站的页面,至关于使用普通搜索结
果页面中的“网页快照”功能。

示例:查找某IP被封的网站页面。
搜索:“cache:www.giantdot.com/GB/politics/index.asp”
结果:This is G o o g l e's cache of http://www.giantdot.com/GB/politics/ind
      ex.asp.
G o o g l e 已先预览各网站,拍下网页的快照存档。
这网页可能有更新的版本,请按此查看新版。
Google 和网页做者无关,不对网页的内容负责。
...
info用来显示与某连接相关的一系列搜索,提供cache、link、related和彻底包含该链
接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索:“info:www.sina.com.cn”
结果:有关www.sina.com.cn的网页信息。
新浪首页
北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男
人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |,
软件下载. ...
Google 提供这个网址的信息:
查看Google网页快照里www.sina.com.cn的存档
寻找和www.sina.com.cn相似的网页
寻找网页有连接到www.sina.com.cn
寻找网页包含有"www.sina.com.cn"

六,其余
目录服务
若是不想搜索网页,而是想寻找某些专题网站,能够访问GOOGLE的分类目录“http://d
irectory.google.com/”,中文目录是“http://directory.google.com/Top/World/Ch
inese_Simplified/”。不过因为GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对
比较小,所以中文目录下收录站点不多。

工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就
能够在工具条内输入关键字进行搜索。此外,工具条还提供了其余许多功能,如显示页
面PageRank等。最方便的一点在于用户能够快捷的在GOOGLE主页、目录服务、新闻组搜
索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,能够访问“http://toolb
ar.google.com/”,按页面提示能够自动下载并安装。

新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,
GOOGLE将DEJA收购并提供了全部DEJA的功能。如今,除了搜索以外,GOOGLE还支持新闻
组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。惋惜如今尚未中
文界面。由于新闻组中的帖子实在是多,因此我点击“Advaced Groups Search”进入高
级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面
提供对关键字、新闻组、主题、做者、帖子序号、语言和发布日期的条件搜索。其中做
者项指做者发帖所用的惟一识别号电子信箱。好比要在alt.chinese.text内搜索著名老
牌网络写手图雅的帖子,能够用下列指令“group:alt.chinese.text author:tuya@ccm
ail.uoregon.edu”。不过通常而言,我更推荐使用图形搜索界面,方便并且直观。
新闻组内的信息与普通网页相比就是迅速并且实用。好比你要考MCSE,那么alt.certif
ication.mcse是必定要去看看的,而后再用braindump关键词搜索一下,考试就事半功倍
了。

PDF文档搜索
我对GOOGLE尤为欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文
档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,如今已
经成为互联网的电子化出版标准。PDF文档一般是一些图文并茂的综合性文档,提供的资
讯通常比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有26,100项查询结果,这是第1-10项
     。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin
, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
通常文字档 - 相似网页
能够看到,GOOGLE在PDF档前加上了[PDF]的标记,并且,GOOGLE把PDF文件转换成了文字
档,点击“通常文字档”,能够粗略的查看该PDF文档的大体内容。固然,PDF原有的图
片以及格式是没有了。

七,关键词的选择
关键词的选择在搜索中起到决定性的做用,全部搜索技巧中,关键词选择是最基本也是
最有效的。
案例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:若是按照通常的思路,找某部小说中的具体段落,就须要用搜索引擎先找到这本
书,而后再翻到该段落。这样作固然能够,可是效率很低。若是了解目标信息的构成,
用一些目标信息所特有的字词,能够很是迅速的查到所须要的资料。也就是说,高效率
的搜索关键字不必定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱
的关系时,之乎者也横飞。所以,能够用特定的词语一会儿找到目标资料。
搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:
今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒
昧淡之,故而贱之;醋味厚之,因此贵之。...”
以上的关键字选择技巧能够谓之“特定词法”。

案例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,若是只用“黄花闺女 黄花”作关键词,搜索结
果将浩如烟海,没什么价值,所以必需要加更多的关键词,约束搜索结果。选择什么关
键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”
、“渊源”等,能够猜到的是,相似的资料,应该包含在一些民俗介绍性的文字里,所
以用诸如“来历”、“由来”、“出典”等词汇的几率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿
阳公主相关。若是想得到第一手资料,那就能够用“太平御览 寿阳公主”作搜索了。
以上的关键字选择技巧能够谓之“近义词法”。

案例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我作的搜索,我把它做为搜索案例而已,没其余的意思
。很是直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,满是一些诸
如“刘德华取笑莫文蔚胸围过小”之类的八卦新闻,没法快速获得所须要的资料。能够
想到的是,须要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括
他的身高,体重,生日等一系列相关信息。OK,这样就能够进一步的增长其余约束性关
键词以缩小搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的状况发生了,网上煊赫一时的痞子蔡《第一
次亲密接触》里竟然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、
“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高
-阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为何用“阿泰”而不用“第
一次亲密接触”呢?这是由于小说的名字被转载的时候可能有变更,但里面角色的名字
是不会变的。
以上的关键字选择技巧能够谓之“相关词法”。

八,经常使用搜索个案
例一:找人
分析:一我的在网上揭示的资料一般有:姓名,网名,性别,年龄,毕业学校,工做单
位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。因此,若是你要了
解一下你多年没见过的同窗,那不妨用上述信息作关键字进行查询,也许会有大的收获

例二:找软件
分析一:最简单的搜索固然就是直接以软件名称以及版本号为关键字查询。可是,仅仅
有软件名称和目标网站,显然还不行,由于搜索到的多是软件的相关新闻。应该再增
加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,
所以,能够增长“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是
第1-10项。搜索用时0.22秒。

分析二:不少网站设有专门的下载目录,并且就命名为“download”,所以,能够用IN
URL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0 inurl:download的中文(简体)网页。共约有358项查询结
果,这是第1-10项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,由于供下载的软件有可能带有病毒或者捆绑了
木马,因此,对下载网站做一个限定,是一个稳妥的思路。能够用SITE语法达到这个目
的。
共享软件下载完以后,使用的时候,软件总跳出警示框,或者软件的功能受到必定限制
。因为中国的网民可能是穷棒子,因此应该再找一个注册码。找注册码,除了软件的名称
和版本号外,还须要有诸如“serial number”、“sn”、“序列号”等关键字。如今,
来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第1-10项。搜索用
时0.30秒。

例三:找图片
分析一:专门的图片集合,提供图片的网站一般会把图片放在某个专门目录下,如“ga
llary”、“album”、“photo”、“image”等。这样就可使用INURL语法迅速找到这
类目录。如今,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurl:photo”
结果:已向英特网搜索"britney spears" inurl:photo. 共约有2,720项查询结果,这是
第1-10项。搜索用时0.23秒。

分析二:提供图片集合的网页,在标题栏内一般会注明,这是谁谁的图片集合。因而就
能够用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这
是第1-10项。搜索用时0.40秒。

分析三:明星的FANS一般会申请免费我的主页来存放他们偶像的靓照。因而用SITE语法
指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结
果,这是第1-10项。搜索用时0.47秒。

例四:找MP3
分析一:提供MP3的网站,一般会创建一个叫作MP3的目录,目录底下分门别类的存放各
种MP3乐曲。因此,能够用INURL语法迅速找到这类目录。如今用这个办法找找老歌“sa
y you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第1
-10项。搜索用时0.17秒。

分析二:也能够经过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第
1-10项。搜索用时0.73秒。
固然,若是你知道某个网站的下载速度快,并且乐曲全,就能够用SITE语法先到该网站
上看看有没有目标乐曲。

例四:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,好比文艺类的“www.shuk
u.net”。因而能够用SITE语法很简单的找到某本书(若是该网站上有的话)。好比,“
旧唐书 site:shuku.net”,就能够立刻找到该书。若是没有,一般别的网站上也很难找
到。所以,找书的关键,是你了解一大批著名的图书馆网站。

分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也
是极其有用的,固然,这得创建在你已经读过该书,对书的内容有印象的基础上。好比
若是了解堂吉诃德一书战风车的大体内容,就能够用“吉诃德 风车 桑乔”迅速找到该
书。

九,GOOGLE搜索FAQQ:如何全面的了解google.com?A:查看网站相关页面“http://www.google.com/about.html”。Q:如何切换google.com的初始语言界面?A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你指望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。须要提醒的是,GOOGLE用cookie记录这个偏好,因此若是你把浏览器的cookie功能关掉,就没法进行设定。Q:如何设定每页搜索结果显示数量?A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果须要的时间越长,默认是10项。Q:搜索到的连接没法打开怎么办?A:连接没法打开的缘由不少,好比网站当机,或者ISP过滤等,能够点击GOOGLE的“网页快照”查看在GOOGLE服务器上的网页缓存。Q:打开搜索结果的连接,但是该页面太大,很难找到一会儿找到目的资料怎么办?A:直接打开“网页快照”,GOOGLE会把关键词用不一样颜色标记出来,很容易找到。