文/玄魂php
谷歌网页搜索技术,大部分在百度等搜索引擎中也适用。一样,这些搜索技术是来源于传统数据库检索技术,于是,对这部分的学习,能为后续章节的数据库检索奠基基础,并能得到直观的认识。本部分结合应用实例的讲解也能让咱们加深信息检索对解决实际问题、提升搜索效率的认知。node
同许多搜索引擎同样,当直接在搜索框中输入搜索词时,谷歌默认进行模糊搜索,并能对长短语或语句进行自动拆分红小的词进行搜索。linux
示例:web
给关键词加上半角引号实现精确搜索,不进行分词。sql
示例:"kali linux web渗透测试"shell
谷歌的通配符是星号“*”,必须在精确搜索符双引号内部使用。用通配符代替关键词或短语中没法肯定的字词。数据库
示例:"kali * web渗透测试"apache
与通配符星号“*”不同的是,点号“.”匹配的是字符,不是字、短语等内容。保留的字符有[、(、-等。缓存
示例:app
布尔逻辑是许多检索系统的基本检索技术,在搜索引擎中也同样适用,在谷歌网页搜索中须要注意的是:谷歌和许多搜索引擎同样,多个词间的逻辑关系默认的是逻辑与(空格)。当用逻辑算符的时候,词与逻辑算符之间用须要空格分隔,包括后面讲的各类语法,均要有空格。逻辑非是特例,即减号必须与对应的词连在一块儿。对于复杂的逻辑关系,可用括号分组。
示例:渗透测试玄魂的博客
示例:渗透测试 AND 玄魂的博客
示例:"玄魂的博客" (kali | node)
上图显示的结果为搜索结果中必须包含“玄魂的博客”同时包含“kali”或者“node”的网页。
示例:"玄魂的博客" -kali
上图中显示结果为包含“玄魂的博客”同时不包含“kali”的网页内容。
加号“+”用于强制搜索,即必须包含加号后的内容。通常与精确搜索符一块儿应用。
示例:"玄魂的博客" +"愚蠢的人类"
用两个点号“..”表示一个数字范围。通常应用于日期、货币、尺寸、重量、高度等范围的搜索。用做范围时最好给必定的含义。
示例:kali linux 2010年..2014年
逻辑组配时分组,避免逻辑混乱。括号“()”是分组符号。
示例:见上文 1.5节。
一般标题是内容的高度归纳,在标题中搜索的结果准确率会更高。谷歌搜索中限定搜索网页或文档标题的语法是:intitle或allintitle。allintitle是intitle的变体,至关于在各个搜索词前加上intitle。两者差异不明显,咱们通常直接用intitle。
示例:intitle:"WSO 2.4" [ Sec. Info ], [ Files ], [ Console ], [ Sql ], [ Php ], [ Safe mode ], [ String tools ], [ Bruteforce ], [ Network ], [ Self remove ]
上图 为使用intitle属性查找网站上被黑客上传的WSO后门网页。打开个别网页能够发现webshell。
仅仅在网页或文档的正文部分搜索。谷歌搜索中限定搜索网页或文档正文的语法是:intext或allintext。
示例:intitle:"index" intext:"Login to the Administrative Interface"
此示例结合intitle和intext寻找Web2Py的管理后台。
打开一个连接。
谷歌搜索中限定搜索网址的语法是:inurl。是In-系指令中最强大的一个,换句话说,这个高级指令可以直接从网站的URL入手挖掘信息,只要略微了解普通网站的URL格式,就能够极具针对性地找到你所须要的资源--甚至隐藏内容。网站构建者一般将某一类信息集中在一个网站的目录中,因此搜索URL中的词自己就是对某一方面内容的一个限定。若是在加上必定的词进行组配,搜索结果将更贴近需求。
示例:inurl:phpmyadmin/index.php & (intext:username & password & "Welcome to")
该示例经过url中的特征路径和页面的中的特殊文本,寻找安装有phpmyadmin的站点的对应管理入口。
打开其中的一个连接,以下:
在作网站中有时候用锚点来连接一个页面中的其它部份内容,这样方便浏览和定位。也就是说锚点连接的内容一般是网页内容中重要的章节或内容的开始部分,于是对它们的搜索也更能反映网页的主题内容,提升搜索结果的准确度。对于熟悉网页制做的人来讲,能够从网页源代码中查看有锚点的HTML代码
谷歌网页搜索在锚链连接中语法是:inanchor或allinanchor。搜索范围限制在页面的连接锚点描述文本进行搜索。
示例:inanchor:修改密码
谷歌网页搜索不只仅能搜索网页,还能搜索各类文档,经过文档类型限定只对文档进行搜索,从而不显示页面的内容。语法是:filetype。这个语法很是有用,咱们在网上经常要找一些范文或参考资料的时候经常使用这个语法。filetype是根据文件后缀搜索特定文件类型,好比支持的文档有:pdf、ppt、doc、xls等;网页文件:htm、asp、php等。
示例:filetype:sql site:com and "insert into" admin "2014"
本示例经过filetype 查找sql文件,而且但愿获得的结果为插入admin用户的脚本。搜索结果以下:
打开其中的一个连接,咱们能够看到sql的内容。
用cache语法的通常状况是:当一个连接没法访问时(或信息被屏蔽时);当信息已经被修改,想看之前的信息时。
示例:cache:www.xuanhun521.com
related语法对于发现某一类信息很是有用,好比当你用related搜索一个图书馆网址的时候会出来大量图书馆的网站,如【related:lib.nit.net.cn】;当搜索某期刊网址的时候,能搜索出大量给学科领域的相关期刊,如【related:www.lis.ac.cn】。
示例:related:www.kali.org
搜索全部连接到某个特定URL上的页面.
例如,想搜索全部连接www.xuanhun521.com的页面,但要排除本站网页。
示例:link:www.xuanhun521.com -site:www.xuanhun521.com
搜索范围限制在某网站或顶级域名中。
示例:site:www.xuanhun521.com
第一个示例,咱们经过下面的查询语句,查找能够未经受权就能够访问的phpMyAdmin的后台页面。
寻找一个页面,点开看看:
第二个示例,咱们搜索可能存在openssl心脏出血漏洞的站点。
这个搜索可谓一举多得,由于apache暴露ssl版本的页面通常是可枚举的目录页面,在这样的页面中咱们能够探究网站的组织目录。
原文连接:http://www.xuanhun521.com/Blog/2014/8/13/google-hack-%E4%B9%8B-%E6%9F%A5%E8%AF%A2%E8%AF%AD%E6%B3%95
ps:对此文章感兴趣的读者,能够加qq群:Hacking:303242737;Hacking-2群:147098303;Hacking-3群:31371755;hacking-4群:201891680;Hacking-5群:316885176