猫宁!!!html
参考连接:http://help.sogou.com/guide.html?v=1web
虽然是与搜狗搜索相关的,可是在搜索引擎间但是通用的,并且总结的比较到位与全面。算法
第1、网站设计指南数据库
每一个网页都须要有合适的标题,网站首页标题建议使用站点名称或者站点表明的公司、机构名称;其他的内容页面,标题建议作成与正文内容的提炼和归纳,建议格式“页面标题_站点名称”,这可让您的潜在用户经过搜索引擎结果中的标题快速访问到您的页面。安全
充分利用网站首页或者频道首页的 description 标签,提供此网页内容的归纳说明,形式为<meta name="description" content="此网页内容的归纳说明" />,这将帮助用户和搜索引擎增强对你的网站和网页的理解。服务器
网站应该有明晰的导航和层次结构,网站上重要的网页,应该能从网站比较浅层的位置找到,确保每一个页面均可以经过至少一个文本连接到达。网络
为用户提供包含指向网站重要部分的连接的站点地图。若是站点地图中包含的连接数量过多,您应将该站点地图分红多个网页。框架
考虑用户可能使用什么字词来查找您的网页,并在网站中包含这些文字。ide
检查链接是否损坏,确保HTML格式正确,保证用户可以到达每个网站中的页面。工具
尽可能使用文字而不是图片、flash、Javascript等来显示重要的内容或连接,若是必须对文字性内容使用图片,请考虑使用“ALT”属性来加入一些描述性的文字。
尽可能少使用frame和iframe框架结构,经过iframe显示的内容可能会被丢弃
若是网站采用动态网页,减小参数的数量和控制参数的长度将有利于收录。
网站改版或者网站内重要页面连接发生变更时,应该将改版前的页面301永久重定向到改版后的页面。
网站更换域名,应该将旧域名的全部页面301永久重定向到新域名上对应的页面。域名变换后您能够经过站长平台提交域名变换规则告知搜狗搜索您的站点已经更换域名。
第2、网站质量指南
请提供独特且相关的内容,使用户有理由首先访问您的网站。搜狗更喜欢独特的原创内容,若是您的站点内容只是从各处采集复制而成,极可能不会被收录。
谨慎设置您的友情连接,若是您网站上的友情连接,可能是指向一些低质量的、甚至是垃圾或者涉及做弊的站点,那么您的站点可能会受到一些负面影响。
谨慎加入频道共建、内容联盟等不能产生或不多产生原创内容的计划,除非您能为内容联盟创造原创的内容。
搜狗会尽可能收录提供不一样信息的网页,若是您网站上相同的内容能够经过不一样形式展示(如论坛的简版页面、打印页),可使用robots.txt禁止spider抓取您不想向用户展示的形式,这也有助于节省您的带宽。
请不要针对搜索引擎而采用做弊行为,不然会受处处罚。
第3、关于搜狗spider
1. sogou spider User-Agent字段是什么?
Sogou web spider 和 Sogou inst spider。
请注意,根据标准,ua区分大小写。
2. sogou spider 访问个人网站过快怎么办?
sogou spider 对于同一个 IP 地址的服务器主机,只创建一个链接,抓取间隔速度控制在几秒一次。一个网页被收录后,最快也要过几天之后才会去更新。若是持续不断地抓取您的网站,请注意您的网站上的网页是否每次访问都产生新的连接。
若是您认为 sogou spider 对于您的网站抓取过快,请与咱们联系,最好能提供访问日志中sogou spider 访问的部分。点此投诉spider抓取过快。
3. sogou spider 喜欢收录什么样的页面?
内容优良而独特的页面,若是您的页面内容和互联网上已存在的其余页面有高度的类似性,可能不会被 sogou spider 收录。
连接层次较浅的页面,过深的连接层次,尤为是动态网页的连接,会被丢弃而不收录。
若是是动态网页,请控制一下参数的数量和URL的长度。搜狗更偏好收录静态网页。
重定向次数越多的页面,越有可能被 sogou spider 丢弃。
4. sogou spider 如何反应我网站上页面的更新?
sogou spider 会根据网页的重要性和历史变化状况来动态调整更新时间,更新已经抓取过的页面。
5. 如何让 sogou spider 不抓个人网站?
sogou spider 支持 robots 协议,您能够在网站的根目录放置 robots.txt。
robots.txt 的规则请参阅 http://www.robotstxt.org/。须要注意的是,最新更新的 robots.txt 可能须要几个星期才能体现出效果来,另外,被您禁止 sogou spider 收录的网页将不能在搜狗搜索引擎上检索到。
6. 为何个人网站已经加了robots.txt,还能在搜狗搜索出来?
由于搜索引擎索引数据库的更新须要时间。虽然sogou spider已经中止访问您网站上的网页,但搜狗搜索引擎数据库中已经创建的网页索引信息,可能须要数月时间才会清除。另外也请检查您的robots配置是否正确。
若是您的拒绝被收录需求很是急迫,也能够经过删除快照反馈请求处理。
7. 我但愿个人网站内容被搜狗索引但不被保存快照,我该怎么作?
sogou spider遵照互联网meta robots协议。您能够利用网页meta的设置,使搜狗显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。
和robots的更新同样,由于搜索引擎索引数据库的更新须要时间,虽然您已经在网页中经过meta禁止了搜狗在搜索结果中显示该网页的快照,但搜狗搜索引擎数据库中若是已经创建了网页索引信息,可能须要二至四周才会在线上生效。
8. sogou spider 会封锁那些网站?
做弊网站
内容低劣的网站
违反国家政策和法律的网站
9. 如何让 sogou spider 解除对我网站的封锁?
在您的网站的问题改正以后,点此提交申请解封。
第4、收录常见问题
1. 如何让个人网站(独立网站或者blog)被搜狗收录?
搜狗会收录符合用户搜索体验的网站和网页。
为促使搜狗Spider更快发现您的站点,您也能够经过网站收录提交单个页面申请收录,也能够经过使用搜狗站长平台pc站长工具中的sitemap提交申请批量收录。
搜狗会尽可能收录提供不一样信息的网页,若是您网站上相同的内容能够经过不一样形式展示(如论坛的简版页面、打印页),可使用robots.txt禁止spider抓取您不想向用户展示的形式,这也有助于节省您的带宽。
搜狗的网页收录机制,只和网页价值有关,与搜狗推广等商业因素没有任何关联。
提交前提示:
请给每一个网页加上与正文相关的标题。若是是网站首页,则标题建议使用站点名称或者站点表明的公司/机构名称;其他的内容页面,标题建议作成正文内容的提炼和归纳。这可让您的潜在用户经过搜索引擎结果中的标题快速访问到您的页面。
请不要在标题中堆积与正文无关的关键词。
请确保每一个页面均可以经过至少一个文本连接到达。搜狗没法识别Flash中的连接,这些连接所指向的网页,搜狗没法收录。
页面间的连接,尽可能使用平实的超链,而不是重定向跳转。使用自动跳转的页面,可能会被搜狗弄丢。
尽可能少使用frame和iframe框架结构,搜狗有可能会丢弃掉frame的内容页面。
若是是动态网页,请控制一下参数的数量和URL的长度。搜狗更偏好收录静态网页。
在同一个页面上,不要有过多连接。
2. 如何查看个人网站是否被搜狗收录?site语法看到的结果数是否是收录的真实数量?
站长经常会告知咱们搜索结果不显示他们的网站,但其实这些网站仍然收录在搜索结果当中。要判断搜狗是否已经收录您的网站,能够经过执行site语法查看,直接在搜狗搜索框中输入site:您的域名,如site:www.sogou.com,若是能够查询到结果,那您的网站就已经被搜狗收录。 site语法获得的搜索结果数,只是一个估算的数值,仅供参考。
若是您的网站曾经被收录,但如今site语句仍然没法查找到,则多是您的网站因做弊而遭到删除,请查看有关内容,修复全部问题后能够申请解除处罚。
3. 如何让个人网页不被搜狗收录?
搜狗严格遵循搜索引擎Robots协议,详细内容,参见http://www.robotstxt.org/
您能够设置一个Robots文件以限制您的网站所有网页或者部分目录下网页不被搜狗收录。
若是您的网站在被搜狗收录以后才设置robots文件禁止抓取,那么新的robots文件一般会在48小时内生效,生效之后的新网页,将再也不建入索引。须要注意的是,robots.txt禁止收录之前搜狗已收录的内容,从搜索结果中去除可能须要数月。须要立刻删除您能够经过删除快照提交您所须要从搜狗中删除的内容。
4. 为何个人网站内一些不设连接的私密性网页,甚至是须要访问权限的网页,也会被搜狗收录?
sogou spider对网页的抓取,是经过网页与网页之间的连接实现的。
网页之间的连接类型,除了站点内部的页面连接以外,还有不一样网站之间的互相连接。所以,某些网页即使经过您的网站内部连接没法访问到,可是,若是别人的网站上有指向这些页面的连接,那么这些页面仍是会被搜索引擎所收录。
搜狗Spider的访问权限,和普通用户是同样的。所以,普通用户没有权限访问的内容,Spider也没有权限访问。之因此看上去某些访问权限限制内容被搜狗收录,缘由有两点:
A. 该内容在Spider访问时是没有权限限制的,但抓取以后,内容的权限发生了变化。
B. 该内容有权限限制,可是因为网站安全漏洞问题,致使用户能够经过某些特殊路径直接访问。而一旦这样的路径被公布在互联网上,则Spider就会循着这条路径抓出受限内容。
若是您不但愿这些私密性内容被搜狗收录,一方面能够经过robots协议加以限制;另外一方面,也能够经过删除快照反馈给咱们进行解决或者经过站长平台使用死链提交告知咱们对其进行删除。
5. 为何个人网站收录数量愈来愈少?
您的网站所在的服务器不稳定,sogou spider在检查更新时抓取不到网页而被暂时去除。
您的网站不符合用户的搜索体验。
6. 个人网页为何会从搜狗搜索结果中消失?
搜狗并不允诺全部网页均可从搜狗搜索到。
若是您的网页长时间没法从搜狗搜索到,或者忽然从搜狗的搜索结果中消失,可能的缘由有:
A. 您的网页不符合用户的搜索体验
B. 您的网站所在服务器不稳定,被搜狗暂时性去除,稳定以后,问题会获得解决
C. 您的网页内容有不符合国家法律和法规规定的地方
D. 其余技术性问题
如下的说法是错误的和毫无根据的:
A. 参与了搜狗推广但未续费,会从搜狗搜索结果中消失
B. 参与了其余搜索引擎的广告项目,会从搜狗搜索结果中消失
C. 与搜狗旗下网站产生了竞争,会从搜狗搜索结果中消失
D. 从搜狗得到的流量太大,会从搜狗搜索结果中消失
7. 什么样的站点会受到搜狗欢迎?
站点应该是面向用户的,而不是面向搜索引擎的。一个受到用户欢迎的站点,最终也会受到搜索引擎欢迎;反过来,若是你的站点作了不少针对搜狗的优化,但却给用户带来大量负面体验,那么,你的站点最终确定会受到搜狗的处罚。
搜狗更喜欢有原创内容的网页,而不是简单抄袭和采集互联网上已有内容的网页。对于已经被重复了千百遍的内容,搜狗可能会不予收录。
请谨慎使用你的站点连接。与一些垃圾站点作友情连接,极可能会使你的网站受到负面影响。所以,当有人很热情的要求你为他的站点提供友情连接时,请审视如下两点:
A.对方的站点在他那个领域是不是高质量的?站长间所谓的流量以及排名,不少都是用欺骗手段获取的,没法保持长久。
B.对方要求的连接名称是否和对方网站地位相称?用一个涵盖范围普遍的关键词来作一个内容很是局限的网站的连接名称,极可能会使你的网站受到负面影响。
常常保持内容更新。常常有新内容产生的站点,搜狗会注意到,而且大力欢迎,并且会频繁造访。
8. 个人网站更新了,但是搜狗收录的内容还没更新怎么办?
搜狗会按期更新全部网页(包括去除死链无效连接,更新域名变化,更新内容变化)。所以请耐心等一段时间,您的网站上的变化就会被搜狗察觉并修正。若是您急切须要删除或者更新您的网页信息,能够经过快照更新反馈给咱们。
9. 为何个人网站在搜狗收录的数量和其余搜索引擎相比相差不少?
一般状况下,这是正常的现象,不一样的搜索引擎判断网页价值的算法不一样。
第5、排序常见问题
搜狗的目标是为每一个查询词返回最匹配的结果。搜索索引会随着互联网内容的增添或者修改不断发生变化,并且咱们的排名算法也在实时更新,所以,搜索结果中网址的排名可能会发生变化。
若是您的网站已经和网络上其余网站创建起可靠的连接,那么,咱们在下次抓取时便会再次添加您的网站,可是咱们没法保证某一网页老是得到特定的良好的排名。
若是您网站在搜索结果中的排名与以前相比落差很大,请参考如下指南以肯定问题:
A.查看您的robots.txt文件,检查您有没有拦截sogou spider访问本身网站上的任何网址或目录。
B.查看您的网站结构并确保其易于访问,大多数搜索引擎是基于文本的。若是您使用 JavaScript、DHTML、图片或富媒体(例如 Silver light)来建立导航和连接,那么,sogou spider在抓取您的网站时可能会遇到问题。请确保您的内容是能够读取的文本内容,以便用户和sogou spider可以更加容易地对您的网站进行访问。
C.若是您最近调整了您的网站结构,或将网站移到了新的域中,那么,之前排名较高的网页如今可能会排名不佳。为避免出现这种状况,请在您的 .htaccess 文件中使用 301 重定向(“永久重定向”)来灵活地重定向用户、sogou spider 和其余信息采集软件。(在 Apache 中,您可在 .htaccess 文件中进行以上操做;而在 IIS 中,您可经过管理控制台来进行以上操做)有关 301 HTTP 重定向的详细信息,请参阅http://www.ietf.org/rfc/rfc2616.txt。
D.确保您的内容具备实用性。咱们建议您仔细考虑如何尽量为用户带来最佳的体验。
1. 个人网站首页被收录了,但搜索网站名称却排不到第一位,怎么办?
排序算法很是复杂。咱们的目标在于经过算法改进,让用户以最小的成本搜索到所须要的信息。过程当中难免会有各类各样不尽如人意的地方。咱们会很是欢迎您把您遇到的困惑和问题,反馈给咱们。咱们的工程师会对每个问题都会有细致的跟踪和分析,以期将之最终解决。请将您的问题经过意见反馈提交给咱们,以协助咱们改进。
2. 搜索某关键词,个人网页在搜狗搜索结果的排序短时间内变化剧烈,这正常吗?
一般状况下,这是正常的变化。通常来讲,有三类缘由致使排序发生变化:
A. 特定关键词所涉及的您的网页发生了变化
B. 特定关键词所涉及的其余网页发生了变化
C. 搜狗的排序算法发生了变化
3. 搜索某关键词,个人网页在搜狗的排序位置,和在其余搜索引擎的差别很是大,这正常吗?
一般状况下,这是正常的现象。由于不一样搜索引擎的算法,都是不一样的。
4. 我请一些“SEO”来为个人网站或者网页作优化,会有什么后果?
请合理的搜索引擎优化,参见搜狗的网站设计指南、网站质量指南以及做弊的定义与处罚。
A. 特定关键词所涉及的您的网页发生了变化
B. 特定关键词所涉及的其余网页发生了变化
C. 搜狗的排序算法发生了变化
5. 竞争对手是否可以对个人网站排名照成负面影响?
您的竞争对手基本上没法破坏您网站的排名,也不可能阻止您的网站被搜狗收录。若是您认为是连接到您网站的其余网站存在问题,咱们建议您与相关网站的站长联系。
6. sogou Rank是什么?
网页评级(sogou Rank)是搜狗衡量网页重要性的指标,不只考察了网页之间连接关系,同时考察了连接质量、连接之间的相关性等特性,是机器根据sogou Rank算法自动计算出来的,值从0至10级不等。网页评级越高,该网页在搜索中越容易被检索到。
www.sohu.com和sohu.com网页评级不同: www.sohu.com 和 sohu.com 是两个不一样的URL,虽然他们可能指向同一个页面(也就是一般所说的重定向),可是他们自己可能具备不一样的内涵,所以,www.sohu.com和sohu.com被做为不一样的网页来评级的,以便给您推荐更核心更优质的页面。同时,这也提示您,在对外推广的时候,尽可能使用一致的URL写法,以得到更高的网页评级。
如何查询: 直接在搜索框中输入页面的URL,点击搜索或直接回车,便可查询到相应页面的评级。搜索结果第一条会显示该URL的评级、标题、摘要、连接、大小、更新时间等信息,并在下面列举出链向该页面的网页。这些结果,是您优化网页,提高网页评级的重要参考。
如何提高网页评级: 为了提升您的页面的评级,您须要努力提高页面品质,让更多同领域的高评级站点来连接您的页面。同时您须要慎用您的对外连接,尤为是对低质量站点的连接(若是连接到垃圾站点,将极有可能下降您的网页评级)。
如何提高网页评级: 为了提升您的页面的评级,您须要努力提高页面品质,让更多同领域的高评级站点来连接您的页面。同时您须要慎用您的对外连接,尤为是对低质量站点的连接(若是连接到垃圾站点,将极有可能下降您的网页评级)。
更新频率: 网页评级和连接数据每周自动更新一次。
第6、做弊的定义和处罚
1. 搜狗对做弊网站的定义
做弊网站是指在网页设计中,为了提高网页在搜索引擎中的排序,设计者采用的一系列欺骗搜索引擎的作法,主要表现是普通用户看到的页面与搜索引擎抓取到的内容不一致。
A.隐藏文本或连接。在网页中插入了搜索引擎可识别但用户看不见的文本内容或连接。包括使用与背景色相同或十分接近的文本或连接文字、超小号文字、文字隐藏层、页面底部下出现的多余内容、滥用图片 ALT 等;
B.滥用关键词。在网页源代码中大量堆积、重复某些关键词,甚至加入与网站内容绝不相关的热门关键词。
C.恶意互换连接。在网页中互相创建大量指向对方网站的连接。
D.欺骗性重定向、欺骗性更换网页内容。故意制造大量连接指向某一网址或者使用跳转域名欺骗用户进入与搜狗描述不相符的网站。
E.创建大量镜像网站。复制网站或网页的内容并分配以不一样域名和服务器,欺骗搜索引擎对同一页面内容进行屡次索引。
F.页面包含恶意广告、恶意代码或恶意插件。
G.页面有连接指向做弊网站的,可能会被视为做弊网站。
2. 搜狗对做弊网站的处罚
搜狗反做弊系统会实时监控做弊网站,并根据做弊等级对做弊网站进行相应的处罚。
常见处罚:下降网站在搜狗的总体排名;
通常处罚:仅索引正常网页好比首页,其余网页不予收录;
严厉处罚:包含非法内容及恶意程序、用户集中投诉的网站,搜狗将拒绝收录整个网站。
3. 如何举报做弊网站
除了搜狗反做弊系统,咱们也很是欢迎广大用户积极举报做弊网站或网页。若是您发现有以上做弊行为或者包含非法内容的网站,请及时与咱们联系。
打击做弊网站,提高搜索品质,搜狗感谢您的参与!
4. 如何申请解除处罚
被搜狗视为有做弊行为的网站,在清除做弊内容后,点此申请解除做弊处罚。通过搜狗工做人员的审查,若是确认网站已经不存在做弊行为,搜狗将恢复对该网站的正常收录。
解除处罚的网站一旦被发现再次做弊,将会受到更为严厉的处罚。
须要说明的是,搜狗技术和产品部门只对用户搜索体验负责。如下的说法都是错误的和毫无根据的:
A.我成为搜狗的广告客户或者联盟网站,就能够从新被收录
B.我给搜狗若干钱,就能够从新被收录
C.我认识搜狗的某某人,就能够从新被收录
第7、“网站被黑”如何处理
1. 什么是网站“被黑”?
网站被黑,是指黑客利用网站的程序、设置等方面的安全漏洞或管理员安全疏忽(如密码复杂度低),未经管理员受权,对网站进行了篡改(例如添加垃圾内容或者添加其余网页)或者向网站注入恶意代码等。
2. 如何知道是否“被黑”?
A.分析系统日志、服务器日志,检查本身站点的页面数量、流量等是否有异常波动,是否存在异常访问或操做日志
B.检查网站文件是否有不正常的修改,尤为是首页等重点页面
C.网站页面是否引用了未知站点的资源(图片、JS等),是否被放置了外站的异常连接
D.检查网站是否有不正常增长的文件或目录
E.检查网站目录中是否有非管理员打包的网站源码、未知txt文件等
3. 如何处理“被黑”?
若是您的网站被黑或者感染了恶意软件,则应该迅速采起措施进行修复,搜狗建议您进行如下步骤:
避免问题扩大:
A.当即关停本身的网站以免感染其余网站(若是您有权访问本身的服务器则最好将其配置为返回503状态代码);
B.与本身的网络托管商联系了解是否已经采起措施解决问题;
C.更改全部用户和全部帐户的密码(例如,FTP 访问密码、管理员账户密码、内容管理系统受权账户密码);
B.删除全部被串改或被恶意增长的页面,并经过搜狗站长平台经过死链提交告知咱们删除搜狗搜索结果中的被黑数据。
评估损失:
A.使用最新的扫描程序扫描您的计算机,找出任何可能由黑客添加的恶意代码。请务必扫描全部内容,而不是仅扫描基于文本的文件,由于恶意内容每每会嵌入图片中。
B.删除被黑的网页或网址。这样可防止系统向用户提供被黑的网页。
C.向咱们报告网上诱骗网页。
查看 antiphishing.org中针对被黑的网站。
若是您还有其余网站,请检查它们是否也已被黑。
若是有权访问本身的服务器,请继续执行如下步骤:
检查本身的网站中是否有已遭到攻击的开放重定向网址。
根据所用的网站平台,检查 .htaccess 文件 (Apache) 或其余访问控制机制,以找出恶意更改。
检查服务器日志,以查看文件被黑的时间(记住,黑客能更改日志)。查找是否有可疑的活动,例如失败的登陆尝试、命令(尤为是以根用户身份发出的命令)历史记录或未知的用户账户。
清理本身的网站:
清理本身的内容,根据病毒扫描程序识别结果删除黑客添加的全部网页、垃圾内容和可疑代码。若是您备份了内容,则可考虑完全删除本身的内容,而后替换为已知的最新无缺备份(已核实既无漏洞又不含被黑内容的一次备份),能够经过站长平台sitemap提交告知咱们更新数据。
若是有权访问本身的服务器,请继续执行如下步骤:
将全部软件包都更新到最新版本。咱们建议您使用可靠的来源完全从新安装操做系统,以确保删除黑客篡改的全部内容。另外,若是安装了博客平台、内容管理系统或任何其余类型的第三方软件,请务必将其从新安装或进行相应更新。。
确信本身的网站不含漏洞后再改一次密码。
将系统设置为可公开访问。更改服务器配置,使其再也不返回 503 状态代码,而且采起全部其余必要措施向公众开放本身的网站。
申请解除屏蔽:
当您按照以上提示仔细排除异常后,能够告知咱们解除对您网站的屏蔽,在未彻底排除所有异常的状态下提交申请将没法经过咱们的检查,进而没法解除屏蔽。
4. 如何防止“被黑”?
A.按期检查服务器日志等方式发现问题,检查是否有可疑的针对非前台页面的访问;
B.常常检查网站文件是否有不正常的修改或者增长;
C.关注操做系统,以及所使用程序的官方网站。及时下载补丁,修补安全漏洞;必要时建议直接更新至最新版本;
D.修改开源程序关键文件的默认文件名,做弊者一般经过程序自动扫描某些特定的文件是否存在来判断是否使用了某套程序;
E.修改默认管理员用户名,提升管理后台的密码强度,使用字母、数字以及特殊符号多种组合的密码;
F.关闭没必要要的服务以及端口;
G.关闭或者限制没必要要的上传功能;
H.设置防火墙等安全措施;
I.若问题反复出现,建议从新安装服务器操做系统,并从新上传备份的网站文件;
J.缺少专业维护人员的网站,建议向专业安全公司咨询;
第8、从搜狗中删除内容
要从搜索结果中删除内容(包括网页摘要、标题、网页内容,或者整个网址或网站),网站拥有者能够选择使用多种方法。好比,从网页中删除相关信息、将网页从网络中完全删除,以及经过标记告诉搜狗不要抓取相应网页。如下将列举删除内容常见的几种状况。
网站已经更改,删除过期信息:
若是网页内容(不管是内容仍是网页标题或者其余信息)已经更改,则在咱们下次抓取网站并刷新索引前,网页快照仍然会包含原有的内容,于是这些内容仍然会出如今搜索结果中,您能够申请更新快照来更新快照信息,或者经过站长平台sitemap提交来告知咱们更新内容。
我想从搜索结果中完全删除某个网页:
为确保永久删除您的内容,请进行如下某项操做。若是您没有进行相应操做,那么您的网站稍后可能会从新显示在搜索结果中。
A.若是网页已不存在,请确保服务器返回 404(未找到)或 410(不存在)。这样可以让搜狗知道该网页已不存在,无需再在搜索结果中显示。
B.若是网页仍存在,但您不想让其显示在搜索结果中,请使用 robots.txt 阻止 sogou spider 进行抓取。请注意,在一般状况下,即便您已经过 robots.txt 禁止抓取某个网址,但若是咱们在其余网站中发现该网址,仍会将相应网页编入索引。
此外,若是要从搜索结果中删除非 HTML 格式的文件(例如可下载的 PDF),则您或网站站长应确保从服务器中删除该文件。
我想从搜索结果中删除整个网站或某个目录的内容:
若是您是网站拥有者,则须要在验证网站全部权后申请删除整个网站或目录。
为确保永久删除您的目录或网站,请使用 robots.txt 阻止抓取工具访问该目录(若是要删除的是网站,则应阻止抓取工具访问您的整个网站)。咱们建议您在请求删除目录前或请求删除后不久执行该操做。不然,您的内容稍后可能会从新显示在搜索结果中。仅返回 404 HTTP 状态代码还不够,由于可能出现这样一种状况:即某个目录返回了 404 状态代码,却仍然分发其中的文件。经过使用 robots.txt 禁止抓取目录,可确保将目录的全部子项也一并排除。
完成上述某步操做后,您就能够发出删除请求,从搜索结果中删除相应目录及其全部内容。
删除 https://www.example.com 的同时还会删除 http://www.example.com,以及http://example.com 和 https://example.com。
若是您不是网站拥有者,请经过网站联系网站管理员,要求他经过以上步骤进行删除。搜狗没有权利控制互联网中的内容。
请求删除网站时,请务必谨慎。只有在您想从搜狗的索引中永久删除网站的全部内容时,才应该请求删除网站。