关于织梦DEDECMS robots文件设置的想法

织梦DEDECMS建站的站长会发现,DEDECMS自带的robots.txt文件设置很简单(开发者基于每一个网站的目录结构和优化目的不一样的 考虑),并不能彻底知足网站的优化要求,那怎样才能结合本身网站的状况,作好robots.txt优化呢?如下介绍一点本身的想法,仅供参考。 php

适用于未伪静态的DEDECMS网站。 html

User-agent: * web

Disallow: /dede 管理后台目录,须要更名,具体设置后面具体讲 缓存

Disallow: /include 程序核心文件目录 安全

Disallow: /member 会员管理目录,有些文件能够开放 工具

Disallow: /plus 插件及辅助功能目录 ,有些文件能够开放,如search.php 测试

Disallow: /templets 默认模板存放目录 优化

Disallow: /data 系统缓存或其它可写入数据存放目录 网站

Disallow: /uploads 上传下载文件保存目录,不想搜索引擎引用图片的话,禁止 搜索引擎

Disallow: /images 系统默认模板图片存放目录

Disallow: /index.php 网站默认首页,静态化的话,最好禁止

Disallow: /404.html

Allow: /plus/search.php 开放禁止目录里的具体文件

...

基本设置就是这样,下面着重讲下后台管理目录和栏目页的设置:

1.dede 目录,为了网站安全考虑须要更名。然而更名以后,你们难免疑惑:改了名,在robots.txt文件里怎么设置呢?直接禁止抓取,仍是泄露了后台目录,等 于更名无效。那么该如何解决这个问题呢?咱们能够经过下面的设置解决这个问题,如后台目录为dedecms:

Disallow: /d*ms

这样咱们就能即禁止了搜索引擎的抓取,又不会泄露了后台目录名称。

2. 栏目页。有些人会注意到,若是网站不作伪静态优化的话,栏目分页后会有两个连接指向栏目首页,如*/web/和*/web/list_1_1.html, 为了网站优化,建议先将栏目分页优化如下(具体作法你们能够在网上找),把首页和第一页的连接改成*/web/的形式,而后在robots.txt文件里 作如下设置:

Disallow: /*1.html$

以上就是DEDECMS robots.txt文件的设置,你们能够根据本身网站的状况具体设置。

注意事项:

1.按官方说明设置好目录权限;

2.后台目录改后的名称开头字母和结尾字母不要和其余目录同样;

3.用百度站长工具测试一下robots.txt文件设置是否有效。

本文由http://www.1886sj.com编辑。

相关文章
相关标签/搜索