SEO、连接、a 标签、HTTP 状态码、link 标签、alternate、canonicalphp
唐朝
有个小伙叫韦固喜欢在河边玩,一天遇到一个老伯伯在月光下把两块石头系在一块儿。小伙看到很好奇便问道“系石头作什么呢?”老伯伯说“我在给当婚人牵线,这对石头是一对夫妻。”小伙问道:“那个人妻子是谁呢?”老伯伯说:“就是村头看菜园子的女孩儿。”html
小伙就好气,本小伙玉树临风、风流倜傥
怎么能够和菜园穷丑丫头一块儿呢?次日路过菜园,抄起石头就往女孩儿头上砸过去,女孩儿便倒地不起,小伙也吓得畏罪潜逃。前端
后来小伙当了大学士,看上了张员外的外甥女拖媒人提请。洞房花烛夜时发现妻子头上有个疤痕
,问道怎么回事。才发现原来这就是菜园的穷丑丫头,把月下老伯的话告诉了妻子,才相信缘分是拆不散的。git
这个即是 千里姻缘一线牵
故事来源,这要是换到如今怕是 想去医院看看 wifi 快不快了
。不过这句话常说,可是故事并非全部人都知道,你们能够讲给女友听听加点小内容,确定撩妹满分。程序员
程序员心中的女神是计算机,怎么会有女友呢?-- by 又背锅的鲁迅先生github
原本只想讲 a 标签
,可是其余内容关联性也挺强的,因此本文篇幅会比较大。安全
为何会取这个标题呢?在使用网络的时候,一个个网站经过 连接
被链接到一块儿,好似月老的红线一圈圈的缠绕着。有时候不得不佩服中文的博大精深,互联网
这个词真的是很是恰当 经过 连接
互相联系 在一块儿的网状结构。bash
怀旧的同窗能够看看《天庭外传》小猪八戒牵红线那段真的是笑死小二了。微信
当 搜索引擎
派出 小蜘蛛
在爬取当前连接
页面时,页面上会有不少其余相关连接
,小蜘蛛
会顺着这个连接继续爬取下去到必定的深度,并对这些相关连接
和 当前连接
作出关联,相关连接的好坏会影响到当前连接
的天然排名。网络
举个最简单的例子,闽南风俗里在结婚前有个 考察环节
,男女方各自会组成相亲考察团
到对方的村里面打听 对方
人品、行为等在邻居口中的评价来从侧面
了解对方的状况。
小二的朋友小四由于外婆在几十年前 偷过一只鸭
被邻居告知了 考察团
,致使 相亲考察团
对他的印象分有所下降。这里的 外婆
和 小四
即是 相关连接
和 当前连接
的映照。
在页面上出现的连接几乎离不开 a 标签
,咱们经过一个个的 a 标签
去往不一样的页面。你们最常用也是最常常忽略的即是 a 标签
中的文本内容,当 搜索引擎
中的 小蜘蛛
爬取当前页面,发现页面上有 a 标签
时会继续爬取下去,而文本内容会做为连接的描述参考。
通常的连接结构是<a href="https://juejin.im/timeline/frontend" >前端</a>
。其中前端
就是文本内容也叫作锚文本
,一般状况下搜索引擎
会经过锚文本
来理解https://juejin.im/timeline/frontend
这个页面的内容是什么。为了告诉 小蜘蛛
哪些能够爬取哪些不能够爬取,能够利用 rel
来指明:
rel 值 | 解释 |
---|---|
external | 表示这是一个站外连接 |
nofollow | 搜索引擎 不该该 抓取 相关连接 并记录权重。 |
noopener、noreferrer | 使得 opener 和 referrer 属性无效,防止 target="_ blank" 带来钓鱼安全问题 |
例如在掘金中用户评论中使用 noopener、noreferrer
和 nofollow
来防止评论里使用了一些危险连接:
target="_ blank"
相关内容能够查看 你们一块儿被捕吧。
相关连接
除了坏处也有好处,若是是一个知根知底
且不错
的网站,能够相互关联来提高网站的权重,这个方式叫作友情连接
从名字上就很是好理解。像京东
就有专门的友情连接 http://club.jd.com/links.aspx
:
友情连接的好处简单说来就是:一个网站被越多站点说起,越知名站点说起,它很大程度上是一个好网站。例如 BAT
要是挂上了小二的连接,你们是否是也会更相信小二这我的?
利用 robots.txt
来告诉 小蜘蛛
哪些页面是能够爬取的那些是不能够爬取的:
User-agent: *
# agency和user禁止访问
Disallow: /timeline
Disallow: /submit-entry
Disallow: /new-entry
Disallow: /edit-entry
Disallow: /notification
Disallow: /subscribe/subscribed
# agency中容许访问的目录
Allow: /agency/join
Allow: /agency/personal
复制代码
若是想当前连接
和 相关连接
彻底不出如今搜索结果中,例如能够利用 meta
标签:
<meta name="robots" content="onindex,nofollow">
复制代码
name 和 content 值部分参考以下:
name 值 | 解释 |
---|---|
robots | 泛指全部小蜘蛛 |
Baiduspide | 指百度小蜘蛛 |
Googlebot | 指谷歌小蜘蛛 |
content 值 | 解释 |
---|---|
index | 搜索引擎 应该 抓取该 当前连接 |
noindex | 搜索引擎 不该该 抓取 当前连接 |
follow | 搜索引擎 应该 抓取 相关连接 |
nofollow | 搜索引擎 不该该 抓取 相关连接 并记录权重 |
https://juejin.im/
https://www.juejin.im/
复制代码
对于用户
来讲这两个连接都是掘金的首页,但是对于 搜索引擎
来讲这两个连接分别对应的是两个不一样的网站。
在搜索引擎里,包括参数
的不一样,只有连接彻底同样,才会认为是同一个连接。内容类似颇有可能被搜索引擎
判读为做弊,而且会致使权重被分散掉。就比如一条街上开两家 万达广场
直接会把客源稀释成两部分。
更多 URL 相关能够阅读 URL 大爆炸。
喜欢动手的同窗可能会去试试访问 https://www.juejin.im/
,就会发现连接会被重定向到 https://juejin.im/
,确实这个方法便能帮助掘金主页从两个入口变为一个。可是细心的同窗还会打开 控制台
发现跳转的 HTTP Status Code
为 301
而不是 302
,这是为何呢?
ps: 小二没收一分钱广告费哦,只是单纯的举例子。
301 (Permanently Moved)顾名思义指的是永久性转移
,搜索引擎
读取到 301 状态码
时候会把跳转后的网站当作真正的连接,这样多个连接都会被当作同一个连接权重也获得了保持。使用的场景:
搜索引擎
新域名和对新的域名进行收录。不利于记忆
和过长
的原连接。.php
、.html
、.aspx
,当用户
保存连接为书签和搜索引擎
收录后,从新更改网页扩展名会致使原连接失效显示为 404 Not Found
,访问流量白白流逝。搜索引擎
哪一个才是须要收录。302 Found(Moved Temporarily )表示的是暂时性的转移,因为是暂时性
的转移搜索引擎
和人不同不能作到精确的分辨出哪一个才是该收录的。使用的场景:
https://juejin.im/
跳转到 https://m.juejin.im/
,不过有的公司用的是 301,最好仍是作成响应式的网站。注意:搜索引擎
有可能就会把跳转后的网站归结为是原网址的内容,好比 baidu.com
跳转到 juejin.im
可能会把掘金的内容归结为百度的,这也叫作 网址劫持
。最简单的例子就是超市里的 康师傅
和 康帅傅
:
ps: 小二真真真的没收一分钱广告费哦,只是单纯的举例子。
https://pushme.top/index.html?from=juejin
https://pushme.top/index.html?from=baidu
https://pushme.top/index.html?from=taobao
复制代码
在为何里提到了 参数
的不同也会被当作不一样连接,这里的三个连接其实都是主页,只不过是利用了 from
来判断用户的来源,能够利用 rel="cononical"
来告诉搜索引擎
这几个连接都是表示哪一个连接。
<link rel="cononical" href="https://pushme.top/index.html" />
复制代码
固然上面 302 状态码中提到的 移动端和PC端
也能够用 rel="cononical"
和 rel="alternate"
来帮助搜索引擎
理解两个网站的关系:
<!--PC页面用 alternate 指向移动页面-->
<link rel="alternate" href="http://m.abc.com/">
<!--移动页面用 canonical 指向PC页面-->
<link rel="canonical" href="http://www.abc.com/">
复制代码
rel="alternate"
还能够用来实现网站的换肤功能
,本文主要是讲 SEO 相关就不扩展更多了。
在困惑的城市里总少不了并肩同行的
伙伴
让咱们一块儿成长。
点赞
。小星星
。m353839115
。本文原稿来自 PushMeTop