URL 是咱们天天畅游在互联网世界中最最多见的东西了,对于普通用户来讲,URL 就是一个字符串,好比 http://www.justdojava.com ,可是对于咱们开发者而言,除了 URL,还有一个东西叫作 URI,不少人常常搞不清楚这两个概念,本文咱们就从这个话题开始。html
从 URN 开始java
在介绍这两个东西以前,咱们还得先说说另一个东西,叫作URN,URN的全程为Uniform Resource 译做统一资源名称,URN、URL与URI的关系相似于下图:web
由上图能够看到,URN 和 URL 其实是 URI 范畴以内的概念。URN 表示给每个互联网资源取一个名字,可是互联网资源千千万万,给每个资源取一个不重复的名字显然不太现实,所以,并非全部的互联网资源都有 URN ,URN 就相似于一我的的身份证号码,是惟一的,可是经过这个身份证号码找不到这我的,要找到这我的咱们得经过相似于下面这种地址 “中国/广东省/广州市/天河区/马场路/南国花园/8栋/1203室” ,这种可以查找到某一个资源的字符串就是 URL ,URL 全称叫作 Uniform Resource Locator ,译做统一资源定位符,表示一个资源的地点。浏览器
URL 与 URI服务器
URI 是 Uniform Resource Identifier 的缩写,译做统一资源标识符,RFC2396 中对这三个单词作了以下定义:网络
Uniformspa
规定统一的格式可方便处理多种不一样类型的资源,而不用根据上下文环境来识别资源指定的访问方式。另外,加入新增的协议方案(如 http: 或 ftp:)也更容易。rest
Resourceorm
资源的定义是“可标识的任何东西”。除了文档文件、图像或服务(例如当天的天气预报)等可以区别于其余类型的,全均可做为资源。另外,资源不只能够是单一的,也能够是多数的集合体。xml
Identifier
表示可标识的对象。也称为标识符。
因而可知,URI 就是由某个协议方案表示的资源的定位标识符,而协议方案就是访问资源时所采用的协议类型的名称,好比咱们采用 HTTP 协议时,协议方案就是 HTTP ,咱们采用 FTP 协议时,协议方案就是 FTP ,另外还有 file、mailto、telnet 等
按照 RFC3986 的说法,一个 URI 能够被进一步归类为一个定位器(URL),一个名字(URN),或二者都是。也就是说 URI 能够是 URL ,也能够是 URN 或二者兼备,若是你关心资源的名称,那就将 URI 定义成 URN 的形式,若是你关心资源的位置,那么就将 URI 定义成 URL 的形式,URI 中包括了 URN 和 URL 。在 RFC3986 文档中还有以下一句话:
"Future specifications and related documentation should use the general term "URI" rather than the more restrictive terms "URL" and "URN""
这句话告诉咱们将来应该使用更加通用的 URI 术语,而不是受限制颇多的 URL 和 URN 。
前面介绍了 URI ,接下来咱们再来探讨下 URI 的格式(基于前文得出的结论,下面涉及到的地址我将都以 URI 来称呼)。
URI 的格式
对于普通用户,说 URI 他们可能有点懵,可是说 http 开头的那个字符串确定都知道是什么了,咱们常见的网址除了 http: 开头以外,也有 ftp: 开头的,也有 mailto: 开头的,分别表明不一样的含义,这是由于浏览器的功能不只仅局限于访问 web 服务器,也能够用来访问 ftp 服务器,也能够用来浏览本地文件,也能够用来发送邮件,所以浏览器须要有一个东西来判断使用哪一种功能来访问相应的数据,所以有了协议,也有了各类各样不一样的 URI 。以下图是一个完整的URI:
这其中用户名、密码和端口号均可以省略,在浏览器拿到这样一个 URI 以后,首先会对其进行解析,好比上面这个地址,浏览器通过解析以后,知道要去获取 www.baidu.com 服务器上的 /folder/index.html 文件。不过,在实际应用中,有的时候 URI 并非这么清晰,好比下面这个:
这种 URI 并无直接指定要访问哪一个文件,像这种没有路径的状况,就表明访问根目录下预先设置的默认文件,通常就是 /index.html,/default.html 一类的文件,在 Java 中,咱们也能够在 web.xml 中来配置这个默认文件。
有的时候咱们还有可能遇到下面这种地址:
这个 URI 以一个 / 结尾,表示 folder 是一个目录,咱们要访问的是这个目录下的文件,可是又没有说明是这个目录下的哪一个文件,此时依然是采用该目录下 index.html 或者 default.html 一类的文件。
有的时候,咱们还能够看到下面这种 URI:
即 folder 后面没有 /,此时会先将 folder 看成一个资源去访问(好比一个名为 folder 的 Servlet ),若是没有名为 folder 的资源,那么浏览器会自动在 folder 后面加上一个 / ,此时地址变为 http://www.baidu.com/folder/ ,folder 是一个目录,而后就会去尝试访问 folder 目录下的 index.html 或者 default.html。
注意这种自动调整只在浏览器中存在,若是你的项目是一个手机 App 或者你是一个 Ajax 请求,则不会有这种调整,即没写 / 就当作具体资源来对待,若是该资源不存在,就会报 404 ,写了/ 就当目录来对待。(OkHtpp3中是这样)
有的时候咱们还可能见到下面这种URI:
这个和咱们介绍的第一种状况很相似,只是后面多了一个 / ,这个 / 表示咱们要访问的是根目录,可是没有指定根目录下的文件,默认就是根目录下的 index.html 或者 default.html。
OK,通过上面的介绍,小伙伴对 URI 最后面的 / 已经有了清晰的认识了吧?这个东西不能够随意省略,有 / 和没有 / ,访问结果有多是天壤之别。
参考资料:
1. 《网络是怎样链接的》