这是关于网络系列的第五篇文章,接下来会有更多精彩内容.敬请期待! 让我们一起乘风破浪!
在浩瀚的互联网中,URL 就是互联网资源的标准化名称。本节,让我们一起扒开 URL 的外衣!你可以了解到一下内容:
- URL 语法,以及各种 URL 组件的含义以及其所做的工作
- URL 和自动扩展 URL
- URL 编码和字符规则
URL 的用途
之前说 URL 是统一资源定位符,视乎它只是用来标识资源的位置似得。其实,不止如此!URL为用户及他们的浏览器提供的找到信息所需的所有条件,包括它位于何处,以及如何获取它或者说如何处理它
。
URL 语法
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
下面是 Cornerstone 的一个目录的配置:
可以看到红色框中的 URL 包含了user
信息,密码为了安全并没有显示出来.
上面是一个 URL 的通用格式,当然几乎没有哪个 URL 包含了所有这些组件。最重要的 3 部分是:scheme
,host
,path
.下面是各部分的说明:
组件 | 描述 | 默认值 |
---|---|---|
scheme | 访问服务器获取资源时使用的协议 | 无 |
user | 访问资源时使用的用户名 | 无(匿名) |
password | 用户的密码,和用户名使用: 分割 |
|
host | 资源服务器主机名或 IP 地址 | 无 |
port | 资源服务器监听的端口,不同的 scheme 有不同的默认端口(HTTP 使用 80 作为默认端口) | 和 scheme 有关 |
path | 服务器上的资源路径。路径与服务器和 scheme 有关 | 默认值 |
params | 在某些 scheme 下指定输入参数,是键值对。可以有多个,使用; 分割 |
默认值 |
query | 该组件没有通用的格式,HTTP 中大多使用& 来分隔多个 query。使用? 分隔 query 和其他部分 |
无 |
frag(或 fragment) | 一小片或一部分资源名称。引用对象时,不会将 fragment 传送给服务器,客户端内部使用。通过# 分隔 fragment 和其余部分 |
无 |
印象中,一个带有参数的 URL,会把参数拼接到 URL 后面,使用?
和前面的隔开,现在看来,拼接的是 query 啊!看看下面代码片段的输出:
1 |
|
看到上述结果,若你之前的认识有误,请更正!
Tips
- scheme 部分是大小写无关的
- HTTP 的下层是 TCP,默认端口 80
- 路径是可以由多部分组成的,每一部分可以拥有自己的参数。如
/hammers;sale=false/index.html;graphics=true
- 也许我们在实际运用中用 query 组件来充当了 params 组件;但注意,实际
?
后面的是 query 组件。 - 对应 fragment 组件来说,服务器通常指处理整个对象,在请求时服务器不会接受到该组件,它只是客户端使用的
URL 快捷方式
- 相对 URL
URL 有两种方式:绝对的
和相对的
。之前的示例都是绝对的,就是从头到尾写全的;而相对的,是需要一个参照 URL,被称为基础
(NSURL 类中有该属性baseURL
),相对 URL 在 HTML 开发中比较常见。 - 自动扩展 URL
浏览器自动扩展 scheme、主机名、或根据历史记录扩展。用户无需输入完整的 URL。
令人头疼的字符
URL 作为互联网资源的标识,必须是可移植的、完整的。意思就是说,一个 URL 确定后,不管如何复制粘贴,这个 URL 的信息不能丢失!但是,URL 使用的编码是ASCII
,中文是不支持的(当然,不止是中文这么简单,ASCII 无法表示所有字符这才是硬伤)。为了使用 ASCII,又要支持其他字符,所以,编码
就来了。其实这种编码
就是转义
,使用 A 代表 B(比如 URL 中包含的类似%7E
符号,就是转义之后的,代表着~
这个特殊符号)。另外,还有一些特殊的保留字符(就像 C 语言中的关键字一样),若在保留场合之外使用需要编码。下面列举了这些字符:
特殊字符 | 说明 |
---|---|
% |
作为转义标志 |
. 、.. |
路径组件,分别表示当前目录,和上级目录 |
# 、? 、; 、: |
分别是 fragment 分割符,query 分隔符,参数分隔符,scheme 等分隔符 |
$ 、+ |
保留 |
@ 、& 、= |
在不同 scheme 中有特殊含义 |
{} 、\| 、\ 、^ 、[] |
使用受限 |
<> 、" |
不安全 |
0x00-0x1F 、>=0x7F |
无法打印,超出 ASCII 字符集的 7 位二进制范围 |
下面看一段代码:
1 |
|
从代码可以看出, OC 的库中, 给出了 URL 每个组成部分的允许字符集(在NSCharacterSet
的NSURLUtilities
扩展中, Swift 可以使用string.addingPercentEncoding(withAllowedCharacters:)
方法进行特定部分的编码,使用string.removingPercentEncoding
解码)
详细的讨论看这里
结语
该篇中,我们主要了解了 URL 的组成部分. 下篇将介绍和 HTTP 报文相关的知识,希望大家一起学习.