HTTP 协议的那些事儿!

490次阅读  |  发布于2年以前

前言

HTTP 协议是互联网常用协议了,应用也很广泛。不夸张的说,我们的互联网生活离不开HTTP。今天来一版 HTTP 速成版文章,带大家走进 HTTP 的世界。

HTTP 协议是啥

HTTP 是一个属于应用层的面向对象的协议,HTTP(超文本传输协议)是一个基于请求与响应模式的、无状态的、应用层的协议,常基于 TCP 的连接方式。

HTTP 的特点

1 . 支持客户/服务器模式。

2 . 简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。

3 . 灵活:HTTP 允许传输任意类型的数据对象。正在传输的类型由 Content-Type 加以标记。

4 . 无连接:每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。

5 . 无状态:HTTP 协议是无状态协议。对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。

HTTP 请求组成

HTTP 请求由三部分组成,分别是:请求行、消息报头、请求正文。

第一部分:请求行,用来说明请求类型,要访问的资源以及所使用的 HTTP 版本。

第二部分:请求头部,紧接着请求行(即第一行)之后的部分,用来说明服务器要使用的附加信息。

第三部分:空行,请求头部后面的空行是必须的(get对应最后一行是空行)

第四部分:请求数据也叫主体,可以添加任意的其他数据。

HTTP 响应组成

HTTP 响应也是由三个部分组成,分别是:状态行、消息报头、响应正文。

状态行 : 包括协议版本、状态码、回应短语

响应头 : 包括搭建服务器的软件,发送响应的时间,回应数据的格式等信息,包含 HTTP 状态码

响应正文:就是响应的具体数据。

HTTP 常见状态代码

200:请求被正常处理

204:请求被受理但没有资源可以返回

206:客户端只是请求资源的一部分,服务器只对请求的部分资源执行GET方法,相应报文中通过 Content-Range 指定范围的资源。

301:永久性重定向

302:临时重定向

303:与302状态码有相似功能,只是它希望客户端在请求一个URI的时候,能通过GET 方法重定向到另一个 URI 上

304:发送附带条件的请求时,条件不满足时返回,与重定向无关

307:临时重定向,与 302 类似,只是强制要求使用 POST 方法

400:请求报文语法有误,服务器无法识别

401:请求需要认证

403:请求的对应资源禁止被访问

404:服务器无法找到对应资源

500:服务器内部错误

503:服务器正忙

GET 与 POST 的区别

  1. 都可以携带额外的参数 : GET 提交的数据会放在 URL 之后,以"?"分割URL和传输数据,参数之间以 "&" 相连

POST 方法是把提交的数据放在 HTTP 包的请求体 body 中. 2. 提交的数据大小限制 : 浏览器对 URL 长度有限制, 所以 GET 提交的数据大小有限制

POST 方法没有数据大小限制 3. 数据的安全性 : GET 方式提交数据, 会带来安全问题, 比如一个登录页面, 通过 GET 方式提交数据时, 用户名和密码将出现在 URL 上

如果页面可以被缓存或者其他人可以访问这台机器, 就可以从历史记录获得该用户的账号和密码

常用的HTTP方法有哪些

GET:用于请求访问已经被 URI(统一资源标识符)识别的资源,可以通过 URL 传参给服务器

POST:用于传输信息给服务器,主要功能与GET方法类似,但一般推荐使用 POST方式

PUT:传输文件,报文主体中包含文件内容,保存到对应 URI 位置

HEAD:获得报文首部,与 GET 方法类似,只是不返回报文主体,一般用于验证URI 是否有效。

DELETE:删除文件,与 PUT 方法相反,删除对应 URI 位置的文件。

OPTIONS:查询相应 URI 支持的 HTTP 方法。

常见HTTP首部字段

  1. 通用首部字段: Date:创建报文时间 Connection:连接的管理 Cache-Control:缓存的控制 Transfer-Encoding:报文主体的传输编码方式
  2. 请求首部字段 Host:请求资源所在服务器 Accept:可处理的媒体类型 Accept-Charset:可接收的字符集 Accept-Encoding:可接受的内容编码 Accept-Language:可接受的自然语言
  3. 响应首部字段 Accept-Ranges:可接受的字节范围 Location:令客户端重新定向到的URI Server:HTTP服务器的安装信息
  4. 实体首部字段 Allow:资源可支持的HTTP方法 Content-Type:实体主类的类型 Content-Encoding:实体主体适用的编码方式 Content-Language:实体主体的自然语言 Content-Length:实体主体的的字节数 Content-Range:实体主体的位置范围,一般用于发出部分请求时使用

一次完整的HTTP请求过程包括哪些内容

  1. 域名解析
  2. 发起 TCP 的3次握手
  3. 建立 TCP 连接后发起 http 请求 -
  4. 服务器响应 http 请求,浏览器得到html代码
  5. 浏览器解析 html 代码,并请求 html 代码中的资源(如js、css、图片等)
  6. 浏览器对页面进行渲染呈现给用户。

HTTP 协议各版本之间的区别

HTTP 0.9 最初的 HTTP 协议,已经过时。特点:只支持 GET 请求 1. 没有协议头 2. 无状态性 3. 只能传输超文本

HTTP 1.0 这一版本在请求和响应中加入了HTTP 版本号。

相对于 HTTP 0.9 新增以下特性:

1. 除了GET 命令,新增了POST 和 HEAD 命令

2. 不再只接收 HTML 格式数据,可以设置 contentType 传输多种数据格式

3. 新增状态码(status code)、多字符集支持、多部分发送(multi-part type)、权限(authorization)、缓存(cache)、内容编码(content encoding)等

HTTP 1.1 目前最流行的HTTP协议,我在有时候做一些小网站的时候也会使用。

相对于HTTP 1.0 新增以下特性:

1. 引入了持久连接,即 TCP 连接默认不关闭,可以被多个请求复用。

2. 请求和响应都支持Host头域,认为每一个服务器都绑定唯一的一个 IP 地址。

3. 字节范围请求:若客户端此时已经有一部分数据,为节省带宽,可以只向服务器端请求一部分数据,这个功能在请求头的 range 头域实现。

4. 新增了一批Request method:HTTP1.1增加了 OPTIONS, PUT, DELETE, TRACE, CONNECT 方法

HTTP 2.0 为了解决 1.1 版本利用率不高的问题,提出了HTTP/2.0版本。但目前似乎还没流行起来。

主要新增特性:

1. 增加双工模式,也就是不经客户端可以同时发送多个请求,服务器端也能处理多个请求,以此来提高利用率,也是这个版本最大亮点

2. 服务器推送:不经请求向客户端发送数据

3. 二进制分帧层

4. 数据流: 将每个请求或相应的所有数据包称为一个数据流,每个数据流有一个ID,规定客户端发出的ID为奇数,服务器端发出的ID为偶数;客户端还可以设置优先级,优先级越高,服务器越优先处理

5. 头信息压缩机制:由于 HTTP 很多请求头信息中的字段都一样,可以先压缩后发送,而且客户端和服务器端可以同时维护一张头信息表,只用穿输索引号,大大提高效率

HTTP 和 RPC 的比较

传输协议

RPC: 可以基于 TCP 协议,也可以基于 HTTP 协议

HTTP: 基于 HTTP 协议

传输效率

RPC:使用自定义的TCP协议,可以让请求报文体积更小,或者使用 HTTP2 协议,也可以很好的减少报文的体积,提高传输效率

HTTP: 如果是基于 HTTP1.1 的协议,请求中会包含很多无用的内容,如果是基于 HTTP2.0,那么简单的封装以下是可以作为一个 RPC 来使用的,这时标准 RPC 框架更多的是服务治理

性能消耗

RPC:可以基于 thrift 实现高效的二进制传输

HTTP:大部分是通过 json 来实现的,字节大小和序列化耗时都比 thrift 要更消耗性能

负载均衡

RPC:基本都自带了负载均衡策略

HTTP:需要配置 Nginx,HAProxy 来实现

服务治理

RPC:能做到自动通知,不影响上游

HTTP:需要事先通知,修改 Nginx/HAProxy 配置

最后

HTTP 的知识点整理的差不多了,希望对大家有帮助,觉得写得不错的可以点个赞。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8