1. http协议定义: 一种无状态的,应用层的,以请求/应答方式运行的协议,它使用可扩展的语义和自描述消息格式,与基于网络的超文本信息系统灵活的互动。

  2. ABNF(扩充巴科斯-瑙尔范式)操作符:

    • 空白字符: 用来分隔定义中的各个元素。
    • 选择/: 表示多个规则都是可供选择的规则
      • start-line = require-line / status-line
    • 值范围 %c##-##
      • OCTAL = "0"/"1"/"2"/"3"/"4"/"5"/"6"/"7" 与 OCTAL = %x30-37等价
    • 序列组合():将规则组合起来,视为单个元素。
    • 不定量重复m*n:
      • *元素表示零个或多个元素: *(header-field CRLF)
      • 1*元素表示一个或更多元素,2*4元素表示两个至四个元素
    • 可选序列 []:
      • [message-body]
  3. ABNF(扩充巴科斯-瑙尔范式) 核心规则:

规则 形式定义 意义
ALPHA %x41-5A / %x61-7A 大写和小写ASCII字母(A-Z,a-z)
DIGIT %x30-39 数字(0-9)
HEXDIG DIGIT / "A" / "B" / "C" / "D" / "E" / "F" 十六进制数字(0-9,A-F,a-f)
DQUOTE %x22 双引号
SP %x20 空格
HTAB %x09 横向制表符
WSP SP / HTAB 空格或横向制表符
LWSP *(WSP / CRLF WSP) 直线空白(晚于换行)
VCHAR %x21-7E 可见(打印)字符
CHAR %x01-7F 任何7-位US-ASCII字符,不包括NUL(%x00)
OCTET %x00-FF 8位数据
CTL %x00-1F / %x7F 控制字符
CR %x0D 回车
LF %x0A 换行
CRLF CRLF 互联网标准换行
BIT "0"/"1" 二进制数字

http 解决了什么问题

解决www信息交互必须面对的需求

  • 低门槛
  • 可扩展性: 巨大的用户群体, 超长的寿命
  • 分布式系统下的Hypermedia:大粒度数据的网络传输
  • Internet 规模
    • 无法控制的 scalability
      • 不可预测的负载,非法格式的数据,恶意消息
      • 客户端不能保持所有服务器信息, 服务器不能保持多个请求间的状态信息
    • 独立的部署:新老组件共存
  • 向前兼容:自1993年起HTTP0.9\1.0(1996)已经被广泛使用


评估Web架构的关键属性

HTTP 协议应当在一下属性中取得可接受的均衡:

  1. 性能Performance: 影响高可用的关键属性
  2. 可伸缩性 Scalability: 支持部署可以相互交互的大量组件
  3. 简单性 Simplicity: 易理解,易实现,易验证
  4. 可见性 Visiable: 对两个组件间的交互进行监视或者仲裁的能力。如缓存,分层设计等
  5. 可移植性 Portability: 在不同的环境下运行的能力
  6. 可靠性 Reliability: 出现部分故障时,对整体影响的程度
  7. 可修改性 Modifiability: 对系统作出修改的难易程度,由可进化性,可定制性,可扩展性,可配置性,可重用性构成。

响应码分类: 1xx

1xx:请求已收到,需要进一步处理才能完成,HTTP1.0不支持

  • 100 continue: 上传大文件前使用
    • 由客户端发起请求中携带Expect: 100-continue头部触发
  • 101 Switch Protocols: 协议升级使用
    • 由客户端发起请求中携带Upgrade:头部触发,如升级websocket 或者 http/2.0
  • 102 Processing: WebDAV 请求可能包含许多涉及文件操作的子请求,需要很长的时间才能完成请求。该代码表示服务器已经收到并正在处理请求,但无响应可用。这样可以防止客户端超时,并假设请求丢失。

2xx: 成功处理请求

  • 200 OK: 成功返回响应
  • 201 Created: 有新资源在服务器端被成功创建
  • 202 Accepted: 服务器接受并开始处理请求, 但请求未处理完成。这样一个模糊的概念是有意如此设计,可以覆盖更多的场景。例如异步,需要长时间处理的任务。
  • 203 Non-Authoritative Information: 当代理服务器修改了 origin server 的原始响应包体时(例如更换了HTML中的元素值),代理服务器可以通过修改200为203的方式告知客户端这一事实,方便客户端为这一行为作出相应的处理。203响应可以被缓存。
  • 204 No Content: 成功执行了请求且不携带响应包体,并暗示客户端无需更新当前的页面视图。
  • 205 Reset Content: 成功执行了请求且不携带响应包体,同时指明客户端需要更新当前页面视图。
  • 206 Partial Content: 使用 range 协议时返回部分响应内容时的响应码。
  • 207 Multi-Status: RFC4918,在WEBDAY协议中以XML返回多个资源的状态。
  • 208 Already Reported: RFC5842,为避免相同集合下资源在207响应码下重复上报,使用208可以使用父集合的响应码。

3xx:重定向使用Location 指向的资源或者缓存中的资源。在RFC2068中规定客户端重定向次数不应超过5次,以防止死循环。

  • 300 Multiple Choices: 资源有多种表述,通过300返回给客户端后由其自行选择访问哪一种表述。由于缺乏明确的细节,300很少使用。
  • 301Moved Permanently: 资源永久性的重定向到另一个URL中。
  • 302 Found:资源临时的重定向到另一个URL中。
  • 304 没有改变

4xx:客户端出现错误

  • 400 Bad Request: 服务器认为客户端出现了错误,但不能明确判断为以下哪种错误时使用此错误码。例如HTTP请求格式错误。
  • 401 Unauthorized: 用户认证信息缺失或者不正确,导致服务器无法处理请求。
  • 402 Proxy Authentication Required: 对需要经由代理的请求,认证信息未通过代理服务器的验证。
  • 403 Forbidden: 服务器理解请求的含义,但没有权限执行此请求。
  • 404 Not Found: 服务器没有找到相应的资源
  • 410 Gone: 服务器没有找到对应的资源,且明确的知道该位置永久性找不到该资源。
  • 405 Method Not Allowed: 服务器不支持请求行中的method方法
  • 406 Not Acceptable: 对客户端指定的资源表述不存在(例如对语言或者编码有要求),服务器返回表述列表供客户端选择。
  • 408 Request Timeout: 服务器接受请求超时。
  • 409 Conflict: 资源冲突,例如上传文件时目标位置已经存在版本更新的资源。
  • 411 Length Required: 如果请求含有包体且未携带 Content-Length 头部,且不属于 chunk类请求时,返回411。
  • 412 Range Not Satisfiable: 无法提供Range请求中指定的那段包体。
  • 417 Expectation Failed: 对于 Expext 请求头部期待的情况无法满足时的响应码。
  • 421 Misdirected Request: 服务器认为这个请求不该发给它,因为它没有能力处理。
  • 426 Upgrade Required: 服务端拒绝基于当前HTTP协议提供服务,通过Upgrade头部告知客户端必须升级协议才能继续处理
  • 428 Precondition Required: 用户请求中缺失了条件类头部,例如 If-Match
  • 429 Too Many Requests: 客户端发送请求的速率过快
  • 431 Request Header Fields Too Large: 请求的 HEADER 头部大小超过限制。
  • 451 Unavailable For Legal Reasons: RFC7725,由于法律原因资源无法访问。

5xx: 服务器端出现错误

  • 500 Internal Server Error: 服务器内部错误,且不属于以上错误类型。
  • 501 Not Implemented: 服务器不支持实现请求所需要的功能。
  • 502 Bad Gateway: 代理服务器无法获取到合法响应。
  • 503 Service Unavailable: 服务器资源尚未准备好处理当前请求。
  • 504 Gateway Timeout; 代理服务器无法及时的从上游获取响应。
  • 505 HTTP Version Not Supported: 请求使用的HTTP协议版本不支持。
  • 507 Insufficient Storage: 服务器没有足够的空间处理请求。
  • 508 Loop Detected: 访问资源时检测到循环
  • 511 Network Authentication Required: 代理服务器发现客户端需要进行身份验证才能获得网络访问权限。

潜在规则: 如果服务器接收到一个无法识别的响应码,会按照开头数字的00系列进行处理。例如 555 会按照 500 处理。


正向代理: 服务于客户端的是正向代理,例如你需要科学上网时在浏览器配置的代理服务器。

反向代理:服务于服务器端的是反向代理,主要用途是负载均衡和协议适配。