老杜 JavaWeb 讲解(八) ——HTTP协议简单了解

发布时间 2023-07-09 12:14:06作者: 猪无名

(十)HTTP协议

对应视频:

17-HTTP协议详解

18-GET和POST的区别

10.1 什么是协议?

  • 协议实际上是某些人,或者某些组织提前制定好的一套规范,大家都按照这个规范来,这样可以做到沟通无障碍。
  • 协议就是一套规范,就是一套标准。由其他人或其他组织来负责制定的。
  • 我说的话你能听懂,你说的话,我也能听懂,这说明我们之间是有一套规范的,一套协议的,这套协议就是:中国普通话协议。我们都遵守这套协议,我们之间就可以沟通无障碍。

10.2 什么是HTTP协议?

  • HTTP协议:是W3C制定的一种超文本传输协议。(通信协议:发送消息的模板提前被制定好。)

    W3C:

    • 万维网联盟组织

    • 负责制定标准的:HTTP HTML4.0 HTML5 XML DOM等规范都是W3C制定的。

    • 万维网之父:蒂姆·伯纳斯·李 (创办者)

    超文本:

    • 超文本说的就是:不是普通文本,比如流媒体:声音、视频、图片等。

    • HTTP协议支持:不但可以传送普通字符串,同样支持传递声音、视频、图片等流媒体信息。

  • 这种协议游走在B和S之间。B向S发数据要遵循HTTP协议。S向B发数据同样需要遵循HTTP协议。这样B和S才能解耦合。

    什么是解耦合?

    • B不依赖S。
    • S也不依赖B。

    什么是B/S?

    • B/S结构的系统(浏览器访问WEB服务器的系统)
    • 浏览器 向 WEB服务器发送数据,叫做:请求(request)
    • WEB服务器 向 浏览器发送数据,叫做:响应(response)
  • HTTP协议包括请求协议和响应协议

    请求协议

    • 浏览器 向 WEB服务器发送数据的时候,这个发送的数据需要遵循一套标准,这套标准中规定了发送的数据具体格式。

    响应协议

    • WEB服务器 向 浏览器发送数据的时候,这个发送的数据需要遵循一套标准,这套标准中规定了发送的数据具体格式。
  • HTTP协议就是提前制定好的一种消息模板。

    • 不管你是哪个品牌的浏览器,都是这么发。
    • 不管你是哪个品牌的WEB服务器,都是这么发。
    • FF浏览器 可以向 Tomcat发送请求,也可以向Jetty服务器发送请求。浏览器不依赖具体的服务器品牌。
    • WEB服务器也不依赖具体的浏览器品牌。可以是FF浏览器,也可以是Chrome浏览器,可以是IE,都行。

10.3 什么是HTTP请求协议?

  • HTTP的请求协议包括:4部分

    • 请求行
    • 请求头
    • 空白行
    • 请求体
  • HTTP请求协议具体报文:GET

    GET /s5/GetServlet?username=jack&userpwd=123 HTTP/1.1
    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
    Accept-Encoding: gzip, deflate, br
    Accept-Language: zh-CN,zh;q=0.9
    Connection: keep-alive
    Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3
    Host: localhost:8080
    Referer: http://localhost:8080/s5/
    Sec-Fetch-Dest: document
    Sec-Fetch-Mode: navigate
    Sec-Fetch-Site: same-origin
    Sec-Fetch-User: ?1
    Upgrade-Insecure-Requests: 1
    User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36
    sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"
    sec-ch-ua-mobile: ?0
    sec-ch-ua-platform: "Windows"
    

分析:

GET /s5/GetServlet?username=jack&userpwd=123 HTTP/1.1

这是请求行,表示使用 GET 方法请求 /s5/GetServlet 资源,同时传递了两个参数 usernameuserpwd

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7

表示客户端可以接受的响应内容类型及其权重,按照权重从高到低排列。在此示例中,客户端首选的内容类型是 text/html,然后是 application/xhtml+xml,以此类推。

Accept-Encoding: gzip, deflate, br

表示客户端可以接受的响应内容编码方式。在此示例中,客户端可以接受的编码方式包括 gzipdeflatebr(Brotli)。

Accept-Language: zh-CN,zh;q=0.9

表示客户端可以接受的响应内容语言,按照权重从高到低排列。在此示例中,客户端首选的语言是中文(中国大陆),然后是中文(通用)。

Connection: keep-alive

表示客户端希望保持与服务器的长连接,以便进行多个请求和响应。

Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3

表示请求中包含的 cookie 信息。在此示例中,JSESSIONID 是 cookie 的名称,C474E84D95FD363289A6EDC5042DDDD3 是该 cookie 的值。

Host: localhost:8080

表示请求的目标主机和端口号。

Referer: http://localhost:8080/s5/

表示请求的来源页面 URL,即之前页面的 URL。

Sec-Fetch-Dest: document
Sec-Fetch-Mode: navigate
Sec-Fetch-Site: same-origin
Sec-Fetch-User: ?1

这些字段是用于支持 Fetch API 的一组安全头部,用于描述请求的上下文和性质。

Upgrade-Insecure-Requests: 1

表示客户端希望将不安全的 HTTP 请求升级为安全的 HTTPS 请求。

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36

表示发送请求的客户端浏览器和操作系统信息。在此示例中,是在 Windows 10 上使用 Chrome 浏览器进行请求。

sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"

表示用户代理的原始信息,用于标识浏览器和操作系统。此示例中使用的是不属于任何品牌的浏览器和 Chromium 内核。

sec-ch-ua-mobile: ?0

表示用户代理是否在移动设备上,此示例中不是移动设备。

sec-ch-ua-platform: "Windows"

表示用户代理的平台信息,在此示例中是 Windows 操作系统。

  • HTTP请求协议具体报文:POST

    POST /s5/PostServlet HTTP/1.1
    Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7
    Accept-Encoding: gzip, deflate, br
    Accept-Language: zh-CN,zh;q=0.9
    Cache-Control: max-age=0
    Connection: keep-alive
    Content-Length: 24
    Content-Type: application/x-www-form-urlencoded
    Cookie: JSESSIONID=C474E84D95FD363289A6EDC5042DDDD3; b-user-id=e4b47408-2e2c-6053-eb41-b9eb4a54dff1
    Host: localhost:8080
    Origin: http://localhost:8080
    Referer: http://localhost:8080/s5/
    Sec-Fetch-Dest: document
    Sec-Fetch-Mode: navigate
    Sec-Fetch-Site: same-origin
    Sec-Fetch-User: ?1
    Upgrade-Insecure-Requests: 1
    User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36
    sec-ch-ua: "Not.A/Brand";v="8", "Chromium";v="114", "Google Chrome";v="114"
    sec-ch-ua-mobile: ?0
    sec-ch-ua-platform: "Windows"
    
    username=123&userpwd=123
    
    • 请求行由三部分组成:请求方式、URI、HTTP协议版本号。

      • 请求方式(7种)

        • get(常用的)
        • post(常用的)
        • delete
        • put
        • head
        • options
        • trace
      • URI

        • 什么是URI(Uniform Resource Identifier)? 统一资源标识符。代表网络中某个资源的名字。但是通过URI是无法定位资源的。
        • 什么是URL(Uniform Resource Locator)?统一资源定位符。代表网络中某个资源,同时,通过URL是可以定位到该资源的。
        • URI和URL什么关系,有什么区别?
      • HTTP协议版本号

    • 请求头

      • 请求的主机
      • 主机的端口
      • 浏览器信息
      • 平台信息
      • cookie等信息
      • ....
    • 空白行

      • 空白行是用来区分“请求头”和“请求体”
    • 请求体

      • 向服务器发送的具体数据。

10.4 什么是HTTP响应协议?

  • HTTP的响应协议包括:4部分

    • 状态行
    • 响应头
    • 空白行
    • 响应体
  • HTTP响应协议具体报文:GET

    //状态行
    HTTP/1.1 200 ok
    //响应头
    Content-Type: text/html;charset=UTF-8
    Content-Length: 165
    Date: Sat, 08 Jul 2023 09:55:31 GMT
    Keep-Alive: timeout=20
    Connection: keep-alive
    //空白行
    
    // 响应体
    <!DOCTYPE html>
    <html lang="en">
    <head>
        <meta charset="UTF-8">
        <title>from get servlet</title>
    </head>
    <body>
          <h1>from get servlet</h1>
    </body>
    </html>
    
  • HTTP响应协议具体报文:POST

    //状态行
    HTTP/1.1 200
    //响应头
    Content-Type: text/html;charset=UTF-8
    Content-Length: 167
    Date: Sat, 08 Jul 2023 10:16:54 GMT
    Keep-Alive: timeout=20
    Connection: keep-alive
    //空白行
    
    // 响应体
    <!DOCTYPE html>
    <html lang="en">
    <head>
        <meta charset="UTF-8">
        <title>from post servlet</title>
    </head>
    <body>
          <h1>from post servlet</h1>
    </body>
    </html>
    
    • 状态行由三部分组成:协议版本号、状态码、状态描述信息。
      • 协议版本号 HTTP/1.1
      • 状态码:
        • 200 响应成功,正常结束。
        • 404 表示访问的资源不存在,通常是因为要么是你路径写错了,要么是路径写对了,但是服务器中对应的资源并没有启动成功。总之404错误是前端错误。
        • 405表示前端发送的请求方式与后端请求的处理方式不一致时发生:
          • 比如:前端是POST请求,后端的处理方式按照get方式进行处理时,发生405
          • 比如:前端是GET请求,后端的处理方式按照post方式进行处理时,发生405
        • 500表示服务器端的程序出现了异常。一般会认为是服务器端的错误导致的。
        • 以4开始的,一般是浏览器端的错误导致的。
        • 以5开始的,一般是服务器端的错误导致的。
      • 第三部分:状态的描述信息
        • ok 表示正常成功结束。
        • not found 表示资源找不到。
    • 响应头
      • 响应的内容类型
      • 响应的内容长度
      • 响应的时间
      • ....
    • 空白行
      • 用来分隔“响应头”和“响应体”的。
    • 响应体
      • 响应体就是响应的正文,这些内容是一个长的字符串,这个字符串被浏览器渲染,解释并执行,最终展示出效果。

10.5 GET请求和POST请求有什么区别?

  • get请求发送数据的时候,数据会挂在URI的后面,并且在URI后面添加一个“?”,"?"后面是数据。这样会导致发送的数据回显在浏览器的地址栏上。(get请求在“请求行”上发送数据)

  • http://localhost:8080/s5/GetServlet?username=123&userpwd=123

  • post请求发送数据的时候,在请求体当中发送。不会回显到浏览器的地址栏上。也就是说post发送的数据,在浏览器地址栏上看不到。(post在“请求体”当中发送数据)

  • get请求只能发送普通的字符串。并且发送的字符串长度有限制,不同的浏览器限制不同。这个没有明确的规范。

  • get请求无法发送大数据量。

  • post请求可以发送任何类型的数据,包括普通字符串,流媒体等信息:视频、声音、图片。

  • post请求可以发送大数据量,理论上没有长度限制。

  • get请求在W3C中是这样说的:get请求比较适合从服务器端获取数据。

  • post请求在W3C中是这样说的:post请求比较适合向服务器端传送数据。

  • get请求是安全的。get请求是绝对安全的。为什么?因为get请求只是为了从服务器上获取数据。不会对服务器造成威胁。(get本身是安全的,你不要用错了。用错了之后又冤枉人家get不安全,你这样不好(太坏了),那是你自己的问题,不是get请求的问题。)

  • post请求是危险的。为什么?因为post请求是向服务器提交数据,如果这些数据通过后门的方式进入到服务器当中,服务器是很危险的。另外post是为了提交数据,所以一般情况下拦截请求的时候,大部分会选择拦截(监听)post请求。

  • get请求支持缓存。

  • 任何一个get请求最终的“响应结果”都会被浏览器缓存起来。在浏览器缓存当中:

    • 一个get请求的路径a 对应 一个资源。
    • 一个get请求的路径b 对应 一个资源。
    • 一个get请求的路径c 对应 一个资源。
    • ......
  • 实际上,你只要发送get请求,浏览器做的第一件事都是先从本地浏览器缓存中找,找不到的时候才会去服务器上获取。这种缓存机制目的是为了提高用户的体验。

  • 有没有这样一个需求:我们不希望get请求走缓存,怎么办?怎么避免走缓存?我希望每一次这个get请求都去服务器上找资源,我不想从本地浏览器的缓存中取。

  • post请求不支持缓存。(POST是用来修改服务器端的资源的。)

    • post请求之后,服务器“响应的结果”不会被浏览器缓存起来。因为这个缓存没有意义。
  • GET请求和POST请求如何选择,什么时候使用GET请求,什么时候使用POST请求?

    • 怎么选择GET请求和POST请求呢?衡量标准是什么呢?你这个请求是想获取服务器端的数据,还是想向服务器发送数据。如果你是想从服务器上获取资源,建议使用GET请求,如果你这个请求是为了向服务器提交数据,建议使用POST请求。
    • 大部分的form表单提交,都是post方式,因为form表单中要填写大量的数据,这些数据是收集用户的信息,一般是需要传给服务器,服务器将这些数据保存/修改等。
    • 如果表单中有敏感信息,还是建议适用post请求,因为get请求会回显敏感信息到浏览器地址栏上。(例如:密码信息)
    • 做文件上传,一定是post请求。要传的数据不是普通文本。
    • 其他情况都可以使用get请求。
  • 不管你是get请求还是post请求,发送的请求数据格式是完全相同的,只不过位置不同,格式都是统一的:

    • name=value&name=value&name=value&name=value
      • name是什么?
        • 以form表单为例:form表单中input标签的name。
      • value是什么?
        • 以form表单为例:form表单中input标签的value。

补充

接触到的缓存机制:

  • 堆内存当中的字符串常量池。
    • "abc" 先在字符串常量池中查找,如果有,直接拿来用。如果没有则新建,然后再放入字符串常量池。
  • 堆内存当中的整数型常量池。
    • [-128 ~ 127] 一共256个Integer类型的引用,放在整数型常量池中。没有超出这个范围的话,直接从常量池中取。
  • 连接池(Connection Cache)
    • 这里所说的连接池中的连接是java语言连接数据库的连接对象:java.sql.Connection对象。
    • JVM是一个进程。MySQL数据库是一个进程。进程和进程之间建立连接,打开通道是很费劲的。是很耗费资源的。怎么办?可以提前先创建好N个Connection连接对象,将连接对象放到一个集合当中,我们把这个放有Connection对象的集合称为连接池。每一次用户连接的时候不需要再新建连接对象,省去了新建的环节,直接从连接池中获取连接对象,大大提升访问效率。
    • 连接池
      • 最小连接数
      • 最大连接数
      • 连接池可以提高用户的访问效率。当然也可以保证数据库的安全性。
  • 线程池
    • Tomcat服务器本身就是支持多线程的。
    • Tomcat服务器是在用户发送一次请求,就新建一个Thread线程对象吗?
      • 当然不是,实际上是在Tomcat服务器启动的时候,会先创建好N多个线程Thread对象,然后将线程对象放到集合当中,称为线程池。用户发送请求过来之后,需要有一个对应的线程来处理这个请求,这个时候线程对象就会直接从线程池中拿,效率比较高。
      • 所有的WEB服务器,或者应用服务器,都是支持多线程的,都有线程池机制。
  • redis
    • NoSQL数据库。非关系型数据库。缓存数据库。
  • 向ServletContext应用域中存储数据,也等于是将数据存放到缓存cache当中了。