36 张图，一次性补全网络基础知识！

民工哥技术之路

专注系统、Java后端、架构设计、微服务、集群、中间件等开源技术分享（后台回复 1024 免费赠送资源），关注我！一同成长！

380篇原创内容

公众号

OSI和TCP/IP是很基础但又非常重要的知识，很多知识点都是以它们为基础去串联的，作为底层，掌握得越透彻，理解上层时会越顺畅。今天这篇网络基础科普，就是根据OSI层级去逐一展开的。

计算机网络基础

计算机网络的分类

按照网络的作用范围：广域网（WAN）、城域网（MAN）、局域网（LAN）；
按照网络使用者：公用网络、专用网络。

计算机网络的层次结构

TCP/IP四层模型与OSI体系结构对比：

层次结构设计的基本原则

各层之间是相互独立的；
每一层需要有足够的灵活性；
各层之间完全解耦。

计算机网络的性能指标

速率：bps=bit/s；
时延：发送时延、传播时延、排队时延、处理时延；
往返时间RTT：数据报文在端到端通信中的来回一次的时间。

物理层

物理层的作用

连接不同的物理设备，传输比特流。该层为上层协议提供了一个传输数据的可靠的物理媒体。简单的说，物理层确保原始的数据可在各种物理媒体上传输。

物理层设备

中继器【Repeater，也叫放大器】：同一局域网的再生信号；两端口的网段必须同一协议；5-4-3规程：10BASE-5以太网中，最多串联4个中继器，5段中只能有3个连接主机；
集线器：同一局域网的再生、放大信号（多端口的中继器）；半双工，不能隔离冲突域也不能隔离广播域。

信道的基本概念：信道是往一个方向传输信息的媒体，一条通信电路包含一个发送信道和一个接受信道。

单工通信信道：只能一个方向通信，没有反方向反馈的信道；
半双工通信信道：双方都可以发送和接受信息，但不能同时发送也不能同时接收；
全双工通信信道：双方都可以同时发送和接收。

数据链路层

数据链路层概述

数据链路层在物理层提供的服务的基础上向网络层提供服务，其最基本的服务是将源自网络层来的数据可靠地传输到相邻节点的目标机网络层。数据链路层在不可靠的物理介质上提供可靠的传输。

该层的作用包括：物理地址寻址、数据的成帧、流量控制、数据的检错、重发等。

有关数据链路层的重要知识点：

数据链路层为网络层提供可靠的数据传输；
基本数据单位为帧；
主要的协议：以太网协议；
两个重要设备名称：网桥和交换机。

封装成帧：“帧”是数据链路层数据的基本单位：透明传输：“透明”是指即使控制字符在帧数据中，但是要当做不存在去处理。即在控制字符前加上转义字符ESC。

数据链路层的差错监测

差错检测：奇偶校验码、循环冗余校验码CRC

奇偶校验码–局限性：当出错两位时，检测不到错误。
循环冗余检验码：根据传输或保存的数据而产生固定位数校验码。

最大传输单元MTU

最大传输单元MTU(Maximum Transmission Unit)，数据链路层的数据帧不是无限大的，数据帧长度受MTU限制。

路径MTU：由链路中MTU的最小值决定。

以太网协议详解

MAC地址：每一个设备都拥有唯一的MAC地址，共48位，使用十六进制表示。

以太网协议：是一种使用广泛的局域网技术，是一种应用于数据链路层的协议，使用以太网可以完成相邻设备的数据帧传输：

局域网分类

Ethernet以太网IEEE802.3

以太网第一个广泛部署的高速局域网；
以太网数据速率快；
以太网硬件价格便宜，网络造价成本低。

以太网帧结构

类型：标识上层协议（2字节）；
目的地址和源地址：MAC地址（每个6字节）；
数据：封装的上层协议的分组（46~1500字节）；
CRC：循环冗余码（4字节）；
以太网最短帧：以太网帧最短64字节；以太网帧除了数据部分18字节；数据最短46字节。

MAC地址（物理地址、局域网地址）

MAC地址长度为6字节，48位；
MAC地址具有唯一性，每个网络适配器对应一个MAC地址；
通常采用十六进制表示法，每个字节表示一个十六进制数，用 - 或 : 连接起来；
MAC广播地址：FF-FF-FF-FF-FF-FF。

网络层

网络层的目的是实现两个端系统之间的数据透明传送，具体功能包括寻址和路由选择、连接的建立、保持和终止等。数据交换技术是报文交换（基本上被分组所替代）：采用储存转发方式，数据交换单位是报文。

网络层中涉及众多的协议，其中包括最重要的协议，也是TCP/IP的核心协议——IP协议。IP协议非常简单，仅仅提供不可靠、无连接的传送服务。IP协议的主要功能有：无连接数据报传输、数据报路由选择和差错控制。

与IP协议配套使用实现其功能的还有地址解析协议ARP、逆地址解析协议RARP、因特网报文协议ICMP、因特网组管理协议IGMP。

具体的协议我们会在接下来的部分进行总结，有关网络层的重点为：

1、网络层负责对子网间的数据包进行路由选择。此外，网络层还可以实现拥塞控制、网际互连等功能；
2、基本数据单位为IP数据报；
3、包含的主要协议：

IP协议（Internet Protocol，因特网互联协议）;
ICMP协议（Internet Control Message Protocol，因特网控制报文协议）;
ARP协议（Address Resolution Protocol，地址解析协议）;
RARP协议（Reverse Address Resolution Protocol，逆地址解析协议）。

重要的设备：路由器。

路由器相关协议：

IP协议详解

IP网际协议是 Internet 网络层最核心的协议。

虚拟互联网络的产生：实际的计算机网络错综复杂；物理设备通过使用IP协议，屏蔽了物理网络之间的差异；当网络中主机使用IP协议连接时，无需关注网络细节，于是形成了虚拟网络。IP协议使得复杂的实际网络变为一个虚拟互联的网络；并且解决了在虚拟网络中数据报传输路径的问题。

其中，版本指IP协议的版本，占4位，如IPv4和IPv6；
首部位长度表示IP首部长度，占4位，最大数值位15；
总长度表示IP数据报总长度，占16位，最大数值位65535；
TTL表示IP数据报文在网络中的寿命，占8位；
协议表明IP数据所携带的具体数据是什么协议的，如TCP、UDP。

IP协议的转发流程

IP地址的子网划分

A类（8网络号+24主机号）、B类（16网络号+16主机号）、C类（24网络号+8主机号）可以用于标识网络中的主机或路由器，D类地址作为组广播地址，E类是地址保留。

网络地址转换NAT技术

用于多个主机通过一个公有IP访问访问互联网的私有网络中，减缓了IP地址的消耗，但是增加了网络通信的复杂度。

NAT 工作原理

从内网出去的IP数据报，将其IP地址替换为NAT服务器拥有的合法的公共IP地址，并将替换关系记录到NAT转换表中；

从公共互联网返回的IP数据报，依据其目的的IP地址检索NAT转换表，并利用检索到的内部私有IP地址替换目的IP地址，然后将IP数据报转发到内部网络。

ARP协议与RARP协议

地址解析协议 ARP（Address Resolution Protocol）：为网卡（网络适配器）的IP地址到对应的硬件地址提供动态映射。可以把网络层32位地址转化为数据链路层MAC48位地址。

ARP 是即插即用的，一个ARP表是自动建立的，不需要系统管理员来配置。RARP(Reverse Address Resolution Protocol)协议指逆地址解析协议，可以把数据链路层MAC48位地址转化为网络层32位地址。

ICMP协议详解

网际控制报文协议（Internet Control Message Protocol），可以报告错误信息或者异常情况，ICMP报文封装在IP数据报当中。ICMP协议的应用：

Ping应用：网络故障的排查；
Traceroute应用：可以探测IP数据报在网络中走过的路径。

网络层的路由概述

关于路由算法的要求：

正确的完整的、在计算上应该尽可能是简单的、可以适应网络中的变化、稳定的公平的。

自治系统AS：

指处于一个管理机构下的网络设备群，AS内部网络自治管理，对外提供一个或多个出入口，其中自治系统内部的路由协议为内部网关协议，如RIP、OSPF等；自治系统外部的路由协议为外部网关协议，如BGP。

静态路由：

人工配置，难度和复杂度高。

动态路由：

链路状态路由选择算法LS：向所有隔壁路由发送信息收敛快；全局式路由选择算法，每个路由器计算路由时，需构建整个网络拓扑图；利用Dijkstra算法求源端到目的端网络的最短路径；Dijkstra(迪杰斯特拉)算法；
距离-向量路由选择算法DV：向所有隔壁路由发送信息收敛慢、会存在回路；基础是Bellman-Ford方程（简称B-F方程）。

内部网关路由协议之RIP协议

路由信息协议 RIP(Routing Information Protocol)【应用层】，基于距离-向量的路由选择算法，较小的AS（自治系统），适合小型网络；RIP报文，封装进UDP数据报。

RIP协议特性：

RIP在度量路径时采用的是跳数（每个路由器维护自身到其他每个路由器的距离记录）；
RIP的费用定义在源路由器和目的子网之间；
RIP被限制的网络直径不超过15跳；
和隔壁交换所有的信息，30主动一次（广播）。

内部网关路由协议之OSPF协议

开放最短路径优先协议 OSPF(Open Shortest Path First)【网络层】，基于链路状态的路由选择算法（即Dijkstra算法），较大规模的AS ，适合大型网络，直接封装在IP数据报传输。

OSPF协议优点

安全；
支持多条相同费用路径；
支持区别化费用度量；
支持单播路由和多播路由；
分层路由。

RIP与OSPF的对比（路由算法决定其性质）：

外部网关路由协议之BGP协议

BGP（Border Gateway Protocol）边际网关协议【应用层】：是运行在AS之间的一种协议,寻找一条好路由：首次交换全部信息，以后只交换变化的部分,BGP封装进TCP报文段。

传输层

第一个端到端，即主机到主机的层次。传输层负责将上层数据分段并提供端到端的、可靠的或不可靠的传输。

此外，传输层还要处理端到端的差错控制和流量控制问题。

传输层的任务是根据通信子网的特性，最佳的利用网络资源，为两个端系统的会话层之间，提供建立、维护和取消传输连接的功能，负责端到端的可靠数据传输。

在这一层，信息传送的协议数据单元称为段或报文。

网络层只是根据网络地址将源结点发出的数据包传送到目的结点，而传输层则负责将数据可靠地传送到相应的端口。

有关网络层的重点：

传输层负责将上层数据分段并提供端到端的、可靠的或不可靠的传输以及端到端的差错控制和流量控制问题；
包含的主要协议：TCP协议（Transmission Control Protocol，传输控制协议）、UDP协议（User Datagram Protocol，用户数据报协议）；
重要设备：网关。

UDP协议详解

UDP(User Datagram Protocol: 用户数据报协议)，是一个非常简单的协议。UDP协议的特点：

UDP是无连接协议；
UDP不能保证可靠的交付数据；
UDP是面向报文传输的；
UDP没有拥塞控制；
UDP首部开销很小。

UDP数据报结构：

首部:8B，四字段/2B【源端口 | 目的端口 | UDP长度 | 校验和】数据字段：应用数据。

TCP协议详解

TCP(Transmission Control Protocol: 传输控制协议)，是计算机网络中非常复杂的一个协议。

TCP协议的功能

对应用层报文进行分段和重组；
面向应用层实现复用与分解；
实现端到端的流量控制；
拥塞控制；
传输层寻址；
对收到的报文进行差错检测（首部和数据部分都检错）；
实现进程间的端到端可靠数据传输控制。

TCP协议的特点

TCP是面向连接的协议；
TCP是面向字节流的协议；
TCP的一个连接有两端，即点对点通信；
TCP提供可靠的传输服务；
TCP协议提供全双工通信（每条TCP连接只能一对一）。

TCP报文段结构

最大报文段长度：报文段中封装的应用层数据的最大长度。

TCP首部：

序号字段：TCP的序号是对每个应用层数据的每个字节进行编号；
确认序号字段：期望从对方接收数据的字节序号，即该序号对应的字节尚未收到。用ack_seq标识；
TCP段的首部长度最短是20B ，最长为60字节。但是长度必须为4B的整数倍。

TCP标记的作用：

可靠传输的基本原理

基本原理

不可靠传输信道在数据传输中可能发生的情况：比特差错、乱序、重传、丢失；
基于不可靠信道实现可靠数据传输采取的措施。

差错检测：利用编码实现数据包传输过程中的比特差错检测。

确认：接收方向发送方反馈接收状态。

重传：发送方重新发送接收方没有正确接收的数据。

序号：确保数据按序提交。

计时器：解决数据丢失问题。

停止等待协议：是最简单的可靠传输协议，但是该协议对信道的利用率不高。

连续ARQ(Automatic Repeat reQuest：自动重传请求)协议：滑动窗口+累计确认，大幅提高了信道的利用率。

TCP协议的可靠传输

基于连续ARQ协议，在某些情况下，重传的效率并不高，会重复传输部分已经成功接收的字节。

TCP协议的流量控制

流量控制：让发送方发送速率不要太快，TCP协议使用滑动窗口实现流量控制。

TCP协议的拥塞控制

拥塞控制与流量控制的区别：

流量控制考虑点对点的通信量的控制，而拥塞控制考虑整个网络，是全局性的考虑。拥塞控制的方法：慢启动算法+拥塞避免算法。

慢开始和拥塞避免：

【慢开始】拥塞窗口从1指数增长；
到达阈值时进入【拥塞避免】，变成+1增长；
【超时】，阈值变为当前cwnd的一半（不能<2）；
再从【慢开始】，拥塞窗口从1指数增长。

快重传和快恢复：

发送方连续收到3个冗余ACK，执行【快重传】，不必等计时器超时；
执行【快恢复】，阈值变为当前cwnd的一半（不能<2），并从此新的ssthresh点进入【拥塞避免】。

TCP连接的三次握手（重要）

TCP三次握手使用指令

面试常客：为什么需要三次握手？

第一次握手：客户发送请求，此时服务器知道客户能发；
第二次握手：服务器发送确认，此时客户知道服务器能发能收；
第三次握手：客户发送确认，此时服务器知道客户能收。

建立连接（三次握手）：

第一次：客户向服务器发送连接请求段，建立连接请求控制段（SYN=1），表示传输的报文段的第一个数据字节的序列号是x，此序列号代表整个报文段的序号（seq=x）；客户端进入 SYN_SEND （同步发送状态）；
第二次：服务器发回确认报文段，同意建立新连接的确认段（SYN=1），确认序号字段有效（ACK=1），服务器告诉客户端报文段序号是y（seq=y），表示服务器已经收到客户端序号为x的报文段，准备接受客户端序列号为x+1的报文段（ack_seq=x+1）；服务器由LISTEN进入SYN_RCVD （同步收到状态）;
第三次：客户对服务器的同一连接进行确认.确认序号字段有效(ACK=1),客户此次的报文段的序列号是x+1(seq=x+1),客户期望接受服务器序列号为y+1的报文段(ack_seq=y+1);当客户发送ack时，客户端进入ESTABLISHED 状态;当服务收到客户发送的ack后，也进入ESTABLISHED状态;第三次握手可携带数据。

TCP连接的四次挥手（重要）

释放连接（四次挥手）

第一次：客户向服务器发送释放连接报文段，发送端数据发送完毕，请求释放连接（FIN=1），传输的第一个数据字节的序号是x（seq=x）；客户端状态由ESTABLISHED进入FIN_WAIT_1（终止等待1状态）；
第二次：服务器向客户发送确认段，确认字号段有效（ACK=1），服务器传输的数据序号是y（seq=y），服务器期望接收客户数据序号为x+1（ack_seq=x+1）;服务器状态由ESTABLISHED进入CLOSE_WAIT（关闭等待）；客户端收到ACK段后，由FIN_WAIT_1进入FIN_WAIT_2；
第三次：服务器向客户发送释放连接报文段，请求释放连接（FIN=1），确认字号段有效（ACK=1），表示服务器期望接收客户数据序号为x+1（ack_seq=x+1）;表示自己传输的第一个字节序号是y+1（seq=y+1）；服务器状态由CLOSE_WAIT 进入 LAST_ACK （最后确认状态）；
第四次：客户向服务器发送确认段，确认字号段有效（ACK=1），表示客户传输的数据序号是x+1（seq=x+1），表示客户期望接收服务器数据序号为y+1+1（ack_seq=y+1+1）；客户端状态由FIN_WAIT_2进入TIME_WAIT，等待2MSL时间，进入CLOSED状态；服务器在收到最后一次ACK后，由LAST_ACK进入CLOSED。

为什么需要等待2MSL?

最后一个报文没有确认；
确保发送方的ACK可以到达接收方；
2MSL时间内没有收到，则接收方会重发；
确保当前连接的所有报文都已经过期。

应用层

为操作系统或网络应用程序提供访问网络服务的接口。应用层重点：

数据传输基本单位为报文；
包含的主要协议：FTP（文件传送协议）、Telnet（远程登录协议）、DNS（域名解析协议）、SMTP（邮件传送协议），POP3协议（邮局协议），HTTP协议（Hyper Text Transfer Protocol）。

DNS详解

DNS（Domain Name System:域名系统）【C/S，UDP，端口53】：解决IP地址复杂难以记忆的问题,存储并完成自己所管辖范围内主机的域名到 IP 地址的映射。

域名解析的顺序

浏览器缓存；
找本机的hosts文件；
路由缓存；
找DNS服务器（本地域名、顶级域名、根域名）->迭代解析、递归查询。

IP—>DNS服务—>便于记忆的域名。

域名由点、字母和数字组成，分为顶级域（com，cn，net，gov，org）、二级域（baidu,taobao,qq,alibaba）、三级域（www）(12-2-0852)。

DHCP协议详解

DHCP（Dynamic Configuration Protocol:动态主机设置协议）：是一个局域网协议，是应用UDP协议的应用层协议。作用：为临时接入局域网的用户自动分配IP地址。

HTTP协议详解

文件传输协议（FTP）：控制连接（端口21）：传输控制信息（连接、传输请求），以7位ASCII码的格式。整个会话期间一直打开。

HTTP（HyperText Transfer Protocol:超文本传输协议）【TCP，端口80】：是可靠的数据传输协议，浏览器向服务器发收报文前，先建立TCP连接，HTTP使用TCP连接方式（HTTP自身无连接）。

HTTP请求报文方式

GET：请求指定的页面信息，并返回实体主体；
POST：向指定资源提交数据进行处理请求；
DELETE：请求服务器删除指定的页面；
HEAD：请求读取URL标识的信息的首部，只返回报文头；
OPETION：请求一些选项的信息；
PUT：在指明的URL下存储一个文档。

HTTP工作的结构

HTTPS协议详解

HTTPS(Secure)是安全的HTTP协议，端口号443。基于HTTP协议，通过SSL或TLS提供加密处理数据、验证对方身份以及数据完整性保护。

文章来源：网络工程师笔记

本文把 TCP/IP 讲绝了！

点击关注? 民工哥技术之路 2020-12-24 09:03

收录于合集#TCP/IP 网络协议栈15个

点击上方“民工哥技术之路”，选择“设为星标”

回复“1024”获取独家整理的学习资料！

一、TCP/IP模型

TCP/IP协议模型（Transmission Control Protocol/Internet Protocol），包含了一系列构成互联网基础的网络协议，是Internet的核心协议。

基于TCP/IP的参考模型将协议分成四个层次，它们分别是链路层、网络层、传输层和应用层。下图表示TCP/IP模型与OSI模型各层的对照关系。TCP/IP协议族按照层次由上到下，层层包装。最上面的是应用层，这里面有http，ftp等等我们熟悉的协议。而第二层则是传输层，著名的TCP和UDP协议就在这个层次。第三层是网络层，IP协议就在这里，它负责对数据加上IP地址和其他的数据以确定传输的目标。第四层是数据链路层，这个层次为待传送的数据加入一个以太网协议头，并进行CRC编码，为最后的数据传输做准备。上图清楚地表示了TCP/IP协议中每个层的作用，而TCP/IP协议通信的过程其实就对应着数据入栈与出栈的过程。入栈的过程，数据发送方每层不断地封装首部与尾部，添加一些传输的信息，确保能传输到目的地。出栈的过程，数据接收方每层不断地拆除首部与尾部，得到最终传输的数据。上图以HTTP协议为例，具体说明。

二、数据链路层

物理层负责0、1比特流与物理设备电压高低、光的闪灭之间的互换。数据链路层负责将0、1序列划分为数据帧从一个节点传输到临近的另一个节点,这些节点是通过MAC来唯一标识的(MAC,物理地址，一个主机会有一个MAC地址)。

封装成帧: 把网络层数据报加头和尾，封装成帧,帧头中包括源MAC地址和目的MAC地址。

透明传输:零比特填充、转义字符。

可靠传输: 在出错率很低的链路上很少用，但是无线链路WLAN会保证可靠传输。

差错检测(CRC):接收者检测错误,如果发现差错，丢弃该帧。

三、网络层

1.IP协议

IP协议是TCP/IP协议的核心，所有的TCP，UDP，IMCP，IGMP的数据都以IP数据格式传输。要注意的是，IP不是可靠的协议，这是说，IP协议没有提供一种数据未传达以后的处理机制，这被认为是上层协议：TCP或UDP要做的事情。

1.1 IP地址

在数据链路层中我们一般通过MAC地址来识别不同的节点，而在IP层我们也要有一个类似的地址标识，这就是IP地址。

32位IP地址分为网络位和地址位，这样做可以减少路由器中路由表记录的数目，有了网络地址，就可以限定拥有相同网络地址的终端都在同一个范围内，那么路由表只需要维护一条这个网络地址的方向，就可以找到相应的这些终端了。

A类IP地址: 0.0.0.0~127.0.0.0

B类IP地址:128.0.0.1~191.255.0.0

C类IP地址:192.168.0.0~239.255.255.0

1.2 IP协议头这里只介绍:八位的TTL字段。这个字段规定该数据包在穿过多少个路由之后才会被抛弃。某个IP数据包每穿过一个路由器，该数据包的TTL数值就会减少1，当该数据包的TTL成为零，它就会被自动抛弃。

这个字段的最大值也就是255，也就是说一个协议包也就在路由器里面穿行255次就会被抛弃了，根据系统的不同，这个数字也不一样，一般是32或者是64。

2.ARP及RARP协议

ARP 是根据IP地址获取MAC地址的一种协议。

ARP（地址解析）协议是一种解析协议，本来主机是完全不知道这个IP对应的是哪个主机的哪个接口，当主机要发送一个IP包的时候，会首先查一下自己的ARP高速缓存（就是一个IP-MAC地址对应表缓存）。

如果查询的IP－MAC值对不存在，那么主机就向网络发送一个ARP协议广播包，这个广播包里面就有待查询的IP地址，而直接收到这份广播的包的所有主机都会查询自己的IP地址，如果收到广播包的某一个主机发现自己符合条件，那么就准备好一个包含自己的MAC地址的ARP包传送给发送ARP广播的主机。

而广播主机拿到ARP包后会更新自己的ARP缓存（就是存放IP-MAC对应表的地方）。发送广播的主机就会用新的ARP缓存数据准备好数据链路层的的数据包发送工作。

RARP协议的工作与此相反，不做赘述。

3.ICMP协议

IP协议并不是一个可靠的协议，它不保证数据被送达，那么，自然的，保证数据送达的工作应该由其他的模块来完成。其中一个重要的模块就是ICMP(网络控制报文)协议。ICMP不是高层协议，而是IP层的协议。

当传送IP数据包发生错误。比如主机不可达，路由不可达等等，ICMP协议将会把错误信息封包，然后传送回给主机。给主机一个处理错误的机会，这也就是为什么说建立在IP层以上的协议是可能做到安全的原因。

四、ping

ping可以说是ICMP的最著名的应用，是TCP/IP协议的一部分。利用“ping”命令可以检查网络是否连通，可以很好地帮助我们分析和判定网络故障。

例如：当我们某一个网站上不去的时候。通常会ping一下这个网站。ping会回显出一些有用的信息。一般的信息如下:ping这个单词源自声纳定位，而这个程序的作用也确实如此，它利用ICMP协议包来侦测另一个主机是否可达。原理是用类型码为0的ICMP发请求，受到请求的主机则用类型码为8的ICMP回应。

五、Traceroute

Traceroute是用来侦测主机到目的主机之间所经路由情况的重要工具，也是最便利的工具。

Traceroute的原理是非常非常的有意思，它收到到目的主机的IP后，首先给目的主机发送一个TTL=1的UDP数据包，而经过的第一个路由器收到这个数据包以后，就自动把TTL减1，而TTL变为0以后，路由器就把这个包给抛弃了，并同时产生一个主机不可达的ICMP数据报给主机。主机收到这个数据报以后再发一个TTL=2的UDP数据报给目的主机，然后刺激第二个路由器给主机发ICMP数据报。如此往复直到到达目的主机。这样，traceroute就拿到了所有的路由器IP。

六、TCP/UDP

TCP/UDP都是是传输层协议，但是两者具有不同的特性，同时也具有不同的应用场景，下面以图表的形式对比分析。面向报文

面向报文的传输方式是应用层交给UDP多长的报文，UDP就照样发送，即一次发送一个报文。因此，应用程序必须选择合适大小的报文。若报文太长，则IP层需要分片，降低效率。若太短，会是IP太小。

面向字节流

面向字节流的话，虽然应用程序和TCP的交互是一次一个数据块（大小不等），但TCP把应用程序看成是一连串的无结构的字节流。TCP有一个缓冲，当应用程序传送的数据块太长，TCP就可以把它划分短一些再传送。

关于拥塞控制，流量控制，是TCP的重点，后面讲解。

TCP和UDP协议的一些应用什么时候应该使用TCP？

当对网络通讯质量有要求的时候，比如：整个数据要准确无误的传递给对方，这往往用于一些要求可靠的应用，比如HTTP、HTTPS、FTP等传输文件的协议，POP、SMTP等邮件传输的协议。

什么时候应该使用UDP？

当对网络通讯质量要求不高的时候，要求网络通讯速度能尽量的快，这时就可以使用UDP。

七、DNS

DNS（Domain Name System，域名系统），因特网上作为域名和IP地址相互映射的一个分布式数据库，能够使用户更方便的访问互联网，而不用去记住能够被机器直接读取的IP数串。通过主机名，最终得到该主机名对应的IP地址的过程叫做域名解析（或主机名解析）。DNS协议运行在UDP协议之上，使用端口号53。

八、TCP连接的建立与终止

1.三次握手

TCP是面向连接的，无论哪一方向另一方发送数据之前，都必须先在双方之间建立一条连接。在TCP/IP协议中，TCP协议提供可靠的连接服务，连接是通过三次握手进行初始化的。三次握手的目的是同步连接双方的序列号和确认号并交换 TCP窗口大小信息。

第一次握手：建立连接。客户端发送连接请求报文段，将SYN位置为1，Sequence Number为x；然后，客户端进入SYN_SEND状态，等待服务器的确认；

第二次握手：服务器收到SYN报文段。服务器收到客户端的SYN报文段，需要对这个SYN报文段进行确认，设置Acknowledgment Number为x+1(Sequence Number+1)；同时，自己自己还要发送SYN请求信息，将SYN位置为1，Sequence Number为y；服务器端将上述所有信息放到一个报文段（即SYN+ACK报文段）中，一并发送给客户端，此时服务器进入SYN_RECV状态；

第三次握手：客户端收到服务器的SYN+ACK报文段。然后将Acknowledgment Number设置为y+1，向服务器发送ACK报文段，这个报文段发送完毕以后，客户端和服务器端都进入ESTABLISHED状态，完成TCP三次握手。

为什么要三次握手？

为了防止已失效的连接请求报文段突然又传送到了服务端，因而产生错误。

具体例子：“已失效的连接请求报文段”的产生在这样一种情况下：client发出的第一个连接请求报文段并没有丢失，而是在某个网络结点长时间的滞留了，以致延误到连接释放以后的某个时间才到达server。本来这是一个早已失效的报文段。但server收到此失效的连接请求报文段后，就误认为是client再次发出的一个新的连接请求。

于是就向client发出确认报文段，同意建立连接。假设不采用“三次握手”，那么只要server发出确认，新的连接就建立了。由于现在client并没有发出建立连接的请求，因此不会理睬server的确认，也不会向server发送数据。但server却以为新的运输连接已经建立，并一直等待client发来数据。这样，server的很多资源就白白浪费掉了。采用“三次握手”的办法可以防止上述现象发生。例如刚才那种情况，client不会向server的确认发出确认。server由于收不到确认，就知道client并没有要求建立连接。”

2.四次挥手

当客户端和服务器通过三次握手建立了TCP连接以后，当数据传送完毕，肯定是要断开TCP连接的啊。那对于TCP的断开连接，这里就有了神秘的“四次分手”。

第一次分手：主机1（可以使客户端，也可以是服务器端），设置Sequence Number，向主机2发送一个FIN报文段；此时，主机1进入FIN_WAIT_1状态；这表示主机1没有数据要发送给主机2了；

第二次分手：主机2收到了主机1发送的FIN报文段，向主机1回一个ACK报文段，Acknowledgment Number为Sequence Number加1；主机1进入FIN_WAIT_2状态；主机2告诉主机1，我“同意”你的关闭请求；

第三次分手：主机2向主机1发送FIN报文段，请求关闭连接，同时主机2进入LAST_ACK状态；

第四次分手：主机1收到主机2发送的FIN报文段，向主机2发送ACK报文段，然后主机1进入TIME_WAIT状态；主机2收到主机1的ACK报文段以后，就关闭连接；此时，主机1等待2MSL后依然没有收到回复，则证明Server端已正常关闭，那好，主机1也可以关闭连接了。

为什么要四次分手？

TCP协议是一种面向连接的、可靠的、基于字节流的运输层通信协议。TCP是全双工模式，这就意味着，当主机1发出FIN报文段时，只是表示主机1已经没有数据要发送了，主机1告诉主机2，它的数据已经全部发送完毕了；但是，这个时候主机1还是可以接受来自主机2的数据；当主机2返回ACK报文段时，表示它已经知道主机1没有数据发送了，但是主机2还是可以发送数据到主机1的；当主机2也发送了FIN报文段时，这个时候就表示主机2也没有数据要发送了，就会告诉主机1，我也没有数据要发送了，之后彼此就会愉快的中断这次TCP连接。

为什么要等待2MSL？

MSL：报文段最大生存时间，它是任何报文段被丢弃前在网络内的最长时间。原因有二：

保证TCP协议的全双工连接能够可靠关闭

保证这次连接的重复数据段从网络中消失

第一点：如果主机1直接CLOSED了，那么由于IP协议的不可靠性或者是其它网络原因，导致主机2没有收到主机1最后回复的ACK。那么主机2就会在超时之后继续发送FIN，此时由于主机1已经CLOSED了，就找不到与重发的FIN对应的连接。所以，主机1不是直接进入CLOSED，而是要保持TIME_WAIT，当再次收到FIN的时候，能够保证对方收到ACK，最后正确的关闭连接。

第二点：如果主机1直接CLOSED，然后又再向主机2发起一个新连接，我们不能保证这个新连接与刚关闭的连接的端口号是不同的。也就是说有可能新连接和老连接的端口号是相同的。一般来说不会发生什么问题，但是还是有特殊情况出现：假设新连接和已经关闭的老连接端口号是一样的，如果前一次连接的某些数据仍然滞留在网络中，这些延迟数据在建立新连接之后才到达主机2，由于新连接和老连接的端口号是一样的，TCP协议就认为那个延迟的数据是属于新连接的，这样就和真正的新连接的数据包发生混淆了。所以TCP连接还要在TIME_WAIT状态等待2倍MSL，这样可以保证本次连接的所有数据都从网络中消失。

九、TCP流量控制

如果发送方把数据发送得过快，接收方可能会来不及接收，这就会造成数据的丢失。所谓流量控制就是让发送方的发送速率不要太快，要让接收方来得及接收。

利用滑动窗口机制可以很方便地在TCP连接上实现对发送方的流量控制。

设A向B发送数据。在连接建立时，B告诉了A：“我的接收窗口是rwnd = 400 ”(这里的rwnd表示receiver window) 。因此，发送方的发送窗口不能超过接收方给出的接收窗口的数值。请注意，TCP的窗口单位是字节，不是报文段。假设每一个报文段为100字节长，而数据报文段序号的初始值设为1。大写ACK表示首部中的确认位ACK，小写ack表示确认字段的值ack。从图中可以看出，B进行了三次流量控制。第一次把窗口减少到rwnd = 300 ，第二次又减到了rwnd = 100 ，最后减到rwnd = 0 ，即不允许发送方再发送数据了。这种使发送方暂停发送的状态将持续到主机B重新发出一个新的窗口值为止。B向A发送的三个报文段都设置了 ACK = 1 ，只有在ACK=1时确认号字段才有意义。

TCP为每一个连接设有一个持续计时器(persistence timer)。只要TCP连接的一方收到对方的零窗口通知，就启动持续计时器。若持续计时器设置的时间到期，就发送一个零窗口控测报文段（携1字节的数据），那么收到这个报文段的一方就重新设置持续计时器。

十、TCP拥塞控制

发送方维持一个拥塞窗口 cwnd ( congestion window )的状态变量。拥塞窗口的大小取决于网络的拥塞程度，并且动态地在变化。发送方让自己的发送窗口等于拥塞窗口。

发送方控制拥塞窗口的原则是：只要网络没有出现拥塞，拥塞窗口就再增大一些，以便把更多的分组发送出去。但只要网络出现拥塞，拥塞窗口就减小一些，以减少注入到网络中的分组数。

慢开始算法：

当主机开始发送数据时，如果立即所大量数据字节注入到网络，那么就有可能引起网络拥塞，因为现在并不清楚网络的负荷情况。因此，较好的方法是先探测一下，即由小到大逐渐增大发送窗口，也就是说，由小到大逐渐增大拥塞窗口数值。

通常在刚刚开始发送报文段时，先把拥塞窗口 cwnd 设置为一个最大报文段MSS的数值。而在每收到一个对新的报文段的确认后，把拥塞窗口增加至多一个MSS的数值。用这样的方法逐步增大发送方的拥塞窗口 cwnd ，可以使分组注入到网络的速率更加合理。每经过一个传输轮次，拥塞窗口 cwnd 就加倍。一个传输轮次所经历的时间其实就是往返时间RTT。不过“传输轮次”更加强调：把拥塞窗口cwnd所允许发送的报文段都连续发送出去，并收到了对已发送的最后一个字节的确认。

另，慢开始的“慢”并不是指cwnd的增长速率慢，而是指在TCP开始发送报文段时先设置cwnd=1，使得发送方在开始时只发送一个报文段（目的是试探一下网络的拥塞情况），然后再逐渐增大cwnd。

为了防止拥塞窗口cwnd增长过大引起网络拥塞，还需要设置一个慢开始门限ssthresh状态变量。慢开始门限ssthresh的用法如下：

当 cwnd < ssthresh 时，使用上述的慢开始算法。

当 cwnd > ssthresh 时，停止使用慢开始算法而改用拥塞避免算法。

当 cwnd = ssthresh 时，既可使用慢开始算法，也可使用拥塞控制避免算法。拥塞避免

拥塞避免

让拥塞窗口cwnd缓慢地增大，即每经过一个往返时间RTT就把发送方的拥塞窗口cwnd加1，而不是加倍。这样拥塞窗口cwnd按线性规律缓慢增长，比慢开始算法的拥塞窗口增长速率缓慢得多。无论在慢开始阶段还是在拥塞避免阶段，只要发送方判断网络出现拥塞（其根据就是没有收到确认），就要把慢开始门限ssthresh设置为出现拥塞时的发送方窗口值的一半（但不能小于2）。然后把拥塞窗口cwnd重新设置为1，执行慢开始算法。

这样做的目的就是要迅速减少主机发送到网络中的分组数，使得发生拥塞的路由器有足够时间把队列中积压的分组处理完毕。

如下图，用具体数值说明了上述拥塞控制的过程。现在发送窗口的大小和拥塞窗口一样大。2.快重传和快恢复

快重传

快重传算法首先要求接收方每收到一个失序的报文段后就立即发出重复确认（为的是使发送方及早知道有报文段没有到达对方）而不要等到自己发送数据时才进行捎带确认。接收方收到了M1和M2后都分别发出了确认。现在假定接收方没有收到M3但接着收到了M4。

显然，接收方不能确认M4，因为M4是收到的失序报文段。根据可靠传输原理，接收方可以什么都不做，也可以在适当时机发送一次对M2的确认。

但按照快重传算法的规定，接收方应及时发送对M2的重复确认，这样做可以让发送方及早知道报文段M3没有到达接收方。发送方接着发送了M5和M6。接收方收到这两个报文后，也还要再次发出对M2的重复确认。这样，发送方共收到了接收方的四个对M2的确认，其中后三个都是重复确认。

快重传算法还规定，发送方只要一连收到三个重复确认就应当立即重传对方尚未收到的报文段M3，而不必继续等待M3设置的重传计时器到期。

由于发送方尽早重传未被确认的报文段，因此采用快重传后可以使整个网络吞吐量提高约20%。

快恢复

与快重传配合使用的还有快恢复算法，其过程有以下两个要点：

当发送方连续收到三个重复确认，就执行“乘法减小”算法，把慢开始门限ssthresh减半。

与慢开始不同之处是现在不执行慢开始算法（即拥塞窗口cwnd现在不设置为1），而是把cwnd值设置为慢开始门限ssthresh减半后的数值，然后开始执行拥塞避免算法（“加法增大”），使拥塞窗口缓慢地线性增大。

作者：Ruheng链接：https://juejin.im/post/598ba1d06fb9a03c4d6464ab

这一份最全的TCP总结，请务必收下

点击关注? 民工哥技术之路 2021-05-18 08:58

收录于合集#TCP/IP 网络协议栈15个

点击下方公众号「关注」和「星标」

回复“1024”获取独家整理的学习资料！

民工哥技术之路
专注系统、Java后端、架构设计、微服务、集群、中间件等开源技术分享（后台回复 1024 免费赠送资源），关注我！一同成长！

380篇原创内容

公众号

网络分层结构

考虑最简单的情况：两台主机之间的通信。这个时候只需要一条网线把两者连起来，规定好彼此的硬件接口，如都用USB、电压10v、频率2.4GHz等，这一层就是物理层，这些规定就是物理层协议。

我们当然不满足于只有两台电脑连接，因此我们可以使用交换机把多个电脑连接起来，如下图：

这样连接起来的网络，称为局域网，也可以称为以太网（以太网是局域网的一种）。在这个网络中，我们需要标识每个机器，这样才可以指定要和哪个机器通信。这个标识就是硬件地址MAC。

硬件地址随机器的生产就被确定，永久性唯一。在局域网中，我们需要和另外的机器通信时，只需要知道他的硬件地址，交换机就会把我们的消息发送到对应的机器。

这里我们可以不管底层的网线接口如何发送，把物理层抽离，在他之上创建一个新的层次，这就是数据链路层。

我们依然不满足于局域网的规模，需要把所有的局域网联系起来，这个时候就需要用到路由器来连接两个局域网：

但是如果我们还是使用硬件地址来作为通信对象的唯一标识，那么当网络规模越来越大，需要记住所有机器的硬件地址是不现实的；

同时，一个网络对象可能会频繁更换设备，这个时候硬件地址表维护起来更加复杂。这里使用了一个新的地址来标记一个网络对象：IP地址。

通过一个简单的寄信例子来理解IP地址。

我住在北京市，我朋友A住在上海市，我要给朋友A写信：

写完信，我会在信上写好我朋友A的地址，并放到北京市邮局（给信息附加目标IP地址，并发送给路由器）

邮局会帮我把信运输到上海市当地邮局（信息会经过路由传递到目标IP局域网的路由器）

上海市当地路由器会帮我把信交给朋友A（局域网内通信）

因此，这里IP地址就是一个网络接入地址（朋友A的住址），我只需要知道目标IP地址，路由器就可以把消息给我带到。在局域网中，就可以动态维护一个MAC地址与IP地址的映射关系，根据目的IP地址就可以寻找到机器的MAC地址进行发送。

这样我们不需管理底层如何去选择机器，我们只需要知道IP地址，就可以和我们的目标进行通信。这一层就是网络层。网络层的核心作用就是提供主机之间的逻辑通信。

这样，在网络中的所有主机，在逻辑上都连接起来了，上层只需要提供目标IP地址和数据，网络层就可以把消息发送到对应的主机。

一个主机有多个进程，进程之间进行不同的网络通信，如边和朋友开黑边和女朋友聊微信。我的手机同时和两个不同机器进行通信。

那么当我的手机收到数据时，如何区分是微信的数据，还是王者的数据？那么就必须在网络层之上再添加一层：运输层：

运输层通过socket（套接字），将网络信息进行进一步的拆分，不同的应用进程可以独立进行网络请求，互不干扰。

这就是运输层的最本质特点：提供进程之间的逻辑通信。这里的进程可以是主机之间，也可以是同个主机，所以在android中，socket通信也是进程通信的一种方式。

现在不同的机器上的应用进程之间可以独立通信了，那么我们就可以在计算机网络上开发出形形式式的应用：如web网页的http，文件传输ftp等等。这一层称为应用层。

应用层还可以进一步拆分出表示层、会话层，但他们的本质特点都没有改变：完成具体的业务需求。和下面的四层相比，他们并不是必须的，可以归属到应用层中。

最后对计网分层进行小结：

最底层物理层，负责两个机器之间通过硬件的直接通信；

数据链路层使用硬件地址在局域网中进行寻址，实现局域网通信；

网络层通过抽象IP地址实现主机之间的逻辑通信；

运输层在网络层的基础上，对数据进行拆分，实现应用进程的独立网络通信；

应用层在运输层的基础上，根据具体的需求开发形形式式的功能。

这里需要注意的是，分层并不是在物理上的分层，而是逻辑上的分层。通过对底层逻辑的封装，使得上层的开发可以直接依赖底层的功能而无需理会具体的实现，简便了开发。

这种分层的思路，也就是责任链设计模式，通过层层封装，把不同的职责独立起来，更加方便开发、维护等等。

TCP面向字节流特性

TCP并不是把应用层传输过来的数据直接加上首部然后发送给目标，而是把数据看成一个字节流，给他们标上序号之后分部分发送。这就是TCP的面向字节流特性：

TCP会以流的形式从应用层读取数据并存放在自己的发送缓存区中，同时为这些字节标上序号

TCP会从发送方缓冲区选择适量的字节组成TCP报文，通过网络层发送给目标

目标会读取字节并存放在自己的接收方缓冲区中，并在合适的时候交付给应用层

面向字节流的好处是无需一次存储过大的数据占用太多内存，坏处是无法知道这些字节代表的意义，例如应用层发送一个音频文件和一个文本文件，对于TCP来说就是一串字节流，没有意义可言，这会导致粘包以及拆包问题，后面讲。

可靠传输原理

前面讲到，TCP是可靠传输协议，也就是，一个数据交给他，他肯定可以完整无误地发送到目标地址，除非网络炸了。他实现的网络模型如下：

对于应用层来说，他就是一个可靠传输的底层支持服务；而运输层底层采用了网络层的不可靠传输。虽然在网络层甚至数据链路层就可以使用协议来保证数据传输的可靠性，但这样网络的设计会更加复杂、效率会随之降低。把数据传输的可靠性保证放在运输层，会更加合适。

可靠传输原理的重点总结一下有：滑动窗口、超时重传、累积确认、选择确认、连续ARQ。

停止等待协议

要实现可靠传输，最简便的方法就是：我发送一个数据包给你，然后你跟我回复收到，我继续发送下一个数据包。传输模型如下：

这种“一来一去”的方法来保证传输可靠就是停止等待协议（stop-and-wait）。不知道还记不记得前面TCP首部有一个ack字段，当他设置为1的时候，表示这个报文是一个确认收到报文。

然后再来考虑另一种情况：丢包。网络环境不可靠，导致每一次发送的数据包可能会丢失，如果机器A发送了数据包丢失了，那么机器B永远接收不到数据，机器A永远在等待。

解决这个问题的方法是：超时重传。当机器A发出一个数据包时便开始计时，时间到还没收到确认回复，就可以认为是发生了丢包，便再次发送，也就是重传。

但重传会导致另一种问题：如果原先的数据包并没有丢失，只是在网络中待的时间比较久，这个时候机器B会受到两个数据包，那么机器B是如何辨别这两个数据包是属于同一份数据还是不同的数据？

这就需要前面讲过的方法：给数据字节进行编号。这样接收方就可以根据数据的字节编号，得出这些数据是接下来的数据，还是重传的数据。

在TCP首部有两个字段：序号和确认号，他们表示发送方数据第一个字节的编号，和接收方期待的下一份数据的第一个字节的编号。

连续ARQ协议

停止等待协议已经可以满足可靠传输了，但有一个致命缺点：效率太低。发送方发送一个数据包之后便进入等待，这个期间并没有干任何事，浪费了资源。解决的方法是：连续发送数据包。模型如下：

和停止等待最大的不同就是，他会源源不断地发送，接收方源源不断收到数据之后，逐一进行确认回复。这样便极大地提高了效率。但同样，带来了一些额外的问题:

发送是否可以无限发送直到把缓冲区所有数据发送完？不可以。因为需要考虑接收方缓冲区以及读取数据的能力。如果发送太快导致接收方无法接受，那么只是会频繁进行重传，浪费了网络资源。所以发送方发送数据的范围，需要考虑到接收方缓冲区的情况。这就是TCP的流量控制。

解决方法是：滑动窗口。基本模型如下：

发送方需要根据接收方的缓冲区大小，设置自己的可发送窗口大小，处于窗口内的数据表示可发送，之外的数据不可发送。

当窗口内的数据接收到确认回复时，整个窗口会往前移动，直到发送完成所有的数据

在TCP的首部有一个窗口大小字段，他表示接收方的剩余缓冲区大小，让发送方可以调整自己的发送窗口大小。通过滑动窗口，就可以实现TCP的流量控制，不至于发送太快，导致太多的数据丢失。

连续ARQ带来的第二个问题是：网络中充斥着和发送数据包一样数据量的确认回复报文，因为每一个发送数据包，必须得有一个确认回复。提高网络效率的方法是：累积确认。

接收方不需要逐个进行回复，而是累积到一定量的数据包之后，告诉发送方，在此数据包之前的数据全都收到。例如，收到 1234，接收方只需要告诉发送方我收到4了，那么发送方就知道1234都收到了。

第三个问题是：如何处理丢包情况。在停止等待协议中很简单，直接一个超时重传就解决了。但，连续ARQ中不太一样。

例如：接收方收到了 123 567，六个字节，编号为4的字节丢失了。按照累积确认的思路，只能发送3的确认回复，567都必须丢掉，因为发送方会进行重传。这就是GBN（go-back-n) 思路。

但是我们会发现，只需要重传4即可，这样不是很浪费资源，所以就有了：选择确认SACK 。在TCP报文的选项字段，可以设置已经收到的报文段，每一个报文段需要两个边界来进行确定。这样发送方，就可以根据这个选项字段只重传丢失的数据了。

可靠传输小结

到这里关于TCP的可靠传输原理就已经介绍得差不多。最后进行一个小结：

通过连续ARQ协议与发送-确认回复模式来保证每一个数据包都到达接收方

通过给字节编号的方法，来标记每一个数据是属于重传还是新的数据

通过超时重传的方式，来解决数据包在网络中丢失的问题

通过滑动窗口来实现流量控制

通过累积确认+选择确认的方法来提高确认回复与重传的效率

当然，这只是可靠传输的冰山一角，感兴趣可以再深入去研究。

来源：https://www.toutiao.com/i6954183620600906277/

面试官：运行 ping xxx 的时候发生了什么？问倒一大片。。。

点击关注? 民工哥技术之路 2023-05-19 08:21 发表于安徽

收录于合集#TCP/IP 网络协议栈15个

点关注公众号，回复“1024”获取2TB学习资源！

民工哥技术之路
专注系统、Java后端、架构设计、微服务、集群、中间件等开源技术分享（后台回复 1024 免费赠送资源），关注我！一同成长！

380篇原创内容

公众号

前几天一个读者和我聊天，谈起现在的面试，有时候面试官的问题问的真的非常的***钻，比如：有一次三面面试官问他：当你运行 ping xxx 的时候发生了什么？搞的他一脸懵逼。。。

其实，像这类问题，是最能考查应聘者的基础理论扎不扎实的。所以，今天民工哥就带大家一起深入探讨一下这个问题。

话不多唠，直接上干货！！！！！

你知道ping命令是如何工作的吗？

我们用来测试一台机器与另一台机器的网络连通性一般会使用ping命令，那么你知道ping命令是如何工作的吗？ping命令是基于ICMP协议工作的。

介绍 ICMP 协议

因特网控制报文协议ICMP（Internet Control Message Protocol）是一个差错报告机制，其主要用在IP机器与路由器之间传递控制信息，其一般用于报告主机是否可达、路由是否可用。

为什么需要 ICMP？

在网络数据包的传输过程中，经常会遇到各种各样的问题，IP协议提供Best-Effort（尽力而为）的服务，尽力而为的意思是当网络发生拥塞的时候，会立刻丢弃网络数据包，一直到网络拥塞现象减轻时。所以经常有些数据包中途被丢弃，可能还有其他更多的问题，所以需要网络数据包在出现问题时，机器向上层协议报告异常，以便进行流量控制和差错控制，使用ICMP就可以实现这一功能。

ICMP 的格式

上图是ICMP的格式，IP数据报由IP头和ICMP报文组成。ICMP报文由8位的类型、8位的代码、16位的校验和ICMP都数据部分组成。

ICMP的数据部分根据类型和代码不同而不同，如果是请求与响应的数据包，那么数据部分由16位的标识符、16位的序号以及数据组成。如果是差错报文，那么数据部分由两个16位的unused部分和IP头、8字节的正文组成。

查询报文

我们的ping命令就是查询报文，如果一切顺利，我们发送8.echo请求，然后会收到0.echo响应，这就证明两机器之间是连通的。

但是这个数据包比原生的ICMP，多了两个字段——标识符、序号。

怎么理解呢？如果你搞过装修，你应该知道建材店之间组成的销售联盟，联盟派出去两拨人，一批是跑业务的，一批是做广告的，都穿着同样的广告衫，需要一个标识区分这两批人。而派出去的人需要编号，如果到了吃午饭的时间，出去跑业务的20个人回来一小部分，说明情况不妙，如果全部回来，说明情况很好。

在选项数据中，ping 还会存放发送请求的时间值，来计算往返时间，说明路程的长短。

差错报文

我们可以了解下面几种常见的ICMP差错报文：

3-目的不可达

4-原点抑制消息

11-ICMP超时

5-重定向

3-目的不可达

当类型3目的不可达，有以下几种常见代码：

出现目标网络不可达报文的情况是数据包到达路由器，但是路由表中没有数据包中IP地址的网络号。

目标主机不可达报文是路由器中没有找到目标主机的信息，也有可能是目标主机没有连接到网络。

目标协议不可达报文情况当你给目标主机发送UDP报文时，目标主机的防火墙禁止UDP协议数据包进入，于是ICMP通知目标协议不可达。

目标端口不可达报文是你的数据包要进入目标主机的22端口，建立SSH连接，而目标主机的22端口没有开放，这时候ICMP就会返回目标端口不可达报文给源主机。

要求分段并设置DF flag标志报文的情况如下：源主机发送的IP数据包首部的分片禁止标志位设置为1之后，路由器遇到超过MTU大小的数据包会直接抛弃，不会分片，然后ICMP给源主机发送要求分段并设置DF flag标志报文

4-原点抑制消息

如果网络中遇到拥塞，就能向源主机发送一个ICMP原点抑制消息，收到该消息的机器就会增大数据包的传输间隔。是为原点抑制。

11-ICMP超时

为了限制IP数据包在计算机网络中的存在的时间，我们给数据包设计一个值TTL，能够避免IP包在网络中的无限循环和收发，节省了网络资源。

但是为了能使IP包的发送者能收到告警消息，ICMP开始大显身手，路由器会发送一个 ICMP 超时消息给源主机。

5-重定向

如若路由器发现源主机不是使用最优路径发送数据，路由器就会发送重定向消息给源主机。

ping 的发送和接收过程

我们使用ping命令去请求同一个子网的目的主机。

向目的主机发送回显请求

首先，机器会构建一个类型为8、代号为0的Echo请求报文。通过上图，我们可以了解，ICMP的类型是8，代码是0等数据。

目的服务器发送回显应答

通过比较，我们可以看到在ICMP报文层，Echo请求报文与Echo响应报文除了Type、Code（看起来没变化，其实含义已经不同）发生变化，其他基本上都是一样的。

源主机显示相关信息

发送回显请求数据包的时间，与接收到回显应答数据包的时间差，就能计算出数据包一去一回所需要的时间。

ICMP—Traceroute命令

Traceroute能够利用ICMP的规则，故意制造一些产生错误的场景。

Traceroute 的第一个作用为故意设置特殊的 TTL，来追踪去往目的地时沿途经过的路由器。

思路很骚啊~我给你慢慢道来：

先设置TTL为1，数据包到第一个路由器就嗝屁，临死前把第一个路由器的IP搞到手了。返回时间超时的ICMP差错报文。

然后设置TTL为2，数据包到第二个路由器嗝屁，临死前把第二个路由器的IP搞到手。

再设置TTL为3...

以此类推，直到到达目的主机，如此就拿到了线路上所有路由器的IP。

那么Traceroute怎么知道自己发送的UDP包到达目的主机呢？

思路也很骚啊！！！

它用不可能出现的值作为UDP的端口号，数据报达到目的主机，就会返回ICMP 差错报文，类型为端口不可达。

Traceroute 还有一个作用是故意设置不分片，从而确定路径的 MTU。

这个很容易想到啊，一旦返回类型为“需要进行分片但设置了不分片位”的ICMP差错报文就减小分组长度，直到达到目的主机，这不就测试出了整个路径的MTU吗？

好家伙好家伙，思路真棒！点赞！别忘了给咱家点个赞啊！

来源：https://juejin.cn/post/7129350312720072734