数据链路层(2)
数据链路层(2)
认识 MAC 地址
• MAC 地址用来识别数据链路层中相连的节点;
• 长度为 48 位, 及 6 个字节. 一般用 16 进制数字加上冒号的形式来表示(例如:08:00:27:03:fb:19)
• 在网卡出厂时就确定了, 不能修改. mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址).
对比理解 MAC 地址和 IP 地址
• IP 地址描述的是路途总体的 起点 和 终点;
• MAC 地址描述的是路途上的每一个区间的起点和终点;
认识 MTU
MTU 相当于发快递时对包裹尺寸的限制. 这个限制是不同的数据链路对应的物理层, 产生的限制.
• 以太网帧中的数据长度规定最小 46 字节,最大 1500 字节,ARP 数据包的长度不够 46 字节,要在后面补填充位;
• 最大值 1500 称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU;
• 如果一个数据包从以太网路由到拨号链路上,数据包长度大于拨号链路的 MTU了,则需要对数据包进行分片(fragmentation);
• 不同的数据链路层标准的 MTU 是不同的;
MTU 对 IP 协议的影响
由于数据链路层 MTU 的限制, 对于较大的 IP 数据包要进行分包。
• 将较大的 IP 包分成多个小包, 并给每个小包打上标签;
• 每个小包 IP 协议头的 16 位标识(id) 都是相同的;
• 每个小包的 IP 协议头的 3 位标志字段中, 第 2 位置为 0, 表示允许分片, 第 3 位来表示结束标记(当前是否是最后一个小包, 是的话置为 1, 否则置为 0);
• 到达对端时再将这些小包, 会按顺序重组, 拼装到一起返回给传输层;
• 一旦这些小包中任意一个小包丢失, 接收端的重组就会失败. 但是 IP 层不会负责重新传输数据;
MTU 对 UDP 协议的影响
让我们回顾一下 UDP 协议:
• 一旦 UDP 携带的数据超过 1472(1500 - 20(IP 首部) - 8(UDP 首部)), 那么就会在网络层分成多个 IP 数据报.
• 这多个 IP 数据报有任意一个丢失, 都会引起接收端网络层重组失败. 那么这就意味着, 如果 UDP 数据报在网络层被分片, 整个数据被丢失的概率就大大增加了.
MTU 对于 TCP 协议的影响
让我们再回顾一下 TCP 协议:
• TCP 的一个数据报也不能无限大, 还是受制于 MTU. TCP 的单个数据报的最大消息长度, 称为 MSS(Max Segment Size);
• TCP 在建立连接的过程中, 通信双方会进行 MSS 协商.
• 最理想的情况下, MSS 的值正好是在 IP 不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的 MTU).
• 双方在发送 SYN 的时候会在 TCP 头部写入自己能支持的 MSS 值.
• 然后双方得知对方的 MSS 值之后, 选择较小的作为最终 MSS.
• MSS 的值就是在 TCP 首部的 40 字节变长选项中(kind=2);
MSS 和 MTU 的关系
查看硬件地址和 MTU
使用 ifconfig 命令, 即可查看 ip 地址, mac 地址, 和 MTU;
ARP 协议
虽然我们在这里介绍 ARP 协议, 但是需要强调, ARP 不是一个单纯的数据链路层的协议, 而是一个介于数据链路层和网络层之间的协议;
ARP 协议的作用
ARP 协议建立了主机 IP 地址 和 MAC 地址 的映射关系.
• 在网络通讯时,源主机的应用程序知道目的主机的 IP 地址和端口号,却不知道目的主机的硬件地址;
• 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃;
• 因此在通讯前必须获得目的主机的硬件地址;
ARP 协议的工作流程
• 源主机发出 ARP 请求,询问“IP 地址是 192.168.0.1 的主机的硬件地址是多少”,并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);
• 目的主机接收到广播的 ARP 请求,发现其中的 IP 地址与本机相符,则发送一个ARP 应答数据包给源主机,将自己的硬件地址填写在应答包中;
• 每台主机都维护一个 ARP 缓存表,可以用 arp -a 命令查看。缓存表中的表项有过期时间(一般为 20 分钟),如果 20 分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP 请求来获得目的主机的硬件地址
想一想,为什么要有缓存表? 为什么表项要有过期时间而不是一直有效?
再想一想, 结合我们刚才讲的工作流程, ARP 的数据报应该是一个什么样的格式?
1. 为什么要有缓存表?
缓存表(如 ARP 缓存表、DNS 缓存等)的核心作用是 提高效率并减少冗余通信,具体原因包括:
(1) 减少重复计算/查询
- 避免重复广播请求:例如,ARP 协议中,每次需要 IP 对应的 MAC 地址时,如果每次都广播
ARP Request
,会浪费网络带宽。 - 降低延迟:直接从缓存读取比每次重新查询更快(如 DNS 缓存减少域名解析时间)。
(2) 减轻网络负载
- 缓存表减少了广播/单播请求的频率,避免网络拥塞(尤其在大型网络中)。
(3) 容错与稳定性
- 即使目标主机暂时不可达(如断网),缓存表仍能提供历史记录,部分业务可继续运行。
2. 为什么表项要有过期时间(TTL)?
缓存表项 不能永久有效,必须设置过期时间(如 ARP 缓存默认 15-20 分钟),原因包括:
(1) 适应动态变化的网络环境
- IP-MAC 映射可能变化:例如:
- 设备更换网卡 → MAC 地址改变。
- DHCP 重新分配 IP → 同一 IP 可能对应新设备。
- 网络拓扑变化:如路由器更新、主机迁移。
(2) 防止缓存污染或攻击
- ARP 欺骗攻击:黑客可能伪造 ARP 响应,若缓存永久有效,会导致长期流量劫持。
- 过时数据累积:无效表项会占用内存,降低查询效率。
(3) 平衡实时性与效率
- TTL 是折中方案:
- 太短:频繁查询,增加延迟。
- 太长:可能返回过期数据。
3. ARP 数据报的格式
结合 ARP 的工作流程(请求-响应),其数据报格式如下(以以太网 IPv4 为例):
ARP 报文头部(28 字节)
字段名 | 长度(字节) | 说明 |
---|---|---|
硬件类型(HTYPE) | 2 | 网络类型,如 1 表示以太网。 |
协议类型(PTYPE) | 2 | 上层协议类型,如 0x0800 表示 IPv4。 |
硬件地址长度(HLEN) | 1 | MAC 地址长度(以太网为 6 )。 |
协议地址长度(PLEN) | 1 | IP 地址长度(IPv4 为 4 )。 |
操作码(OPER) | 2 | 1 =ARP 请求,2 =ARP 响应,3 =RARP 请求,4 =RARP 响应。 |
发送方 MAC(SHA) | 6 | 发送者的 MAC 地址。 |
发送方 IP(SPA) | 4 | 发送者的 IP 地址。 |
目标 MAC(THA) | 6 | 目标的 MAC 地址(请求时为 00:00:00:00:00:00 ,响应时填充)。 |
目标 IP(TPA) | 4 | 目标的 IP 地址(请求时为待查询的 IP)。 |
以太网封装(14 字节头部)
- 目的 MAC:ARP 请求时为广播地址
FF:FF:FF:FF:FF:FF
,响应时为请求者 MAC。 - 源 MAC:发送者的 MAC 地址。
- 类型:
0x0806
表示 ARP 报文。
4. ARP 报文示例
ARP 请求(广播)
以太网头部:Destination: FF:FF:FF:FF:FF:FFSource: 11:22:33:44:55:66Type: 0x0806 (ARP)ARP 报文:HTYPE: 1 (Ethernet)PTYPE: 0x0800 (IPv4)HLEN: 6PLEN: 4OPER: 1 (Request)SHA: 11:22:33:44:55:66SPA: 192.168.1.2THA: 00:00:00:00:00:00 (未知)TPA: 192.168.1.1 (查询的目标 IP)
ARP 响应(单播)
以太网头部:Destination: 11:22:33:44:55:66 (请求者的 MAC)Source: AA:BB:CC:DD:EE:FF (目标的 MAC)Type: 0x0806 (ARP)ARP 报文:HTYPE: 1PTYPE: 0x0800HLEN: 6PLEN: 4OPER: 2 (Reply)SHA: AA:BB:CC:DD:EE:FFSPA: 192.168.1.1THA: 11:22:33:44:55:66TPA: 192.168.1.2
5. 关键总结
- 缓存表的作用:提升效率、减少冗余通信、增强稳定性。
- TTL 的必要性:应对网络动态变化、防止攻击、平衡性能。
- ARP 报文格式:
- 通过
OPER
区分请求/响应。 - 请求时目标 MAC 为全零,响应时填充。
- 依赖广播(请求)和单播(响应)传递。
- 通过