Linux网络数据链路层
跨网络转发的本质是要经历不同的子网,所以先要保证在同一个子网(局域网)内两台主机能实现通信,这就关乎到数据链路层。
以太网
"以太网" 不是一种具体的网络, 而是一种技术标准; 既包含了数据链路层的内容, 也包含了一些物理层的内容. 例如: 规定了网络拓扑结构, 访问控制方式, 传输速率等; 例如以太网中的网线必须使用双绞线; 传输速率有 10M, 100M, 1000M 等;
以太网是当前应用最广泛的局域网技术; 和以太网并列的还有令牌环网, 无线 LAN 等;
以太网帧格式

格式是固定的,解包时候只要把头和尾巴拆开就行,帧协议类型字段有三种值,分别对应 IP、ARP、RARP;帧末尾是 CRC 校验码。
任何时候局域网只允许一台机器发信息,防止消息碰撞,执行碰撞避免算法(休息一段时间)。这个局域网可以看做临界资源。机器越多越容易发生碰撞,数据帧越长发送碰撞概率越大(MTU最大数据包长度)。
交换机
为了减小碰撞概率,除了把局域网拆分成两个子网,还一种方法就是加个交换机。交换机作用是划分碰撞域。
交换机(Switch)是计算机网络中用于连接多台设备的硬件设备,工作在OSI模型的数据链路层(第二层)或网络层(第三层)。它通过分析数据包的MAC地址或IP地址,将数据定向转发到目标设备,从而提高网络效率和安全性。
交换机类型
- 二层交换机:基于MAC地址转发数据,适用于局域网(LAN)。
- 三层交换机:具备路由功能,支持IP地址转发,常用于大型网络。
- PoE交换机:支持通过网线为设备(如IP摄像头、无线AP)供电。
- 网管型交换机:提供配置界面,支持QoS、端口镜像等高级功能。
与路由器的区别
- 工作层级:交换机通常工作在二层(数据链路层),路由器工作在三层(网络层)。
- 转发依据:交换机依赖MAC地址,路由器依赖IP地址。
- 广播控制:交换机默认泛洪广播包,路由器可隔离广播域。
例如下面有个交换机:

对src和dst属于同一侧不会转发,异侧就会转发,减小了碰撞概率。
MAC地址
• MAC 地址用来识别数据链路层中相连的节点;
• 长度为 48 位, 及 6 个字节. 一般用 16 进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)
• 在网卡出厂时就确定了, 不能修改. mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址, 可能会冲突; 也有些网卡支持用户配置 mac 地址)
转发时候目的IP地址不变,MAC地址一直在变。
MTU
MTU(Maximum Transmission Unit)指网络传输中单次可发送的最大数据包大小,单位为字节。不同网络层和协议对 MTU 有不同限制,通常影响 TCP/IP 协议栈的传输效率。
对IP影响:
由于数据链路层 MTU 的限制, 对于较大的 IP 数据包要进行分包.
• 将较大的 IP 包分成多个小包, 并给每个小包打上标签;
• 每个小包 IP 协议头的 16 位标识(id) 都是相同的;
• 每个小包的 IP 协议头的 3 位标志字段中, 第 2 位置为 0, 表示允许分片, 第 3 位 来表示结束标记(当前是否是最后一个小包, 是的话置为 0, 否则置为 1);
• 到达对端时再将这些小包, 会按顺序重组, 拼装到一起返回给传输层;
• 一旦这些小包中任意一个小包丢失, 接收端的重组就会失败. 但是 IP 层不会负 责重新传输数据;
对UDP影响
• 一旦 UDP 携带的数据超过 1472(1500 - 20(IP 首部) - 8(UDP 首部)), 那么就会在网络层分成多个 IP 数据报.
• 这多个 IP 数据报有任意一个丢失, 都会引起接收端网络层重组失败. 那么这就意味着, 如果 UDP 数据报在网络层被分片, 整个数据被丢失的概率就大大增加了.
对TCP影响:
• TCP 的一个数据报也不能无限大, 还是受制于 MTU. TCP 的单个数据报的最大消息长度称为 MSS(Max Segment Size);
• TCP 在建立连接的过程中, 通信双方会进行 MSS 协商.
• 最理想的情况下, MSS 的值正好是在 IP 不会被分片处理的最大长度(这个长度 仍然是受制于数据链路层的 MTU).
• 双方在发送 SYN 的时候会在 TCP 头部写入自己能支持的 MSS 值.
• 然后双方得知对方的 MSS 值之后, 选择较小的作为最终 MSS.
• MSS 的值就是在 TCP 首部的 40 字节变长选项中(kind=2);

ARP协议
有个问题。在路由表我们只知道下一跳的IP地址而不知道MAC地址。所以我们需要有一种能力能把IP地址转化成MAC地址。这时候需要一种协议:ARP协议。
ARP 不是一个单纯的数据链路层的协议, 而是一个介于数据链路层和网络层之间的协议。ARP是由链路层自动完成,上层感受不到。
• 在网络通讯时,源主机的应用程序知道目的主机的 IP 地址和端口号,却不知道目的主机的硬件地址;
• 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件 地址与本机不符,则直接丢弃;
• 因此在通讯前必须获得目的主机的硬件地址;
工作流程
在发送之前要进行询问,广播一遍询问哪个是目标主机,对方会返回ARP响应包就得到了MAC地址。

• 源主机发出 ARP 请求,询问“IP 地址是 192.168.0.1 的主机的硬件地址是多少”, 并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示 广播);
• 目的主机接收到广播的 ARP 请求,发现其中的 IP 地址与本机相符,则发送一个 ARP 应答数据包给源主机,将自己的硬件地址填写在应答包中;
• 每台主机都维护一个 ARP 缓存表,可以用 arp -a 命令查看。缓存表中的表项有过期时间(一般为 20 分钟),如果 20 分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP 请求来获得目的主机的硬件地址
收到ARP请求的主机解包后要先看类型(op),是ARP请求再看目标IP地址,看看对的上不。同样收到ARP响应报文也要看类型。(都需要先对比目的MAC然后到ARP,FF:FF:FF:FF:FF:FF是个特殊的广播地址,可以直接通过MAC帧)。
ARP数据报的格式

• 注意到源 MAC 地址、目的 MAC 地址在以太网首部和 ARP 请求中各出现一次, 对于链路层为以太网的情况是多余的,但如果链路层是其它类型的网络则有可能是必 要的。
• 硬件类型指链路层网络类型,1 为以太网;
• 协议类型指要转换的地址类型,0x0800 为 IP 地址;
• 硬件地址长度对于以太网地址为 6 字节;
• 协议地址长度对于和 IP 地址为 4 字节;
• op 字段为 1 表示 ARP 请求,op 字段为 2 表示 ARP 应答。
PARP是MAC地址转IP。如果是普通报文的话,直接跳过ARP层。
