【Linux网络编程】数据链路层
目录
认识以太网
以太网帧格式
认识MAC地址
认识MTU
MTU对IP协议的影响
MTU对UDP协议的影响
MTU对TCP协议的影响
ARP协议
ARP协议的作用
ARP数据包的格式
ARP协议的工作流程
认识以太网
"以太网"不是一种具体的网络,而是一种技术标准;即包含了数据链路层的内容,也包含了一些物理层的内容。例如:规定了网络拓扑结果,访问控制方式,传输速率等等。
例如以太网中的网线必须使用双绞线;传输速率有 10M, 100M, 1000M 等;
以太网是当前应用最广泛的局域网技术,和以太网并列的还有令牌环网,无线LAN 等;
以太网帧格式
源地址和目的地址是指网卡的硬件地址(也叫MAC地址),长度是48位(6个字节),是在网卡出厂时固化的。
帧协议类型字段有三种值,分别对应IP,ARP,RARP;
帧末尾是CRC校验码。
认识MAC地址
MAC地址是用来识别数据链路层种相关的节点。
长度位48位,即6个字节。一般用16进制数字加上冒号的形式表示(例如:08:00:27:03:fb:19);
可以 通过arp -a命令查看。
在网卡出厂时就确定了,不能修改。mac 地址通常是唯一的(虚拟机中的 mac 地址不是真实的 mac 地址,可能会冲突;也有些网卡支持用户配置 mac 地址)。
对比理解MAC地址和IP地址
- IP 地址描述的是路途总体的 起点 和 终点;
- MAC 地址描述的是路途上的每一个区间的起点和终点;
认识MTU
数据链路层规定对应的报文大小不能超过最大传输单元(MTU);否则需要对数据包进行分片(fragmentation),这个工作是在网络层完成的,网络层的IP协议中的16位标识,3位标志,13位片偏移可以实现数据包的分片和组装工作。
以太网帧中的数据长度规定最小 46 字节,最大 1500 字节,ARP 数据包的长度不够 46 字节,要在后面补填充位;
最大值 1500 称为以太网的最大传输单元(MTU),不同的网络类型有不同的MTU;
不同的数据链路层标准的 MTU 是不同的;
MTU对IP协议的影响
由于数据链路层 MTU 的限制,对于较大的 IP 数据包要进行分包。
- 将较大的 IP 包分成多个小包, 并给每个小包打上标签;
- 每个小包 IP 协议头的 16 位标识(id) 都是相同的;
- 每个小包的 IP 协议头的 3 位标志字段中, 第 2 位置为 0, 表示允许分片, 第 3 位来表示结束标记(当前是否是最后一个小包,是的话置为 1,否则置为 0);
- 到达对端时再将这些小包,会按顺序重组,拼装到一起返回给传输层;
- 一旦这些小包中任意一个小包丢失,接收端的重组就会失败。但是 IP 层不会负责重新传输数据;
MTU对UDP协议的影响
一旦 UDP 携带的数据超过 1472(1500 - 20(IP 首部) - 8(UDP 首部)),那么就会在网络层分成多个 IP 数据报。
这多个 IP 数据报有任意一个丢失,都会引起接收端网络层重组失败。那么这就意味着,如果 UDP 数据报在网络层被分片,整个数据被丢失的概率就大大增加了。
MTU对TCP协议的影响
TCP 的一个数据报也不能无限大, 还是受制于 MTU;TCP 的单个数据报的最大消息长度,称为 MSS(Max Segment Size)。
- TCP 在建立连接的过程中,通信双方会进行 MSS 协商。
- 最理想的情况下,MSS 的值正好是在 IP 不会被分片处理的最大长度(这个长度仍然是受制于数据链路层的 MTU)。
- 双方在发送 SYN 的时候会在 TCP 头部写入自己能支持的 MSS 值。
- 然后双方得知对方的 MSS 值之后,选择较小的作为最终 MSS。
- MSS 的值就是在 TCP 首部的 40 字节变长选项中(kind=2)。
ARP协议
如上图,主机A在 向主机B发送数据的时候,是需要将数据进行一层一层的封装,向下交付,到达网络层,需要封装IP报头,其中包含源IP地址和目标主机的IP地址。到达数据链路层时,需要加上MAC帧报头 ,其中包含源MAC地址和目标主机的MAC地址。
但是现在的问题是,当前的两台主机只能知道对方的IP地址,不知道对方的MAC地址,需要进行通信,必须 要先获取到对方的MAC地址。这时就需要使用ARP协议。
ARP协议的作用
ARP 协议建立了主机 IP 地址 和 MAC 地址 的映射关系。
- 在网络通讯时,源主机的应用程序知道目的主机的 IP 地址和端口号,却不知道目的主机的硬件地址(MAC地址);
- 数据包首先是被网卡接收到再去处理上层协议的,如果接收到的数据包的硬件地址与本机不符,则直接丢弃;
- 因此在通讯前必须获得目的主机的硬件地址;
ARP数据包的格式
- 硬件类型指链路层网络类型,1为以太网;
- 协议类型指要转换的地址类型,0x0800为IP地址;
- 硬件地址长度对于以太网地址为 6 字节;
- 协议地址长度对于和 IP 地址为 4 字节;
- op 字段为 1 表示 ARP 请求,op 字段为2表示ARP应答。
ARP协议的工作流程
- 源主机发出 ARP 请求,询问“IP地址是 172.20.1.2的主机的硬件地址是多少”;并将这个请求广播到本地网段(以太网帧首部的硬件地址填 FF:FF:FF:FF:FF:FF 表示广播);
- 目的主机接收到广播的 ARP 请求,发现其中的 IP 地址与本机相符,则发送一个ARP 应答数据包给源主机,将自己的硬件地址填写在应答包中;
- 每台主机都维护一个 ARP 缓存表,可以用 arp -a 命令查看。缓存表中的表项有过期时间(一般为 20 分钟),如果 20 分钟内没有再次使用某个表项,则该表项失效,下次还要发 ARP 请求来获得目的主机的硬件地址。
为什么要有缓存表? 为什么表项要有过期时间而不是一直有效?
IP地址是变化的,同过DHCP,由局域网中的路由器给我们动态分配。所以不可能永久 记录,只能暂时记录下来。