9.渐入佳境 -- 套接字的多种可选项
前言
套接字具有多种特性,这些特性可通过可选项更改。本章将介绍更改套接字可选项的方法,并以此为基础进一步观察套接字内部。
一、套接字可选项和I/O缓冲大小
我们进行套接字编程时往往只关注数据通信,而忽略了套接字具有的不同特性。但是,理解这些特性并根据实际需要进行更改也十分重要。
1.套接字多种可选项
我们之前写的程序都是创建好套接字后(未经特别操作)直接使用的,此时通过默认的套接字特性进行数据通信。之前的示例比较简单,无需特别操作套接字特性,但有时的确需要更改。
下表列出了一部分套接字可选项:
从表中可以看出,套接字可选项是分层的。IPPROTO_IP层可选项是IP协议相关事项,IPPROTO_TCP层可选项是TCP协议相关的事项,SOL_SOCKET层是套接字相关的通用可选项。
也许有人看到表格会产生畏惧感,但现在不用全部背下来或理解,因此大家不必有负担。实际能够设置的可选项数量是表中的好几倍,也无需一下子理解所有可选项,实际工作中慢慢掌握。接触的可选项多了,自然会掌握大部分重要的。我们也只介绍其中一部分重要的可选项含义及更改方法。
2.getsockopt & setsockopt
我们几乎可以针对上表中的所有可选项进行读取(Get)和设置(Set)(当然,有些可选项只能进行一种操作)。可选项的读取和设置通过如下2个函数完成:
#include <sys/socket.h>
int getsockopt(int sock, int level, int optname, void *optval, socklen_t *optlen);
// 成功时返回0,失败时返回-1。
// sock -- 用于查看选项套接字文件描述符。
// level -- 要查看的可选项的协议层。
// optname -- 要查看的可选项名。
// optval -- 保存查看结果的缓冲地址值。
// optlen -- 向第四个参数optval传递的缓冲大小。调用函数后,该变量中保存通过第四个参数返回的可选项信息的字节数。
上面这个函数用于读取套接字可选项,并不难。接下来介绍更改可选项时调用的函数:
#include <sys/socket.h>
int setsockopt(int sock, int level, int optname, const void *optval, socklen_t optlen);
// 成功时返回0,失败时返回-1。
// sock -- 用于更改可选项的套接字文件描述符。
// level -- 要更改的可选项协议层。
// optname -- 要更改的可选项名。
// optval -- 保存要更改的选项信息的缓冲地址值。
// optlen -- 向第四个参数optval传递的可选项信息的字节数。
接下来介绍这些函数的调用方法。关于setsockopt函数的调用方法在其他的示例中给出,先介绍getsockopt函数的调用方法。下面示例用协议层为SOL_SOCKET、名为SO_TYPE的可选项查看套接字类型(TCP或UDP):
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/socket.h>
void error_handling(char* message);int main(int argc, char *argv[])
{int tcp_sock, udp_sock;int sock_type;socklen_t optlen;int state;optlen=sizeof(sock_type);tcp_sock=socket(PF_INET,SOCK_STREAM, 0);udp_sock=socket(PF_INET,SOCK_DGRAM, 0);printf("SOCK_STREAM: %d \n",SOCK_STREAM);printf("SOCK_DGRAM: %d \n", SOCK_DGRAM);state=getsockopt(tcp_sock, SOL_SOCKET, SO_TYPE, (void*)&sock_type, &optlen);if(state)error_handling("getsockopt() error!");printf("Socket type one: %d \n", sock_type);state=getsockopt(udp_sock, SOL_SOCKET, SO_TYPE, (void*)&sock_type, &optlen);if(state)error_handling("getsockopt() error!");printf("Socket type two: %d \n", sock_type);return 0;
}void error_handling(char* message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
第15、16行:分别生成TCP、UDP套接字。
第17、18行:输出创建TCP、UDP套接字时传入的SOCK_STREAM、SOCK_DGRAM。
第20、25行:获取套接字类型信息。如果是TCP套接字,将获得SOCK_STREAM常数值1;如果是UDP套接字,则获得SOCK_DGRAM的常数值2。
这个例子给出了调用getsockopt函数查看套接字信息的方法。另外,用于验证套接字类型的SO_TYPE是典型的只读可选项,这一点可以通过下面这句话解释:
“套接字类型只能在创建时决定,以后不能再更改。”
3.SO_SNDBUF & SO_RCVBUF
前面介绍过,创建套接字将同时生成/O缓冲。如果各位忘了这部分内容,可以复习第5章节。接下来将介绍I/O缓冲相关可选项。
SO_RCVBUF是输人缓冲大小相关可选项,SO_SNDBUF是输出缓冲大小相关可选项。用这2个可选项既可以读取当前I/O缓冲大小,也可以进行更改。通过下列示例读取创建套接字时默认的I/O缓冲大小。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/socket.h>
void error_handling(char* message);int main(int argc, char *argv[])
{int sock;int snd_buf, rcv_buf, state;socklen_t len;sock=socket(PF_INET,SOCK_STREAM,0);len=sizeof(snd_buf);state=getsockopt(sock, SOL_SOCKET, SO_SNDBUF,(void*)&snd_buf, &len);if(state)error_handling("getsockopt() error");len=sizeof(rcv_buf);state=getsockopt(sock, SOL_SOCKET, SO_RCVBUF, (void*)&rcv_buf, &len);if(state)error_handling("getsockopt() error");printf("Input buffer size: %d \n", rcv_buf);printf("Output buffer size: %d \n",snd_buf);return 0;
}void error_handling(char* message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
这是我系统中的运行结果,与大家的运行结果相比可能有较大差异。接下来的程序中将更改I/O缓冲大小。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/socket.h>
void error_handling(char* message);int main(int argc, char *argv[])
{int sock;int snd_buf=1024*3,rcv_buf=1024*3;int state;socklen_t len;sock=socket(PF_INET,SOCK_STREAM,0);state=setsockopt(sock, SOL_SOCKET, SO_RCVBUF,(void*)&rcv_buf, sizeof(rcv_buf));if(state)error_handling("setsockopt() error!");state=setsockopt(sock, SOL_SOCKET, SO_SNDBUF, (void*)&snd_buf, sizeof(snd_buf));if(state)error_handling("setsockopt() error!");len=sizeof(snd_buf);state=getsockopt(sock, SOL_SOCKET, SO_SNDBUF, (void*)&snd_buf,&len);if(state)error_handling("getsockopt() error!");len=sizeof(rcv_buf);state=getsockopt(sock, SOL_SOCKET, SO_RCVBUF, (void*)&rcv_buf,&len);if(state)error_handling("getsockopt() error!");printf("Input buffer size: %d \n", rcv_buf);printf("output buffer size: %d \n", snd_buf);return 0;
}void error_handling(char* message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
第15、19行:1/O缓冲大小更改为3M字节。
第24、29行:为了验证I/O缓冲的更改,读取缓冲大小。
输出结果跟我们预想的完全不同,但也算合理。缓冲大小的设置需谨慎处理,因此不会完全按照我们的要求进行,只是通过调用setsockopt函数向系统传递我们的要求。如果把输出缓冲设置为0并如实反映这种设置,TCP协议将如何进行?如果要实现流控制和错误发生时的重传机制,至少要有一些缓冲空间吧?上述示例虽没有100%按照我们的请求设置缓冲大小,但也大致反映出了通过setsockopt函数设置的缓冲大小。
二、SO_REUSEADDR
1.发生地址分配错误
学习SO_REUSEADDR可选项之前,应理解好Time-wait状态。我们读完下列示例后再讨论后续内容。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>#define TRUE 1
#define FALSE 0
void error_handling(char* message);int main(int argc, char *argv[])
{int serv_sock, clnt_sock;char meSSage[30];int option, str_len;socklen_t optlen, clnt_adr_sz;struct sockaddr_in serv_adr, clnt_adR;if(argc!=2) {printf("Usage : %s <port>\n", argv[o]);exit(1);}serv_sock=socket(PF_INET, SOCK_STREAM, 0):if(serv_sock==-1)error_handling("socket() error");/*optlen=sizeof(option);optION=TRUE;setSockopt(serv_SOck, SOL_SOCKET, SO_REUSEADDR, (void*)&option,*/memset(&serv_adr,0,sizeof(serv_adr));SERV_ADR.SIN_fAMILY=AF_INET;serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);serv_adr.sin_port=htons(atoi(argv[1]));if(bind(serv_sock, (struct sockaddr*)&serv_adr, sizeof(serv_adr)))error_hAnDling("bInd() eRRor");if(1isten(serv_sock, 5)==-1)error_handling("listen eRror");clnt_adr_sz=sizeof(clnt_adr);clnt_sock=accept(serv_sock, (struct sockaddr*)&clnt_adr,&clnt_adr_sz);while((str_len=read(clnt_sock,message, sizeof(message)))!= 0){write(clnt_sock, message, str_len);write(1,message,stR_len);}close(clnt_sock);close(serv_sock);return 0;
}void error_handling(char* message)
{fputs(message, stderr);fputc('\n', stderr);exit(1);
}
这个示例是之前已实现过多次的回声服务器端,可以结合第4章节介绍过的回声客户端运行。下
面运行该示例,第28~30行应保持注释状态。通过如下方式终止程序:
“在客户端控制台输入Q消息,或通过CTRL+C终止程序。”
也就是说,让客户端先通知服务器端终止程序。在客户端控制台输入Q消息时调用close函数(参考第4章节的echo_client.c),向服务器端发送FIN消息并经过四次握手过程。当然,输入CTRL+C时也会向服务器传递FIN消息。强制终止程序时,由操作系统关闭文件及套接字,此过程相当于调用close函数,也会向服务器端传递FIN消息。
“但看不到什么特殊现象啊?”
是的,通常都是由客户端先请求断开连接,所以不会发生特别的事情。重新运行服务器端也
不成问题,但按照如下方式终止程序时则不同。
“服务器端和客户端已建立连接的状态下,向服务器端控制台输入CTRL+C,即强制关闭服务器端。”
这主要模拟了服务器端向客户端发送FIN消息的情景。但如果以这种方式终止程序,那服务器端重新运行时将产生问题。如果用同一端口号重新运行服务器端,将输出“bindOerror”消息,并且无法再次运行。但在这种情况下,再过大约3分钟即可重新运行服务器端。上述2种运行方式唯一的区别就是谁先传输FIN消息,但结果却回然不同,原因何在呢?
2.Time-wait状态
相信大家已对四次握手有了很好的理解,先观察该过程,下图所示:
假设图9-1中主机A是服务器端,因为是主机A向B发送FIN消息,可以想象成服务器端在控制台输人CTRL+C。但问题是,套接字经过四次握手过程后并非立即消除,而是要经过一段时间的Time-wait状态。当然,只有先断开连接的(先发送FIN消息的)主机才经过Time-wait状态。因此,若服务器端先断开连接,则无法立即重新运行。套接字处在Time-wait过程时,相应端口是正在使用的状态。因此,就像之前验证过的,bind函数调用过程中当然会发生错误。
– 客户端套接字不会经过Time-wait 过程吗?
有些人会误以为Time-wait过程只存在于服务器端。但实际上,不管是服务器端还是客户端,套接字都会有Time-wait过程。先断开连接的套接字必然会经过Time-wait过程。但无需考虑客户端Time-wait状态。因为客户端套接字的端口号是任意指定的。与服务器端不同,客户端每次运行程序时都会动态分配端口号,因此无需过多关注Time-wait状态。
到底为什么会有Time-wait状态呢?图9-1中假设主机A向主机B传输ACK消息(SEQ5001、ACK7502)后立即消除套接字。但最后这条ACK消息在传递途中丢失,未能传给主机B。这时会发生什么?主机B会认为之前自已发送的FIN消息(SEQ7501、ACK5001)未能抵达主机A,继而试图重传。但此时主机A已是完全终止的状态,因此主机B永远无法收到从主机A最后传来的ACK消息。相反,若主机A的套接字处在Time-wait状态,则会向主机B重传最后的ACK消息,主机B也可以正常终止。基于这些考虑,先传输FIN消息的主机应经过Time-wait过程。
3.地址再分配
Time-wait看似重要,但并不一定讨人喜欢。考虑一下系统发生故障从而紧急停止的情况。这时需要尽快重启服务器端以提供服务,但因处于Time-wait状态而必须等待几分钟。因此,Time-wait并非只有优点,而且有些情况下可能引发更大问题。图9-2演示了四次握手时不得不延长Time-wait过程的情况。
如图所示,在主机A的四次握手过程中,如果最后的数据丢失,则主机B会认为主机A未能收到自己发送的FIN消息,因此重传。这时,收到FIN消息的主机A将重启Time-wait计时器。因此,如果网络状况不理想,Time-wait状态将持续。解决方案就是在套接字的可选项中更改SO_REUSEADDR的状态。适当调整该参数,可将Time-wait状态下的套接字端口号重新分配给新的套接字。SOREUSEADDR的默认值为0(假),这就意味着无法分配Time-wait状态下的套接字端口号。因此需要将这个值改成1(真)。具体做法已在示例reuseadr_eserver.c中给出,只需去掉下述代码的注释就行了哦。
optlen=sizeof(option);
option=TRUE;
setsockopt(serv_sock, SOL_SOCKET, SO_REUSEADDR, (void*) &option, optlen);
各位是否去掉了注释?既然服务器端reuseadr_eserver.c已变成可随时运行的状态,希望大家在Time-wait状态下验证其能否重新运行。
三、TCP_NODELAY
“什么是Nagle算法?使用该算法能够获得哪些数据通信特性?”
大家容易忽视的一个问题就是Nagle算法,下面我们一起学习。
1.Nagle算法
为防止因数据包过多而发生网络过载,Nagle算法在1984年诞生了。它应用于TCP层,非常简单。其使用与否会导致如图所示差异。
图中展示了通过Nagle算法发送字符串“Nagle”和未使用Nagle算法的差别。可以得到结论:“只有收到前一数据的ACK消息时,Nagle算法才发送下一数据。”
TCP套接字默认使用Nagle算法交换数据,因此最大限度地进行缓冲,直到收到ACK。图左侧正是这种情况。为了发送字符串“Nagle”,将其传递到输出缓冲。这时头字符“N”之前没有其他数据(没有需接收的ACK),因此立即传输。之后开始等待字符“N”的ACK消息,等待过程中,剩下的“agle”填人输出缓冲。接下来,收到字符“N”的ACK消息后,将输出缓冲的“agle”装人一个数据包发送。也就是说,共需传递4个数据包以传输1个字符串。接下来分析未使用Nagle算法时发送字符串“Nagle”的过程。假设字符“N”到“e”依序传到输出缓冲。此时的发送过程与ACK接收与否无关,因此数据到达输出缓冲后将立即被发送出去。
从图右侧可以看到,发送字符串“Nagle”时共需10个数据包。由此可知,不使用Nagle算法将对网络流量(Traffic:指网络负载或混杂程度)产生负面影响。即使只传输1个字节的数据,其头信息都有可能是几十个字节。因此,为了提高网络传输效率,必须使用Nagle算法。
但Nagle算法并不是什么时候都适用。根据传输数据的特性,网络流量未受太大影响时,不使用Nagle算法要比使用它时传输速度快。最典型的是“传输大文件数据”。将文件数据传人输出缓冲不会花太多时间,因此,即便不使用Nagle算法,也会在装满输出缓冲时传输数据包。这不仅不会增加数据包的数量,反而会在无需等待ACK的前提下连续传输,因此可以大大提高传输速度。
一般情况下,不适用Nagle算法可以提高传输速度。但如果无条件放弃使用Nagle算法,就会增加过多的网络流量,反而会影响传输。因此,未准确判断数据特性时不应禁用Nagle算法。
2.禁用Nagle算法
刚才说过的“大文件数据”应禁用Nagle算法。换言之,如果有必要,就应禁用Nagle算法。
“Nagle算法使用与否在网络流量上差别不大,使用Nagle算法的传输速度更慢”
禁用方法非常简单。从下列代码也可看出,只需将套接字可选项TCP_NODELAY改为1(真)即可:
int opt_val=1;
setsockopt(sock, IPPROTo_TCP, TCP_NODELAY, (void *) &opt_val, sizeof(opt_val));
可以通过TCP_NODELAY的值查看Nagle算法的设置状态:
int opt_val;
socklen_t opt_len;
opt_len=sizeof(opt_val);
getsockopt(sock, IPPROTo_TCP, TCP_NODELAY, (void*) &opt_val, &opt_len);
如果正在使用Nagle算法,Opt_val变量中会保存0;如果已禁用Nagle算法,则保存1。
总结
大家学的怎么样,有没有和之前的知识都连起来了呢?