基本TCP套接字编程
4.1 概述
在这个篇章里面主要讲解编写一个完整的TCP客户/服务器程序所需要的基本套接字函数。这些API包括socket、connect、bind、listen和accept。
4.2 socket 函数
为了执行网络I/O,一个进程必须做的第一件事情就是调用socket函数,指定期望的通信协议类型(使用IPv4的TCP、使用IPv6的UDP、Unix域字节流协议等)。
#include "sys/socket.h"
int socket(int family,int type,int protocol);
/*若成功则返回非负描述符,若出错则为-1*/
其中family参数指明协议族,它是表4.2.1中所示的某个常值。该参数也往往被称为协议域。
表4.2.1
family | 说明 |
---|---|
AF_INET | IPv4协议 |
AF_INET6 | IPv6协议 |
AF_LOCAL | Unix域协议 |
AF_ROUTE | 路由套接字 |
AF_KEY | 密钥套接字 |
type参数指明套接字类型,它是表4.2.2中所示的某个常值。
表4.2.2
type | 说明 |
---|---|
SOCK_STREAM | 字节流套接字 |
SOCK_DGRAM | 数据报套接字 |
SOCK_SEQPACKET | 有序分组套接字 |
SOCK_RAW | 原始套接字 |
protocol参数应设置为表1.2.3的某个需要类型常值,或者设为0,以选择所给定family和type组合的系统默认值。
表4.2.3
protocol | 说明 |
---|---|
IPPROTO_TCP | TCP传输协议 |
IPPROTO_UDP | UDP传输协议 |
IPPROTO_SCTP | SCTP传输协议 |
并非所有套接字family与type的组合都是有效的,下面给出了一些有效的组合和对应的真正协议。其中标为“是”的项也是有效的,但还没找到便捷的缩略词。而空白项则是无效组合。
socket函数在成功时返回一个小的非负整数值,它与文件描述符类似,我们把它称为套接字描述符,简称sockfd。为了得到这个套接字描述符,我们只是指定了协议族(IPv4、IPv6或Unix)和套接字类型(字节流、数据报或原始套接字)。我们并没有指定本地协议地址或远程协议地址。
4.3 connect 函数
TCP客户用connect 函数来建立与TCP服务器的连接。
#include "sys/socket.h"
int connect(int sockfd,const struct sockaddr *servadrr,socklen_t addrlen);
/*若成功则返回0,失败返回-1*/
sockfd是由socket函数返回的套接字描述符,第二个、第三个参数分别是一个指向套接字地址结构的指针和该结构的大小。套接字的地址结构必须含有服务器的IP地址和端口号。
客户在调用函数connect前不必非得调用bind函数(之后我们会介绍该函数),因为如果需要的话,内核会确定源IP地址,并选择一个临时端口号作为源端口。
如果是TCP套接字,调用connect函数将激发TCP的三路握手过程,而且仅在连接建立或出错时才返回,其中出错返回可能有以下几种情况。
- 若TCP客户没有收到SYN分节的响应,则返回ETIMEDOUT错误。举例来说,调用connect函数时,4.4BSD内核发送一个SYN,若无响应则等待6s后再发送一个,若扔无响应则等待24s后再发送。若总共等了75s后仍未收到响应则返回本错误。有些系统提供对超时值的管理控制。
- 若对客户的SYN的响应是RST(表示复位),则表明该服务器主机在我们指定的端口上没有进程在等待与之连接(例如服务器进程也许没在运行)。这是一种硬错误,客户一接收到RST就马上返回ECONNREFUSED错误。(RST是TCP在发生错误时发送的一种TCP分节。产生RST的三个条件是:(1)目的地为某端口的SYN到达,然而该端口上并没有正在监听的 服务器;(2)TCP想取消一个已有连接;(3)TCP接收到一个根本不存在的连接上的分节。)
- 若客户发出的SYN在中间的某个路由器上引发了一个"destination unreachable"(目的地不可达)ICMP错误,则认为是一种软错误。客户主机内核保存该信息,并按第一种情况中所述的时间间隔继续发送SYN。若在某个规定的时间后仍未收到响应,则把保存的消息(即ICMP错误)作为EHOSTUNREACH或ENETUNREACH错误返回给进程。以下两种情形也是有可能的:一是按照本地系统的转发表,根本没有到达远程系统的路径;二是connect调用根本不等待就返回。
connect函数导致当前套接字从CLOSED状态(该套接字自从由socket函数创建以来一直处于的状态)转移到SYN_SENT状态,若成功则在转移到ESTABLISHED状态。若connect失败则该套接字不再可用,必须关闭,我们不能对这样的套接字再次调用connect函数。
4.4 bind函数
bind函数把一个本地协议地址赋予一个套接字。对于网际网协议,协议地址是32位的IPv4地址或128位的IPv6地址与16位的TCP或UDP端口号的组合。
#include "sys/socket.h"
int bind(int sockfd,const struct sockaddr *myaddr,socklen_t addrlen);
/*若成功则为0.若出错则为-1*/
第二个参数是一个指向特定于协议的地址结构的指针,第三个参数是该地址结构的长度。对于TCP,调用bind函数可以指定一个端口,或指定一个IP地址,也可以两者都指定,还可以都不指定。
- 服务器在启动时捆绑它们的众所周知端口。如果一个TCP客户或服务器未曾调用bind捆绑一个端口,当调用connect或listen时,内核就要为相应的套接字选择一个临时端口。让内核来选择临时端口对于TCP客户来说是正常的,除非应用需要一个预留端口;然而对于TCP服务器来说去极为罕见,因为服务器是通过它们众所周知端口被大家认识的。
- 进程可以把一个特定的IP地址捆绑到它的套接字上,不过这个IP地址必须属于其所在主机的网络接口之一。对于TCP客户,这就为在该套接字上发送的IP数据报指派了源IP地址。对于TCP服务器,这就限定该套接字只接收那些目的地为这个IP地址的客户连接。TCP客户通常不把IP地址捆绑到它的套接字上。当连接套接字时,内核将根据所用外出网络接口来选择源IP地址,而所用外出接口则 取决于到达服务器所需的路径。如果TCP服务器没有把IP地址捆绑到它的套接字上,内核就把客户发送的SYN的目的IP地址作为服务器的源IP地址。
正如我们所说,调用bind可以指定IP地址或端口,可以两者都指定,也可以都不指定。
如果指定端口号为0,那么内核就在bind被调用时选择一个临时端口。然而如果指定IP地址为通配地址,那么内核将等到套接字已连接(TCP)或已在套接字上发出数据报(UDP)时才选择一个本地IP地址。
对IPv4来说,通配地址由常值INADDR_ANY来指定,其值一般为0。它告知内核去选择IP地址。
struct sockaddr_in servaddr;
servaddr.sin_addr.a_addr = htonl(INADDR_ANY);
对于IPv6来说,128位的IPv6地址是存放在一个结构中的。系统预先分配inaddr_any变量并将其初始化为常值IN6ADDR_ANT_INIT。
struct sockaddr_in6 serv;
serv.sin6_addr = in6addr_any; /*in6addr_any在<netinet/in.h>中声明*/
如果让内核来为套接字选择一个临时端口号,那么必须注意,函数bind并不返回所选择的值。为了得到内核所选择的这个临时端口值,必须调用函数getsockname来返回协议地址。
从bind函数返回的一个常见错误是EADDRINUSE(地址已使用)。
4.5 listen函数
listen函数仅由TCP服务器调用,它做两件事情。
- 当socket函数创建一个套接字时,它被假设为一个主动套接字也就是说,它是一个将调用connect发起连接的客户套接字。listen函数把一个未连接的套接字转换成一个被动套接字,指示内核应接受指向该套接字的连接请求。调用listen导致套接字从CLOSED状态转换到LISTEM状态。
- 本函数的第二个参数规定了 内核应该为相应套接字排队的最大连接个数。
#include "sys/socket.h"
int listen(int sockfd,int backlog);
/*若成功则为0,若出错则为-1*/
本函数通常应该在调用socket和bind这两个函数之后,并在调用accept函数之前调用。
为了理解其中的backlog参数,我们必须认识到内核为任何一个给定的监听套接字维护两个队列:
- 未完成连接队列,每个这样的SYN分节对应其中一项:已由某个客户发出并到达服务器,而服务器正在等待完成相应的TCP三路握手过程。这些套接字处于SYN_RCVD状态。
- 已完成连接队列,每个已完成TCP三路握手过程的客户对应其中一项。这些套接字处于ESTABLISHED
每当在未完成连接队列中创建一项时,来自监听套接字的参数就复制到即将建立的连接中。连接的创建机制是完全自动的,无需服务器进程插手。下面展示了用这两个队列建立连接时所交换的分组。
4.6 accept函数
accept函数由TCP服务器调用,用于从已完成连接队列队头返回下一个已完成连接。如果已完成连接队列为空,那么进程被投入睡眠(假设套接字为默认的阻塞方式)。
#include "sys/socket.h"
int accept(int sockfd,struct sockaddr *cliaddr,socklen_t *addrlen);
/*若成功则返回非负描述符,若出错则为-1*/
参数cliaddr和addrlen用来返回已连接的对端进程(客户)的协议地址。addrlen是值-结果参数:调用前,我们将由 *addrlen所引用的整数值置为由cliaddr所指的套接字地址结构的长度,返回时,该整数值即为由内核存放在该套接字地址结构内的确切字节数。
如果accept成功,那么其返回值就是由内核自动生成的一个全新描述符,代表与所返回客户的TCP连接。我们称它的第一个参数为监听套接字描述符(由socket创建,随后用作bind和listen的第一个参数的描述符),称它的返回值为已连接套接字。区分这两个套接字非常重要。一个服务器通常仅仅创建一个监听套接字,它在服务器的生命周期内一直存在。内核为每个服务器进程接受的客户连接创建一个已连接套接字(也就是说对于它的TCP三路握手过程已经完成)。当服务器完成对某个给定客户的服务时,相应的已连接套接字就被关闭。
本函数最多返回三个值:一个既可能是全新套接字描述符也可能是出错指示的整数、客户进程的协议地址以及该地址的大小。如果我们对客户的协议地址不感兴趣,那么可以把cliaddr和addrlen均置为空指针。
4.7 close函数
close一个TCP套接字的默认行为是把该套接字标记成已关闭,然后立即返回到调用程序。该套接字描述符不能再由调用进程使用,也就是说它不能再作为read和write的第一个参数。然而TCP将尝试发送已排队等待发送到对端的任何数据,发送完毕后发生的是正常的TCP连接终止序列。
#include "unistd.h"
int close(int sockfd);
/*若成功则为0,出错则为-1*/
4.7.1 描述符引用计数
并发服务器中父进程关闭已连接套接字只是导致相应描述符的引用计数值减 1 。既然引用计数仍大于 0,这个close并不引发TCP的四分组连接终止。对于父进程和子进程共享已连接套接字的并发服务器来说,正式所期望的。
如果我们想在某个TCP连接上发送一个FIN,那么可以改用shutdown函数以代替close函数。
如果父进程对每个accept返回的已连接套接字都不调用close,那么父进程最终将耗尽可用描述符,因为任何进程在任何时候可拥有的打开着的描述符通常是有限制的。不过更重要的是,没有一个客户连接会被终止。
4.8 基本TCP的套接字函数
本文地址:https://blog.csdn.net/weixin_40583386/article/details/85943592