在前几篇文章中,我们先从宏观角度(TCP 概述)大致介绍了 tcp 的概念,然后从微观角度(滑动窗口、拥塞窗口等)详细说明了从 client 端和 server 端,tcp 是如何进行网络控制的。在本文中,我们将通过一个 tcp 例子,将整个过程联通起来,讲解 tcp 从连接、发送以及关闭,整个流程是怎样运行的。
server.c
#include <unistd.h>
#include <stdio.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <netinet/in.h>
#include <string.h>
int main(int argc, char **) {
int server_fd, new_socket, valread;
struct sockaddr_in address;
int opt = 1;
int addrlen = sizeof(address);
char buffer[1024] = {0};
char *hello = "hello from server";
int port = 8080;
// 创建socket文件描述符
if ((server_fd = socket(AF_INET, SOCK_STREAM, 0)) == 0) {
return 1;
}
// 端口 & 地址复用
if (setsockopt(server_fd, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT,
&opt, sizeof(opt))) {
return 1;
}
address.sin_family = AF_INET;
address.sin_addr.s_addr = INADDR_ANY;
address.sin_port = htons( port );
// 绑定8080端口
if (bind(server_fd, (struct sockaddr *)&address,
sizeof(address))<0) {
perror("bind failed");
return 1;
}
if (listen(server_fd, 3) < 0) {
return 1;
}
if ((new_socket = accept(server_fd, (struct sockaddr *)&address,
(socklen_t*)&addrlen))<0) {
return 1;
}
valread = read( new_socket , buffer, 1024);
// 向client发送消息
send(new_socket , hello , strlen(hello) , 0 );
close(new_socket);
close(server_fd);
return 0;
}
client.c
#include <stdio.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
int main(int argc, char const *argv[]) {
int sock = 0, valread;
struct sockaddr_in serv_addr;
char *hello = "hello from client";
char buffer[1024] = {0};
int port = 8080;
if ((sock = socket(AF_INET, SOCK_STREAM, 0)) < 0) { return -1;
}
serv_addr.sin_family = AF_INET;
serv_addr.sin_port = htons(port);
if(inet_pton(AF_INET, "127.0.0.1", &serv_addr.sin_addr)<=0) {
return 1;
}
// 建立连接
if (connect(sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) < 0) {
return 1;
}
send(sock , hello , strlen(hello) , 0 );
valread = read( sock , buffer, 1024);
close(sock);
return 0;
}
上面是 tcp 的示例代码,很简单,算是网络编程的入门级代码。读者可以使用下面命令进行编译:
gcc -g server.c -o server
gcc -g client.c -o client
下面,我们分析前面的示例代码, 对于 server 端:
1、创建 socket
2、bind 端口
3、listen
4、accept 新的连接,获取新连接的 socket
5、通过 read 函数,接收数据
6、通过 send 函数,发送数据
7、调用 close 函数关闭 socket
对于 client 端:
1、创建 socket
2、通过 connect 与 server 端建立连接
3、通过 send 发送数据
4、通过 recv 接收数据
5、close socket
对于 server 端和 client 端的每个步骤,其都是有关联的,比如 client 端调用 connect 之后,server 端将从 accept 函数返回,其返回值是新连接的 socket 等等。下面,我们将以一个图的方式来了解两端的联系。
#include <sys/socket.h>
int socket (int domain, int type, int protocol);
socket 系统调用通过分配一个新的描述符来创建一个新的套接字。它唯一标识一个 socket。这个 socket 描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。成功时返回一个非负的文件描述符编号,错误时返回-1。
在此,需要注意的是,并不是上面的 type 和 protocol 可以随意组合的,如 SOCK_STREAM 不可以跟 IPPROTO_UDP 组合。当 protocol 为 0 时,会自动选择 type 类型对应的默认协议。由于数据流的 IP 协议就是 TCP,前两个参数已经有效地指定了 TCP。因此,第三个参数可以保留为 0,让操作系统分配一个默认协议(这将是 IPPROTO_TCP)。
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
bind 函数用来绑定 socket 的本地地址和端口号。
struct in_addr {
u_int32_t s_addr;
};
struct sockaddr_in {
short sin_family;
u_short sin_port;
struct in_addr sin_addr;
char sin_zero[8];
};
sin_port 指定要使用的 16 位端口号。它在网络中给出(大端)字节顺序,因此必须使用 htons 将主机字节顺序转换为网络字节顺序。
将 sin 端口值指定为 0 会告诉操作系统选择端口号。操作系统将在 1024 和 5000 之间选择一个未使用的端口号作为应用程序。注意只有超级用户才能绑定 1024 以下的端口号。
对于 bind 系统调用,此处需要注意的是,在 client 不需要强制调用,而在 server 端需要强制调用,这是因为,在 server 端,bind 之后,要进行端口监听。而在 client 端,如果代码中没有执行此系统调用,则在内核中会隐式执行此调用。
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);
通过执行 connect 函数,与 server 端建立连接。
经典的三次握手,就在 connect 阶段,如下图:
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int listen(int sockfd, int backlog);
listen() 函数的主要作用就是将套接字( sockfd )变成被动的连接监听套接字(被动等待客户端的连接),至于参数 backlog 的作用是设置内核中连接队列的长度(该参数在现在大部分系统中已经不被使用),listen()的作用仅仅告诉内核一些信息。成功返回 0,否则返回-1.
这里需要注意的是,listen()函数不会阻塞,它主要做的事情为,将该套接字和套接字对应的连接队列长度告诉 Linux 内核,然后,listen()函数就结束。
#include <sys/types.h> /* See NOTES */
#include <sys/socket.h>
int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
accept()函数功能是,从处于 established 状态的连接队列头部取出一个已经完成的连接,如果这个队列没有已经完成的连接,accept()函数就会阻塞,直到取出队列中已完成的用户连接为止。如果没有客户端连接,accept 将阻塞直到一个 做。错误返回 -1。
需要注意的是,accept 的功能并不是建立连接,而是从当前连接的等待队列中获取一条连接。
accept 的第一个参数为服务器的 socket 描述字,是服务器开始调用 socket()函数生成的,称为监听 socket 描述字;而 accept 函数返回的是已连接的 socket 描述字。一个服务器通常通常仅仅只创建一个监听 socket 描述字,它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接 socket 描述字,当服务器完成了对某个客户的服务,相应的已连接 socket 描述字就被关闭。
#include <sys/types.h>
#include <sys/socket.h>
ssize_t send(int sockfd, const void *buf, size_t len, int flags);
向指定 socket 发送数据。
对于 send()的详细讲解,请转阅[TCP之send&recv]
#include <sys/types.h>
#include <sys/socket.h>
ssize_t recv(int sockfd, void *buf, size_t len, int flags);
从指定socket中读取数据。
对于 recv()的详细讲解,请转阅[TCP之send&recv]
#include <unistd.h>
int close(int fd);
关闭socket。
关闭socket。
close 一个套接字的默认行为是把套接字标记为已关闭,然后立即返回到调用进程,该套接字描述符不能再由调用进程使用,也就是说它不能再作为send或recv的第一个参数,然而TCP将尝试发送已排队等待发送到对端,发送完毕后发生的是正常的TCP连接终止序列。在多进程并发服务器中,父子进程共享着套接字,套接字描述符引用计数记录着共享着的进程个数,当父进程或某一子进程close掉套接字时,描述符引用计数会相应的减一,当引用计数仍大于零时,这个close调用就不会引发TCP的四路握手断连过程。四次挥手就在这个步骤。
本文从一个代码示例入手,讲解了tcp整个过程中各个系统调用函数的功能,以便从一个整体上层视角去观察整个tcp的编码以及运行过程。tcp确实太复杂了,笔者调研和阅读了大量的文章,才有了该系列文章,可能会由于调研不充分,难免有欠缺或者错误的地方,读者可以联系本人。如果说有技术方面的问题或者心得,都可以与笔者联系沟通,共同学习。
END
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8