前面几篇文章讲解的是应用程序使用Socket间接通知协议栈进行的连接,通信阶段,那么从现在开始讲解协议栈和网卡驱动的故事
回顾上篇文章,我们从第一阶段创建套接字,协议栈返回描述符讲起~~~
协议栈结构
首先来看下协议栈的大致结构:
应用程序
代表客户端,浏览器,电子邮件等程序,这些程序发出请求委派给下一层的Socket
Socket程序
解析器也是Socket的一部分用于DNS服务查询域名的IP地址,其他部分就是委派操作系统的协议栈去处理数据了
操作系统
操作系统的协议栈分为两部分,上半部分为TCP/UDP协议;下半部分为IP协议;IP协议部分用于接受TCP,UDP的请求进行填充额外控制信息,数据在网络中如果超过一定长度(后面讲解)是需要切割分成一个一个包进行传输的,而IP协议就是用于收发网络包的。在图中还可以看到有ICMP和ARP,ICMP用于表示网络包传输过程中出现的错误,ARP是用于根据IP查询MAC地址(为什么需要MAC地址呢?因为操作系统是委托网卡的,网卡需要知道MCA地址)
驱动程序
网卡驱动程序用于控制网卡,IP协议向网卡驱动程序发送的数字信号接下来会被网卡转换数为电信号在网线中传输。
套接字
协议栈的内部会有一块记录通信对方的ip端口,通信状态,使用这块内存的应用pid的内存空间等,这个内存空间就是套接字存储的内容,这些内容叫做控制信息
协议栈需要根据套接字所存储的控制信息进行下一步的操作。
netstat命令用于查看套接字内容
- proto协议类型tcp或者udp协议
- localaddress “:”前面代表本机使用的ip地址(ip地址本来是网卡才有的,因为计算机内部有很多网卡,所以也就说计算机有很多ip地址);后面代表使用的端口号(根据套接字生成的一个数字)
- foreignaddress:和loacladdress一样的格式,两者都是建立连接后才会显示数字的默认是0
- state是这个套接字的连接状态
- pid:使用这个套接字的应用程序,由于一个应用程序会有很多个网络请求因此也有多个套接字
应用程序通过socket向协议栈发起创建套接字的请求时,协议栈会创建出一块内存并写入这个套接字刚创建完成的初始化状态,并将代表这个套接字的描述符返回给应用程序。
这个步骤主要的工作是:填补客户端和服务端套接字的控制信息也可以说是通信双方交换各自的控制信息并记录
如对方的ip和port配置信息,这里的连接是指通信前的准备工作
上一篇介绍查看套接字的命令时,可以看到很多信息,但是刚刚创建出来的套接字是什么信息都没有的,协议栈也因此不知道和谁通信;
客户端填补信息
这一步中调用socket的connect指定通信的服务器ip和端口还有使用的描述符,对应的套接字会保存这些信息,这样客户端的协议栈就可以知道通信对方的信息了。
协议栈的tcp模块根据ip地址和端口号接着创建tcp头部信息讲这些信息填入,协议栈的tcp模块也就知道了服务器的ip和端口 接着委托ip模块 和服务器的ip模块发送数据
服务端填补信息
和客户端不一样,创建套接字是服务器启动就会执行的,创建完成后一直在等待客户端的连接。收到客户端的连接后,也会取出对应的端口号判断出使用哪个套接字,并把相关信息保存到套接字中。
服务器的ip模块收到数据转发给tcp模块,根据头部信息的端口号找到对应的soxket链接进行双方的建立管道通信
控制信息
头部信息
控制信息用于确定通信双方,一类是头部信息,如下图所示:
****
上面介绍的是tcp头部的信息;ip协议也有头部在这层协议会把ip头部添加到tcp头部前面;网卡必须知道mac地址,因此也有mac头部添加到ip头部。都是在不同层进行添加的。
这类信息在连接通信断开的各个阶段都需要携带在tcp的头部。
套接字信息
还有一类信息是用于控制协议栈操作的,这部分是套接字保存的信息,不同操作系统协议栈实现不同,但套接字保存的内容有一些是共通都需要的,只要这部分信息能够确定就可以进行通信,不需要考虑不同操作系统不同协议栈导致的差异
我正在参与2023腾讯技术创作特训营第二期有奖征文,瓜分万元奖池和键盘手表