Linux TCP数据包接收处理_tcp_recvmsg释放skb_chensichensi的博客-程序员秘密

技术标签: tcp  struct  path  linux  header  网络协议栈  validation  

在接收流程一节中可以看到数据包在读取到用户空间前,都要经过tcp_v4_do_rcv处理,从而在receive queue中排队。

在该函数中,我们只分析当连接已经建立后的数据包处理流程,也即tcp_rcv_established函数。

 

tcp_rcv_established函数的工作原理是把数据包的处理分为2类:fast path和slow path,其含义显而易见。这样分类

的目的当然是加快数据包的处理,因为在正常情况下,数据包是按顺序到达的,网络状况也是稳定的,这时可以按照fast path

直接把数据包存放到receive queue了。而在其他的情况下则需要走slow path流程了。

 

在协议栈中,是用头部预测来实现的,每个tcp sock有个pred_flags成员,它就是判别的依据。

可以看出头部预测依赖的是头部长度字段和通告窗口。也就是说标志位除了ACK和PSH外,如果其他的存在的话,就不能用

fast path处理,其揭示的含义如下:

1 Either the data transaction is taking place in only one direction (which means that we are the receiver

and not transmitting any data) or in the case where we are sending out data also, the window advertised

 from the other end is constant. The latter means that we have not transmitted any data from our side for

quite some time but are receiving data from the other end. The receive window advertised by the other end is constant.

 

2. Other than PSH|ACK flags in the TCP header, no other flag is set (ACK is set for each TCP segment). 

This means that if any other flag is set such as URG, FIN, SYN, ECN, RST, and CWR, we
know that something important is there to be attended and we need to move into the SLOW path.

 

3. The header length has unchanged. If the TCP header length remains unchanged,
we have not added/reduced any TCP option and we can safely assume that
there is nothing important to be attended, if the above two conditions are TRUE.

 

fast path工作的条件

 

1 没有乱序数据包

2 接收窗口不为0

3 还有接收缓存空间

4 没有紧急数据

 

反之,则进入slow path处理;另外当连接新建立时处于slow path。

 

从fast path进入slow path的触发条件(进入slow path 后pred_flags清除为0):

1 在tcp_data_queue中接收到乱序数据包

2 在tcp_prune_queue中用完缓存并且开始丢弃数据包

3 在tcp_urgent_check中遇到紧急指针

4 在tcp_select_window中发送的通告窗口下降到0.

 

从slow_path进入fast_path的触发条件:

1 When we have read past an urgent byte in tcp_recvmsg() . Wehave gotten an urgent byte and we remain

  in the slow path mode until we receive the urgent byte because it is handled in the slow path in
  tcp_rcv_established() .

2 当在tcp_data_queue中乱序队列由于gap被填充而处理完毕时,运行tcp_fast_path_check。

3 tcp_ack_update_window()中更新了通告窗口。

 

fast path处理流程

A 判断能否进入fast path

TCP_HP_BITS的作用就是排除flag中的PSH标志位。只有在头部预测满足并且数据包以正确的顺序(该数据包的第一个序号就是下个要接收

的序号)到达时才进入fast path。

该代码段是依据时戳选项来检查PAWS(Protect Against Wrapped Sequence numbers)。

 

如果发送来的仅是一个TCP头的话(没有捎带数据或者接收端检测到有乱序数据这些情况时都会发送一个纯粹的ACK包)

主要的工作如下:

1 保存对方的最近时戳 tcp_store_ts_recent。通过前面的if判断可以看出tcp总是回显2次时戳回显直接最先到达的数据包的时戳,

  rcv_wup只在发送数据(这时回显时戳)时重置为rcv_nxt,所以接收到前一次回显后第一个数据包后,rcv_nxt增加了,但是

  rcv_wup没有更新,所以后面的数据包处理时不会调用该函数来保存时戳。

2 ACK处理。这个函数非常复杂,包含了拥塞控制机制,确认处理等等。

3 检查是否有数据待发送 tcp_data_snd_check。

 

如果该数据包中包含了数据的话

 

tcp_event_data_recv函数

rcv_ssthresh是当前的接收窗口大小的一个阀值,其初始值就置为rcv_wnd。它跟rcv_wnd配合工作,

当本地socket收到数据报,并满足一定条件时,增长rcv_ssthresh的值,在下一次发送数据报组建TCP首部时,

需要通告对方当前的接收窗口大小,这时需要更新rcv_wnd,此时rcv_wnd的取值不能超过rcv_ssthresh的值。

两者配合,达到一个滑动窗口大小缓慢增长的效果。

__tcp_ack_snd_check用来判断ACK的发送方式

注释很清楚,无需解释。

 

 

这里有个疑问,就是当ucopy应用读到需要读取到的数据包后,也即在一次处理中

 

的第二个条件的等号为真 len - tcp_header_len == tp->ucopy.len,然后执行流程到后面eaten为1,所以函数以释放skb结束,没有

调用sk_data_ready函数。假设这个处理调用流程如下:

tcp_recvmsg-> sk_wait_data  -> sk_wait_event -> release_sock -> __release_sock-> sk_backlog_rcv-> tcp_rcv_established

那么即使此时用户得到了所需的数据,但是在tcp_rcv_established返回前没有提示数据已得到,

 

但是在回到sk_wait_event后,由于__condition为 !skb_queue_empty(&sk->sk_receive_queue),所以还是会调用schedule_timeout

来等待。这点显然是浪费时间,所以这个condition应该考虑下这个数据已经读满的情况,而不能光靠观察receive queue来判断是否等待。

 

接下来分析slow path

 

先看看tcp_validate_incoming函数,在slow path处理前检查输入数据包的合法性。

 

第一步:检查PAWS tcp_paws_discard

 

 PAWS丢弃数据包要满足以下条件

1 The difference between the timestamp value obtained in the current segmentand last seen timestamp on

the incoming TCP segment should be more than TCP_PAWS_WINDOW (= 1), which means that if the segment that was
transmitted 1 clock tick before the segment that reached here earlier TCP seq should be acceptable.

It may be because of reordering of the segments that the latter reached earlier.

2 the 24 days have not elapsed since last time timestamp was stored,

3 tcp_disordered_ack返回0.

 

以下转载自CU论坛http://linux.chinaunix.net/bbs/viewthread.php?tid=1130308

 


 

 

 

在实际进行PAWS预防时,Linux是通过如下代码调用来完成的
tcp_rcv_established
    |
    |-->tcp_paws_discard
          |
          |-->tcp_disordered_ack
其中关键是local方通过tcp_disordered_ack函数对一个刚收到的数据分段进行判断,下面我们对该函数的判断逻辑进行下总结:
大前提:该收到分段的TS值表明有回绕现象发生
a)若该分段不是一个纯ACK,则丢弃。因为显然这个分段所携带的数据是一个老数据了,不是local方目前希望接收的(参见PAWS的处理依据一节)
b)若该分段不是local所希望接收的,则丢弃。这个原因很显然
c)若该分段是一个纯ACK,但该ACK并不是一个重复ACK(由local方后续数据正确到达所引发的),则丢弃。因为显然该ACK是一个老的ACK,并不是由于为了加快local方重发而在每收到一个丢失分段后的分段而发出的ACK。
d)若该分段是一个ACK,且为重复ACK,并且该ACK的TS值超过了local方那个丢失分段后的重发rto,则丢弃。因为显然此时local方已经重发了那个导致此重复ACK产生的分段,因此再收到此重复ACK就可以直接丢弃。
e)若该分段是一个ACK,且为重复ACK,但是没有超过一个rto的时间,则不能丢弃,因为这正代表peer方收到了local方发出的丢失分段后的分段,local方要对此ACK进行处理(例如立刻重传)

这里有一个重要概念需要理解,即在出现TS问题后,纯ACK和带ACK的数据分段二者是显著不同的,对于后者,可以立刻丢弃掉,因为从一个窗口的某个seq到下一个窗口的同一个seq过程中,一定有窗口变化曾经发生过,从而TS记录值ts_recent也一定更新过,此时一定可以通过PAWS进行丢弃处理。但是对于前者,一个纯ACK,就不能简单丢弃了,因为有这样一个现象是合理的,即假定local方的接收缓存很大,并且peer方在发送时很快就回绕了,于是在local方的某个分段丢失后,peer方需要在每收到的后续分段时发送重复ACK,而此时该重发ACK的ack_seq就是这个丢失分段的序号,而该重发ACK的seq已经是回绕后的重复序号了,尽管此时到底是回绕后的那个重复ACK还是之前的那个同样序号seq的重复ACK,对于local方来都需要处理(立刻启动重发动作),而不能简单丢弃掉。

 


 

 第2步 检查数据包的序号是否正确,该判断失败后调用tcp_send_dupack发送一个duplicate acknowledge(未设置RST标志位时)。

由rcv_wup的更新时机(发送ACK时的tcp_select_window)可知位于序号rcv_wup前面的数据都已确认,所以待检查数据包的结束序号至少

要大于该值;同时开始序号要落在接收窗口内。

 

第3步 如果设置了RST,则调用tcp_reset处理

第4步 更新ts_recent,

第5步 检查SYN,因为重发的SYN和原来的SYN之间不会发送数据,所以这2个SYN的序号是相同的,如果不满足则reset连接。

 

接下来重点分析tcp_data_queue函数,这里就是对数据包的处理了。

 

 

 

如果该数据包刚好是下一个要接收的数据,则可以直接copy到用户空间(如果存在且可用),否则排队到receive queue

下面看看函数tcp_ofo_queue,也即out-of-order queue的处理

这里DSACK的处理中为什么即使dsack比end_seq大,还是用dsack作为右边界呢

 

 

 

 

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/chensichensi/article/details/5326297

智能推荐

Java8新特性(四)------接口中可以定义方法体_李晓娜的博客-程序员秘密

Java8比起以前的版本存在很大的变化,我们知道在之前的版本中接口只能是定义抽象的方法,是不能定义实现的,但是在java8环境下,这个不可能已经变得可能。下面我们通过例子一步一步的来讲解下java8的用法。 定义静态方法  在接口中定义的静态方法,不是抽象的,具体实现的,可以直接使用接口名称调用。/** * Created by xiaona on 2016/5/30. */pu

适合所有新手小白的Web前端开发学习大纲!_weixin_43955769的博客-程序员秘密

Web前端几年是越来越火热了,让更多的人看到了Web前端的高薪资,更看到了Web前端行业的发展前景,所以纷纷投入到学习Web前端技术学习中来,那么有没有一份适合新手小白学习的Web前端开发教学大纲提供给大家学习呢?想要学好Web前端开发,有一份详细的学习课程大纲必不可少。下面千锋武汉Web前端培训小编给大家分享适合所有新手学习的大纲,相信有这样一份学习大纲会让你的学习之路更清晰。第一阶...

使用8266做串口调试工具一_esp8266串口调试_搬砖道人的博客-程序员秘密

日常有做工控的同学,一定有过这个经历,有的机器或设备使用串口通讯但是调试实物太麻烦或者成本太高。这个时候如果有一个能够模拟设备的东西将会事半工倍。一般来说使用串口通讯过程协议都比较简单,一般是简单的收发。网上找一圈软件串口一般都收费且使用驱动,兼容性和使用成本都比较高。手里正好有一CH340的USB串口和8266,而8266又支持网络,那么如果用一个程序使用网络连接到8266。8266负责转发串口和网络的工具不是可以完美调试。当然展开来说还以的扩展出直接远程调试设备的效果,而且8266+340成本不过1

栅格瓦片转mongodb离线部署_xyz瓦片保存到mbtiles 还是mongodb_凌往昔的博客-程序员秘密

栅格瓦片转mongodb离线部署前提​ 上一篇博客中讲到了如何将TMS标准的瓦片转换成mbtiles格式发布服务,但是在现实环境中,使用的切图工具或者切图的人并没有按照标准切图。有的人切片为ArcServer切片或者GeoWebCache切片。这样的话上篇博客的方法就不能适用了。那么本篇博客就讲述上篇解决不了的切片。实现思路​ 使用NoSQL(这里指Mongodb)对瓦片的png图片...

编程语言思考系列:为什么会有这么多的编程语言?_有心好书的博客-程序员秘密

一.为什么会有这么多的编程语言?不同的cpu有着不同的指令集,这些指令集都是二进制的0和1;后来有了汇编语言,可以认为是二进制指令的助记符表示;再后来有了高级编程语言,它们通过编译器又变回了汇编语言或者机器语言;紧接着一个又一个的高级编程语言诞生了,为什么会有这么多编程语言呢?二.思考因为编译原理和技术越来越成熟了。语言大体上有四个阶断    1、机器编码阶断,比如卡带编码。 2、汇编语言阶断

Python中 运算符,返回值,函数,元祖_Gpersistent的博客-程序员秘密

目录运算符python内置函数Python基础语言元组函数返回值函数参数运算符运算符Python 表达式结果描述支持的数据类型+[1, 2] + [3, 4][1, 2, 3, 4]合并字符串、列表、元组*‘Hi!’ * 4[‘Hi!’, ‘Hi!’, ‘Hi!’, ‘Hi!’]复制字符串、列表、元组in3 in (1, 2, 3)True元素是否存在字符串、列表、元组、字典not in4 not in (1, 2, 3)True

随便推点

【转】问题解决——Gazebo闪退及无法运行_gazebohuishantui_小麦China的博客-程序员秘密

版权声明:本文为CSDN博主「口袋里的init」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/wangguchao/article/details/88777162————————————————1.问题卡在加载世界模型界面;加载太慢;2.解决办法直接下载所有模型到用户的根目录下的.gaz...

PK_0.1_chouxiwei3276的博客-程序员秘密

//玩家元组letskill1=(name:"鼻屎炸弹",attack:20,per:20,pic:"抠出一团很大的鼻屎快速的飞向怪物,只听砰的一声鼻屎炸弹在怪物身上爆炸")letplayer=(name:"张浩泽",health:100...

Android textAppearance的属性设置及TextView属性详解_android:textappearance_u010142437的博客-程序员秘密

随时随地阅读更多技术实战干货,获取项目源码、学习资料,请关注源代码社区公众号(ydmsq666)转自:http://blog.csdn.net/jaycee110905/article/details/8762238textAppearance的属性设置android:textAppearance="...

一个生日微信小程序 生日动画_微信小程序与Blender动画交互_weixin_39847244的博客-程序员秘密

有些盆友对上篇文章里的小程序与Blender模型的交互感兴趣:Contra:超简单!5分钟就能做出来的MaxMSP和Blender实时音画交互​zhuanlan.zhihu.com再做一个微信小程序与Blender动画的交互demo:微信小程序与Blender动画交互https://www.zhihu.com/video/1220804108782997504原理其实跟上篇一样,稍加一点变通,制作...

一行代码解决tomcat输出中文到浏览器出现乱码问题!_猿华的博客-程序员秘密

一行代码解决tomcat输出中文到浏览器出现乱码问题!不多逼逼直接上代码resp.setContentType("text/html;charset=UTF-8");//设置resp(响应页面)页面为html格式,编码为utf-8

Proxy代理_锋利的二丫的博客-程序员秘密

Proxy代理及其实际应用什么是 Proxyproxy 的意思是代理,是为了让对数据的操作变得更安全,我们可以使用proxy拦截某些操作,直接对其进行过滤和改写。官方将这种拦截、过滤和改写称为代理。一个简单的示例let boy = { name: '小明', age: 18, money: 100};let px = new Proxy(boy,{ get(target, propKey) { console.log(target, propKey

推荐文章

热门文章

相关标签