分析驱动程序在IRQL>=DISPATCH_LEVEL时和DPC过程中不能用KeWaitForSingleObject等待对象的原因_kewaitforsingleobject dpc-程序员宅基地

技术标签: win内核  windows  

    M$ddk对调用KeWaitForSingleObject接口有下面约定:

Callers of KeWaitForSingleObject must be running at IRQL <= DISPATCH_LEVEL.
 However, if Timeout = NULL or *Timeout != 0, the caller must be running at IRQL <= APC_LEVEL and in a nonarbitrary thread context. 
(If Timeout != NULL and *Timeout = 0, the caller must be running at IRQL <= DISPATCH_LEVEL.)

    翻译过来就是以Timeout!=0调用KeWaitForSingleObject时,IRQL<DISPATCH_LEVEL,如果要在IRQL=DISPATCH_LEVEL运行级上调用KeWaitForSingleObject,必须保证Timeout=0.这段话短短几行,但是有3个重要的信息点,1.等待的超时时间在不同irql上该怎么设置;2.dpc过程中不能执行超时时间为非零等待;3.当IRQL>=DISPATCH_LEVEL时,也不能执行非零等待。本文将结合自己对Reactos的理解,对这3点进行解释。


1.IRQL>=DISPATCH_LEVEL时,超时时间必须==0?

KeWaitForSingleObject是个等待-醒来-再等待的循环过程,每次醒来会判断条件是否满足,不满足就继续等待。其中有一项参数就是Timeout是否超时。

NTSTATUS
NTAPI
KeWaitForSingleObject(IN PVOID Object,
                      IN KWAIT_REASON WaitReason,
                      IN KPROCESSOR_MODE WaitMode,
                      IN BOOLEAN Alertable,
                      IN PLARGE_INTEGER Timeout OPTIONAL)
{

    for (;;)
    {
         if (Timeout)
            {
                /* Check if the timer expired */
                InterruptTime.QuadPart = KeQueryInterruptTime();
                if ((ULONGLONG)InterruptTime.QuadPart >=
                    Timer->DueTime.QuadPart)
                {
                    /* It did, so we don't need to wait */
                    WaitStatus = STATUS_TIMEOUT;
                    goto DontWait;
                }

                /* It didn't, so activate it */
                Timer->Header.Inserted = TRUE;
            }
            ...
            WaitStatus = KiSwapThread(Thread, KeGetCurrentPrcb());
 WaitStart:
        Thread->WaitIrql = KeRaiseIrqlToSynchLevel();
        KxSingleThreadWait();
        KiAcquireDispatcherLockAtDpcLevel();
    } //end for(;;)
    KiReleaseDispatcherLock(Thread->WaitIrql);
    return WaitStatus;

DontWait:
    KiReleaseDispatcherLockFromDpcLevel();
    KiAdjustQuantumThread(Thread);
    return WaitStatus;
}

代码显示,如果Timeout!=NULL,且只有已超时,就跳出for(;;)循环并从KeWaitForSingleObject函数中返回;否则,可能进入KiSwapThread(Thread, KeGetCurrentPrcb());进而切换线程,实现睡眠等待。 从上面这段代码摘要可以知道,调用KeWaitForSingleObject且Timeout!=NULL,会引起线程等待。为了使线程在DISPATCH_LEVEL上不被因睡眠而切换出去,只能让超时值==0,使得KeWaitForSingleObject立刻返回。这解释了ddk文档中关于Timeout的调用约定。

2.dpc过程中不能执行超时时间为非零等待?

    网上一种主流的说法是:线程运行在DISPATCH_LEVEL级别以下,在IRQL==DISPATCH_LEVEL时 线程被挂起,OS开始调度和切换线程,等到IRQL重新下降到DISPATCH_LEVEL以下时,被调度的线程才继续运行。如果此时线程睡眠,会因为没法切换回来而导致BDOS。但是,这个说法有点牵强,首先,下降到DISPATCH_LEVEL级别一下是个很模糊的时机,是在下降沿切换还是下降完毕才切换?其次,难道线程通过执行RaiseIrql就被挂起了?更重要的,这句话容易引起误解:认为winos跟linux一样,存在专司线程调度的内核线程,该线程只有在DISPATCH_LEVEL时才调度和切换线程。然而,winos中不存在固定的调度线程,取而代之的,线程调度遍地都是,只要调用LowIrql/KiExitDispatcher都会引起线程调度(这是分布式调度的调调吗?)。 另外,如果仔细看KiSwapThread/SwapContext的实现就可以知道,被切换的线程在SwapContext中就已经恢复执行,而,IRQL下降只是提供线程切换的机会。因此,分析LowIrql(以及其他会降低cpu当前irql的操作)源码就显得很重要。

来看下LowIrql的代码:

VOID
HalpLowerIrql(KIRQL NewIrql)
{
  if (NewIrql >= PROFILE_LEVEL)
    {
      KeGetPcr()->Irql = NewIrql;
      return;
    }
 ...
  if (NewIrql >= DISPATCH_LEVEL)
    {
      KeGetPcr()->Irql = NewIrql;
      return;
    }
  KeGetPcr()->Irql = DISPATCH_LEVEL;
  if (((PKIPCR)KeGetPcr())->HalReserved[HAL_DPC_REQUEST])
    {
      ((PKIPCR)KeGetPcr())->HalReserved[HAL_DPC_REQUEST] = FALSE;
      KiDispatchInterrupt();
    }
  KeGetPcr()->Irql = APC_LEVEL;
  if (NewIrql == APC_LEVEL)
    {
      return;
    }
  if (KeGetCurrentThread() != NULL && 
      KeGetCurrentThread()->ApcState.KernelApcPending)
    {
      KiDeliverApc(KernelMode, NULL, NULL);
    }
  KeGetPcr()->Irql = PASSIVE_LEVEL;
}
如前所述,当IRQL级别下降时,可能会引起线程切换,它会调用KiDispatchInterrupt()执行dpc过程和软中断请求:

.func KiDispatchInterrupt@0
_KiDispatchInterrupt@0:

    /* Deliver DPCs */
    mov ecx, [ebx+KPCR_PRCB]
    call @KiRetireDpcList@4

...

    /* Set APC_LEVEL and do the swap */
    mov cl, APC_LEVEL
    call @KiSwapContextInternal@0

    /* Restore registers */
    mov ebp, [esp+0]
    mov edi, [esp+4]
    mov esi, [esp+8]
    add esp, 3*4

Return:
    /* All done */
    ret

...
.endfunc
call KiRetireDpcList遍历Prcb->DpcData队列,出队并执行每个dpc过程。而call KiSwapContextInternal则完成线程切换的功能,具体的源码就不深入进去看了,可以参考毛德操的情景分析。值得一提的是,在KiSwapContextInternal里,实实在在的存在判断当前线程切换是不是在发生在dpc过程中:

.globl @KiSwapContextInternal@0
.func @KiSwapContextInternal@0, @KiSwapContextInternal@0
@KiSwapContextInternal@0:
...
    /* DPC shouldn't be active */
    cmp byte ptr [ebx+KPCR_PRCB_DPC_ROUTINE_ACTIVE], 0
    jnz BugCheckDpc
汇编中KPCR_PRCB_DPC_ROUTINE_ACTIVE是prcb中的域,对应 Prcb->DpcRoutineActive。这里判断该域是否为0,非零就跳去蓝屏。那这个域是什么时候设置的?

正好在KiRetireDpcList准备调用执行Dpc过程中:

FASTCALL
KiRetireDpcList(IN PKPRCB Prcb)
{
...
    DpcData = &Prcb->DpcData[DPC_NORMAL];
    ListHead = &DpcData->DpcListHead;

    /* Main outer loop */
    do
    {
        /* Set us as active */
        Prcb->DpcRoutineActive = TRUE;
        ...
        DeferredRoutine(Dpc,
                                DeferredContext,
                                SystemArgument1,
                                SystemArgument2);
                ASSERT(KeGetCurrentIrql() == DISPATCH_LEVEL);
        ...
        Prcb->DpcRoutineActive = FALSE;
        Prcb->DpcInterruptRequested = FALSE;
        ...
}
在出队Dpc对象并执行Dpc过程前后分别设置Prcb->DpcRoutineActive。这很好的解释了dpc过程中不能执行超时时间为非零等待:一旦执行等待,就会引起切换。一旦进入SwapContextInternal就会因为Prcb->DpcRoutineActive的缘故,引起蓝屏。

3.上面只解释了皮毛,为什么不能在Dispatcher_Level执行等待还是没有解释:

要解释这个,先得去看下我转载的文章:从IRQ到IRQL(PIC版),知道硬件上高IRQL怎么屏蔽低IRQL的执行。然后回过来继续往下看。不过,还得继续看KfLowerIrql。

.func @KfLowerIrql@4
_@KfLowerIrql@4:
@KfLowerIrql@4:

    /* Save flags since we'll disable interrupts */
    pushf

    /* Validate IRQL */
    movzx ecx, cl
#if DBG
    cmp cl, PCR[KPCR_IRQL]
    ja InvalidIrql
#endif

    /* Disable interrupts and check if IRQL is below DISPATCH_LEVEL */
    cmp dword ptr PCR[KPCR_IRQL], DISPATCH_LEVEL
    cli
    jbe SkipMask

    /* Clear interrupt masks since there's a pending hardware interrupt */
    mov eax, KiI8259MaskTable[ecx*4]
    or eax, PCR[KPCR_IDR]
    out 0x21, al
    shr eax, 8
    out 0xA1, al

SkipMask:

    /* Set the new IRQL and check if there's a pending software interrupt */
    mov PCR[KPCR_IRQL], ecx
    mov eax, PCR[KPCR_IRR]

    mov al, SoftIntByteTable[eax]
    cmp al, cl
    ja DoCall3

    /* Restore interrupts and return */
    popf
    ret

调用LowerIrql时,由于当前IRQL==DISPATCH_LEVEL,因此进入SkipMask。IRR寄存器会保存在执行软中断时是否有新的软中断产生。由于当前IRQL为DISPATCH_LEVEL,从SoftIntByteTabele数组中返回的值都不会大于这个值,因此,Lowerirql没有做线程切换的工作就返回了,失去一次线程调度的机会。

SoftIntByteTable:
    .byte PASSIVE_LEVEL                 /* IRR 0 */
    .byte PASSIVE_LEVEL                 /* IRR 1 */
    .byte APC_LEVEL                     /* IRR 2 */
    .byte APC_LEVEL                     /* IRR 3 */
    .byte DISPATCH_LEVEL                /* IRR 4 */
    .byte DISPATCH_LEVEL                /* IRR 5 */
    .byte DISPATCH_LEVEL                /* IRR 6 */
    .byte DISPATCH_LEVEL                /* IRR 7 */

KeWaitForSingleObject调用KiSwapThread,KiSwapThread又调用KiSwapContext和KeLowerIrql,由于KiSwapContext把出于DISPATCH_LEVEL的线程切换出去,而KeLowerIrql又没有起到因有的再次调度线程的作用,(切换进来的线程未必会唤醒等待的线程)。这倒也没什么,更重要的是,载Dispatch_Level上由KeWaitForSingleObject调用KiSwapThread,KiSwapThread再调用KfLowerIrql时,传入的NewIrql也等于Dispatch_Level

NTSTATUS
FASTCALL
KiSwapThread(IN PKTHREAD CurrentThread,
             IN PKPRCB Prcb)
{
    ....
    WaitIrql = CurrentThread->WaitIrql;
    ...
    ApcState = KiSwapContext(CurrentThread, NextThread);
    ...
    if (ApcState)
    {
        /* Lower to APC_LEVEL */
        KeLowerIrql(APC_LEVEL);

        /* Deliver APCs */
        KiDeliverApc(KernelMode, NULL, NULL);
        ASSERT(WaitIrql == 0);
    }
    KeLowerIrql(WaitIrql);
}
当新切换的线程返回时,这个新线程其实也工作在Dispatch_Level.这没什么不好的?错了,副作用还没体现出来,除非这个线程主动降低当前CPU的IRQL级别(一般都是先把优先级升到Dispatch_level,保存原irql,下次恢复时再恢复到原有的irql。然而,很不幸,原来就在DISPATCH_LEVEL上,折腾半天IRQL一直没有变化,因此KeLowerIrql始终不能起到切换线程的作用),否则IRQL一直不会下降,这个线程IRQL得不到降低,KiExitDispatch之类的也得不到执行,于是,整个系统再也没有线程切换了,变成但任务系统了(除非线程时间片用完)。

    至此,我认为很好的解释了在IRQL>=DISPATCH_LEVEL时和DPC过程中不能用KeWaitForSingleObject等待对象的原因!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/lixiangminghate/article/details/51063394

智能推荐

黑马程序员-高新技术-交通灯管理-程序员宅基地

文章浏览阅读297次。学习了张孝祥老师的交通灯项目后,就深深的喜欢上了张孝祥老师的讲课风格,他的每句话话中都显露出了他的清晰、完整、丰富、深入的思维,可以推断出他已经把这个题目理解的非常到位了。他的讲课方式很像我的高中老师,就是把一个题目从头到尾的思路一一的都讲出来,不跳跃任何一个思维点,不遗漏任何一个思维点,这才是一个智者的思路。希望黑马程序员的老师们都能像张孝祥老师一样事无巨细的把一个知识点讲透彻,讲的不遗漏。

图像线段检测几种方法_lines1, _, _, _ = lsd1.detect(gray_image1, 2, 2)-程序员宅基地

文章浏览阅读1.1k次。OpenCV-contrib有一个名为FastLineDetector的东西,如果它被用作LSD的替代品似乎很好。如果你有点感动,你会得到与LSD几乎相同的结果。当我将OpenCV提升到4.1.0时,LineSegmentDetector(LSD)消失了。_lines1, _, _, _ = lsd1.detect(gray_image1, 2, 2)

为什么人工智能用Python?-程序员宅基地

文章浏览阅读923次,点赞24次,收藏27次。Python 作为脚本语言,虽然上手简单、入门快,但是运行速度没有Java、C++快,应用也不够广泛,那Python到底有什么优势?来听听王道Python的主讲老师龙哥怎么说?Python被认为是一门相对容易学习和上手的编程语言,对初学者友好。其简洁的语法和清晰的代码结构使得开发人员能够更专注于解决问题而不是处理语法复杂性。这使得开发人员能够轻松地利用这些工具进行人工智能项目的开发。例如最流行的机器学习框架Scikit-learn只支持Python。

Python实例29:利用python自动创建多个Excel表格_python在excel表格内添加多张表-程序员宅基地

文章浏览阅读3k次,点赞4次,收藏19次。实例代码import xlwings as xwapp = xw.App(visible = True, add_book = False)for i in range(1, 21): workbook = app.books.add() workbook.save(f'e:\\example\\{i}班信息表.xlsx') workbook.close()app.quit()_python在excel表格内添加多张表

uni-app实现上拉加载,下拉刷新(下拉带动画)_uniapp 加载动画-程序员宅基地

文章浏览阅读5.7w次,点赞14次,收藏81次。直接代码展示了uni-app的上拉加载动画感觉还行,废话不多说了。。。1在pages.json添加允许下拉刷新{ "path":"pages/lookuser/lookuser", "style":{ "navigationBarTitleText":"用户日志", "enablePullDownRefresh": true//就是这个 }_uniapp 加载动画

常见服务器对jdk版本的支持_jdk 不支持国产服务器-程序员宅基地

文章浏览阅读2.6k次。WebSphere5.1:JDK1.4,Servelet2.3、JSP1.2WebSphere6.0:JDK1.4,Servelet2.4、JSP2.0WebSphere6.1:JDK5.0,Servelet2.4、JSP2.0Tomcat4.1:JDK1.4,Servelet2.3、JSP1.2Tomcat5.5:JDK5.0,Servelet2.4、JSP2.0_jdk 不支持国产服务器

随便推点

eclipse的hibernate映射工具_eclipse映射器-程序员宅基地

文章浏览阅读310次。升级网址http://hibernatesynch.sourceforge.net/_eclipse映射器

跨境电商亚马逊erp规避跟卖自发货铺货,数据更安全_跨境erp如何保证卖家数据安全?-程序员宅基地

文章浏览阅读313次。现在越来越多的跨境电商用户想拥有一套属于自己的自发货铺货ERP系统,但是众所周知,开发一套的成本太高,而且找不到很专业的技术员去开发,那么,我们提供的ERP私有化部署,成本低,你需要的投入的是一个服务器,以及一个ERP的定制费用,我们会把ERP加密部署到你的服务器中,这样你的数据就在你的服务器中。能看到数据的只有你自己,而且你对外销售出去的账号端口,你作为上家,同样是可以看到他们的数据!不是所有的部署都可以做销售系统,一般分为个人店群卖家部署,企业店群部署,培训孵化机构部署!每一个版本的部署,权限不一样,同_跨境erp如何保证卖家数据安全?

Vue绑定数据v-bind缩写:字段名 双向绑定v-model缩写:model 监听动作v-on缩写@ 记住:与数据相关用冒号 与动作相关用@_v-model简写-程序员宅基地

文章浏览阅读1.2w次,点赞6次,收藏11次。:是v-bind缩写:数据同步v-bind指令可以用于响应式地更新 HTML 特性:<spanv-bind:title="message">@是指令v-on缩写 :动作监听v-on指令,它用于监听 DOM 事件<form v-on:submit.prevent="onSubmit">...</form>.修饰符:动作具体化修饰符 (Modifiers) 是以半角句号.指明的特殊后缀,用于指出一个指令应该以特殊方式绑定。例如.pr..._v-model简写

为什么招聘高级前端开发这么难?_为什么招聘高级前端开发这么难?-程序员宅基地

文章浏览阅读270次。曹操当年下求贤令,主要解决的就是一个多重标准的问题。「唯才是举,吾得而用之」很多人都觉得找工作怎么那么难,一个简历投了几百份,回的也没几个。你可知其实公司对于人才的需求,急躁心情丝毫不比你们的差。可能你会说,公司招不到人,钱给的不够多吧?那你往下看从这个帖子,可以看得出题主的要求是:1.2-3年以上工作经验2.基础牢固3.对某项技术有很深的研究4.学历背景好比如说满足条件1的市场上占70%;满足基础牢固的程序员占30%;满足对某个方向技术有较深研究的占30%;满足学历背景好的占10%。所以题主_为什么招聘高级前端开发这么难?

Python - max()中key的作用_max(dict1.keys())-程序员宅基地

文章浏览阅读1.3k次。Python - max()中key的作用_max(dict1.keys())

RobotFramework中setUp的小技巧_robotframework arguments[0].setattribute-程序员宅基地

文章浏览阅读4.6k次。背景使用RobotFramework进行测试的时候,经常会需要写一些准备数据的脚本,比如我现在的的脚本框架下,把所有的变量和项目配置都放在服务器上,那么我在执行用例的时候,就必须要去读取这些配置,但是在每个用例都要写一遍这个读取配置的代码,显得很繁琐,偶然的尝试,发现了这个小技巧。往常的做法正常来说,我们如果要拿到这些配置,必须要执行获取配置的关键字,然后拿到这个关键字的返回值,然后才能执行后续的步_robotframework arguments[0].setattribute