R语言基于Logistic回归绘制限制性立方样条图(Restricted Cubic Spline)_限制性立方样条logistic回归-程序员宅基地

图片

  • 相关介绍:

在病因推断、剂量效应研究中,时常要分析自变量和因变量的数量关系。广义线性模型,如Logistic回归、Possion回归等是应用比较广泛的方法。它的一个重要假设是通过选择合适的链接函数,因变量与自变量的关系呈线性。这个假设在某些情况下并不成立。

此时一个常见的处理是采用百分位数等方法将连续性变量分段(P value for trend)。但是分段往往主观,而且损失信息,并有可能引入偏倚。本文介绍限制性立方样条拟合自变量和因变量之间的非线性关系。

限制性立方样条中节点的个数(k)和位置可以由研究人员根据研究背景和数据选择。当有较强的背景知识支持,知道自变量和应变量的关系在某些特定节点转折时,可以选择这些特定的节点。但是实际上往往没有足够的背景知识足以确定节点的个数和位置。所幸绝大多数情况下,节点的位置对限制性立方样条的拟合影响不大,相对来说节点的个数是更关键的参数。节点的个数决定曲线的形状,或者说平滑程度。当节点的个数为2时,得到的拟合曲线就是一条直线。当节点个数等于样本量时,相当于将各个点用线段相连,得到的是完全拟合但是不平滑的折线。由于节点个数的选择和自由度有关,所以当样本量比较大的时候可以取较多的节点。但是,一般来说节点个数取3~7就足够了。



  • RCS案例图形:

图片


  • R语言代码实现:

    利用library()函数加载本案例所需R包,R程序代码如下:

library(smoothHR)
library(survival)
library(rms)
library(Hmisc)

导入数据,并查看变量名称,R程序代码如下:

RCS <- read.csv("RCS.csv")
names(RCS

因变量group 、自变量VO2max、协变量Age、BMI。

寻找最优节点数knots,R程序代码如下:

for (i in 3:7) {
  fit <- glm(group~rcs(BMI,nk=i)+Age+VO2max,data=RCS, family = binomial())
  tmp <- extractAIC(fit)
  if(i == 3) {AIC = tmp[2]; nk = 3}
  if(tmp[2] < AIC) {AIC = tmp[2]; nk = i} 
}

以上代码为根据AIC准则筛选最小AIC对应的knots。结果显示最优knots为3。

开始拟合模型,R程序代码如下:

# 连续变量BMI被样条化
fit <- lrm(group~rcs(BMI,nk=nk)+Age+VO2max,data=RCS, x=TRUE,y=TRUE)
anova(fit)

输出结果如下:

 Wald Statistics     Response: group  Factor     Chi-Square d.f.   P      BMI         97.12     4    <.0001  Nonlinear  6.35     3    0.033 Age         27.62     1    <.0001 VO2max       0.21     1    0.6444 TOTAL      111.02     6    <.0001

结果显示非线性的P值=0.033,提示存在非线性。

将非线性P值提取出来,方便后续作图,R程序代码如下:​​​​​​​

##p-non-linear
p <-round(anova(fit)[,3],3)

设置参考值,这是一个具有生物/医学意义的参考值。无论参考值为何,该点处的OR为1,R程序代码如下:

refvalue <- 21.75 

对数据进行打包,并指定参考值,R程序代码如下:​​​​​​​

ddist<-datadist(RCS)
ddist$limits$BMI[2]<-refvalue
options(datadist="ddist")

将模型预测的OR值储存在pred_OR中,R程序代码如下:

pred_OR<-Predict(fit,BMI,ref.zero=TRUE,fun=exp)

开始绘制图形:​​​​​​​

# 设置密度曲线的背景色
violet <- "#89439B"
# 绘制左右双坐标轴baseplot
par(mar = c(5, 4, 4, 4) + 0.3)
par(xpd=NA)
ylim.bot<-min(pred_OR[,"lower"])
ylim.top<-max(pred_OR[,"upper"])
# 先画密度图以免遮挡下面的线图
dens <- density(RCS$BMI) # 计算密度
plot(dens$x,dens$y, col=ggplot2::alpha(violet,0.5), type="l", xlab = "", ylab = "",xaxt="n",yaxt="n")
polygon(dens$x,dens$y,col = ggplot2::alpha(violet,0.5),border = ggplot2::alpha(violet,0.5)) # 颜色透明化防遮盖线条
par(new=TRUE) # 新增画布
plot(pred_OR[,1],pred_OR[,"yhat"], 
     xlab = "BMI",ylab = paste0("OR where the refvalue for BMI is ",refvalue),
     type = "l",ylim = c(ylim.bot,ylim.top),
     col="red",lwd=2) 
lines(pred_OR[,1],pred_OR[,"lower"],lty=2,lwd=1.5)
lines(pred_OR[,1],pred_OR[,"upper"],lty=2,lwd=1.5)
lines(x=range(pred_OR[,1]),y=c(1,1),lty=3,col="grey40",lwd=1.3) #
points(refvalue,1,pch=16,cex=1.2)
#附上refvalue的值,具体位置可以自己修改
text(refvalue + 2, 1.1, paste0("refvalue = ",refvalue)) 
# 绘制图例,注意非线性p值在变量p中的位置
legend("topright",
       paste0("P-overall ",ifelse(round(p[1],3) < 0.001,"< 0.001",round(p[1],3)),
              "\nP-non-linear = ",ifelse(round(p[2],3) < 0.001,"< 0.001",round(p[2],3))),
       bty="n",cex=0.8)
legend("bottomleft",lty = c(1,2),col = c("red","black"),
       c("Estimation","95% CI"),
       bty="n",cex=0.8)

输出图形如案例图形:

图片

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/m0_61115677/article/details/119835364

智能推荐

while循环&CPU占用率高问题深入分析与解决方案_main函数使用while(1)循环cpu占用99-程序员宅基地

文章浏览阅读3.8k次,点赞9次,收藏28次。直接上一个工作中碰到的问题,另外一个系统开启多线程调用我这边的接口,然后我这边会开启多线程批量查询第三方接口并且返回给调用方。使用的是两三年前别人遗留下来的方法,放到线上后发现确实是可以正常取到结果,但是一旦调用,CPU占用就直接100%(部署环境是win server服务器)。因此查看了下相关的老代码并使用JProfiler查看发现是在某个while循环的时候有问题。具体项目代码就不贴了,类似于下面这段代码。​​​​​​while(flag) {//your code;}这里的flag._main函数使用while(1)循环cpu占用99

【无标题】jetbrains idea shift f6不生效_idea shift +f6快捷键不生效-程序员宅基地

文章浏览阅读347次。idea shift f6 快捷键无效_idea shift +f6快捷键不生效

node.js学习笔记之Node中的核心模块_node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是-程序员宅基地

文章浏览阅读135次。Ecmacript 中没有DOM 和 BOM核心模块Node为JavaScript提供了很多服务器级别,这些API绝大多数都被包装到了一个具名和核心模块中了,例如文件操作的 fs 核心模块 ,http服务构建的http 模块 path 路径操作模块 os 操作系统信息模块// 用来获取机器信息的var os = require('os')// 用来操作路径的var path = require('path')// 获取当前机器的 CPU 信息console.log(os.cpus._node模块中有很多核心模块,以下不属于核心模块,使用时需下载的是

数学建模【SPSS 下载-安装、方差分析与回归分析的SPSS实现(软件概述、方差分析、回归分析)】_化工数学模型数据回归软件-程序员宅基地

文章浏览阅读10w+次,点赞435次,收藏3.4k次。SPSS 22 下载安装过程7.6 方差分析与回归分析的SPSS实现7.6.1 SPSS软件概述1 SPSS版本与安装2 SPSS界面3 SPSS特点4 SPSS数据7.6.2 SPSS与方差分析1 单因素方差分析2 双因素方差分析7.6.3 SPSS与回归分析SPSS回归分析过程牙膏价格问题的回归分析_化工数学模型数据回归软件

利用hutool实现邮件发送功能_hutool发送邮件-程序员宅基地

文章浏览阅读7.5k次。如何利用hutool工具包实现邮件发送功能呢?1、首先引入hutool依赖<dependency> <groupId>cn.hutool</groupId> <artifactId>hutool-all</artifactId> <version>5.7.19</version></dependency>2、编写邮件发送工具类package com.pc.c..._hutool发送邮件

docker安装elasticsearch,elasticsearch-head,kibana,ik分词器_docker安装kibana连接elasticsearch并且elasticsearch有密码-程序员宅基地

文章浏览阅读867次,点赞2次,收藏2次。docker安装elasticsearch,elasticsearch-head,kibana,ik分词器安装方式基本有两种,一种是pull的方式,一种是Dockerfile的方式,由于pull的方式pull下来后还需配置许多东西且不便于复用,个人比较喜欢使用Dockerfile的方式所有docker支持的镜像基本都在https://hub.docker.com/docker的官网上能找到合..._docker安装kibana连接elasticsearch并且elasticsearch有密码

随便推点

Python 攻克移动开发失败!_beeware-程序员宅基地

文章浏览阅读1.3w次,点赞57次,收藏92次。整理 | 郑丽媛出品 | CSDN(ID:CSDNnews)近年来,随着机器学习的兴起,有一门编程语言逐渐变得火热——Python。得益于其针对机器学习提供了大量开源框架和第三方模块,内置..._beeware

Swift4.0_Timer 的基本使用_swift timer 暂停-程序员宅基地

文章浏览阅读7.9k次。//// ViewController.swift// Day_10_Timer//// Created by dongqiangfei on 2018/10/15.// Copyright 2018年 飞飞. All rights reserved.//import UIKitclass ViewController: UIViewController { ..._swift timer 暂停

元素三大等待-程序员宅基地

文章浏览阅读986次,点赞2次,收藏2次。1.硬性等待让当前线程暂停执行,应用场景:代码执行速度太快了,但是UI元素没有立马加载出来,造成两者不同步,这时候就可以让代码等待一下,再去执行找元素的动作线程休眠,强制等待 Thread.sleep(long mills)package com.example.demo;import org.junit.jupiter.api.Test;import org.openqa.selenium.By;import org.openqa.selenium.firefox.Firefox.._元素三大等待

Java软件工程师职位分析_java岗位分析-程序员宅基地

文章浏览阅读3k次,点赞4次,收藏14次。Java软件工程师职位分析_java岗位分析

Java:Unreachable code的解决方法_java unreachable code-程序员宅基地

文章浏览阅读2k次。Java:Unreachable code的解决方法_java unreachable code

标签data-*自定义属性值和根据data属性值查找对应标签_如何根据data-*属性获取对应的标签对象-程序员宅基地

文章浏览阅读1w次。1、html中设置标签data-*的值 标题 11111 222222、点击获取当前标签的data-url的值$('dd').on('click', function() { var urlVal = $(this).data('ur_如何根据data-*属性获取对应的标签对象

推荐文章

热门文章

相关标签