如何批量单因素logistic回归分析?

时间:2023-07-10 17:13:53       来源:哔哩哔哩

在医学科研、特别是观察性研究领域,无论是现况调查、病例对照研究、还是队列研究,经常遇到分类的健康结局,包括二分类(如:生存与死亡、阳性与阴性、发病与未发病)或者一些可进行分类的生理生化指标等(如:血压值、血镁值、血脂和胆固醇等)时,线性回归分析往往无法进行,此时可以考虑Logistic回归模型。

实际中,许多人习惯性使用SPSS进行回归分析,但是SPSS无法进行批量单因素分析,还需要手动绘制三线表,费时又费力。而R语言虽然可以进行批量单因素分析并制作三线表,但具有一定的门槛,需要编程基础,估计一时三刻也学不会。因此,这里结合一篇文献与实操案例为大家介绍一个智能在线免费统计分析平台——风暴统计。


(相关资料图)

一、实操数据介绍

这里我们使用的是R语言自带数据集MASS中的birthwt,birthwt是一份与婴儿出生体重低相关的危险因素数据,其中包含的变量见下表,根据研究设计,以“low”作为结局变量。

二、风暴统计智能在线免费平台复现

(1)进入风暴统计网站的“风暴智能统计”模块,点击“logistic回归分析”

(2)导入数据,目前支持10M以内的csv格式。数据导入前如需进行预处理的(如:定量数据转分类数据、多分类转二分类、打标签等),推荐用SPSS进行操作,具体详见下方文章:

如何结合SPSS与在线统计分析平台来撰写论文?

(4)指定因变量与自变量的变量类型

(5)批量单因素回归

右侧直接生成批量单因素三线表,点击表格上方菜单栏还可查看多因素回归结果与先单后多回归结果。

三、R语言软件复现

这里采用autoReg包,autoReg包是一款功能十分强大的R包,不仅可以快捷完成基线表的制作,还可以直接一行代码输出回归分析(支持线性模型、广义线性模型和比例风险模型)的表格。

(1)logistic回归模型构建

使用glm() 函数构建回归模型,glm(y~x1+x2+x3+x4+x......,data=数据集名,family="binomial"),指定因变量与自变量,设置数据集名。

logfit<-glm(low ~ age + lwt + race + smoke + ptd + ht + ui + ftv,data=bwt,family = "binomial")

summary(logfit)

此处参数family规定了回归模型的类型:family="binomial"指适用于二元离散因变量(binary)。

(2)显示单因素回归结果

logreg1<-autoReg(logfit,uni=TRUE)#显示单因素及多因素

logreg1

logtable1<-myft(logreg1)

四、总结

通过对比风暴统计平台与R语言的批量单因素回归结果相同,并且风暴统计平台为P值单独进行了分列,结果更加清晰明了!大家不妨都来试用一下啊!

关键词: