网易首页 > 网易号 > 正文 申请入驻

第二十一讲 | 多元线性回归分析(超级详细)

0
分享至

你好!欢迎参加《小白爱上SPSS》课程。

第二十一讲内容:多元线性回归分析怎么做?

今天我们来学习多元线性回归分析,它用来评价一个因变量和多个自变量之间关系的统计方法。除了需要满足一元线性回归的条件之外,多元线性回归还需要满足【多个自变量不存在多重共线】的条件,多元线性回归需要满足如下条件。

(1)自变量和因变量在理论上有因果关系;

(2)因变量为连续型变量;

(3)各自变量与因变量之间存有线性关系;

(4)残差要满足正态性、独立性、方差齐性。

(5)多个自变量不存在多重共线性

其中, 线性(Linear)、正态性(Normal)、独立性(independence)、方差齐性(Equal Variance) ,俗称 LINE ,是线性回归分析的四大基本前提条件。

这里稍微解释它们概念:

Q1 线性:解释自变量X和因变量Y必须要有线性关系吗?

---不是!只有当X是连续型数据或者等级数据(不设哑变量)时,才要求X与Y有线性的关系。当X是二分类或无需多分类,没有线性条件的要求。

Q2独立性:要求因变量Y各观察值相互独立吗?

---不是,是要求残差是独立的。

Q3正态性:要求因变量Y各观察值正态分布吗?

---不是,是要求残差正态分布。

Q4方差齐性:要求不同的解释变量X时,因变量Y方差相等吗?

---没错,但是对于多元线性回归分析,更加合理的理解是在不同Y预测值情况下,残差的方差变化不大。

Q5:一定要严格满足LINK吗?

---如果回归分析只是建立自变量与因变量之间关系,无须根据自变量预测因变量的容许区间和可信度等,则方差齐性和正态性可以适当放宽。

何为残差?

残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。 我们以一元线性回归为例,它只有一个自变量,其模型可以表示为:

上述公式是基于样本得到的结果,b0和b1均为统计量。

若该公式拓展到总体人群,则为:

值得注意的是,这里x是真实的变量值x,而y带了一顶帽子,并非是y的真实值,而是成为y的预测值或者估计值。实际上,x和y没有严格上一一对应的关系,通过x产生的预测值,是接近于y但不等于y。
y预测值与y真实值之间的差值我们称之为残差。

残差反映了除了x和y之间的线性关系之外的随机因素对y的影响,是不能由x和y之间的线性关系所解释的变异性。

可以这么来理解ϵ:我们对y的预测是不可能达到与真实值完全一样的,因此必然会产生误差,我们就用ϵ来表示这个无法预测的误差。我们通过引入了ϵ可以让模型达到完美状态,也就是理论的回归模型。
结合残差,真实的y和x关系如下:


同样的,多个自变量存在的情况下,多重线性回归模型的表示如下:


其中,bk、βk:回归系数,在多重线性回归中,被称之为偏回归系数,表示每个自变量都对y部分的产生了影响。

意义与简单线性回归结果相似,反映的是x对y的影响力,是当x每改变一个观测单位时所引起y的改变量

这里e是样本的预测值与测量值的差别,ϵ是总体中预测值与真实值的差别。戴了帽子的y预测值的变异性是解释变量x们能够预测和解释的。

一般情况下,成功的线性回归模型实现:

(1)残差ϵ是一个期望为0的随机变量,即E(ϵ)=0

(2)对于预测值的所有值,ϵ的方差σ^2都相同

(3)残差ϵ是一个服从正态分布的随机变量,且相互独立,即ϵ~N(0,σ^2)

何为多重共线?

当2个或多个自变量高度相关时,就会出现多重共线。它不仅影响自变量对因变量变异的解释能力,还影响整个多重线性回归模型的拟合。

PART1

实战案例

小白研究运动员训练比赛满意感与成就感降低、情绪体力耗竭、运动负评价、自尊等变量之间关系,试建立多元线性回归方程 (部分数据如下,完整数据请回复【小白数据】下载)。

该案例研究运动员训练比赛满意感与多个自变量(成就感降低、情绪体力耗竭、运动负评价、自尊)之间的关系。从专业知识上课认为成就感降低、情绪体力耗竭、运动负评价、自尊是可以预测训练比赛满意感的。

PART2

统计策略

统计分析策略口诀“目的引导设计,变量确定方法”(啥意思? )

针对上述案例,扪心五问。

Q1本案例研究目的是什么?

A关联研究,探讨多个自变量与因变量之间的因果关系。

Q2分析的组数是多少呢?

A五 组数据。

Q3本案例属于什么研究设计?

A调查 研 究

Q4有几个变量?

A有五个变量。分别是成就感降低、情绪体力耗竭、运动负评价、训练比赛满意感、自尊。

(训练比赛满意感为因变量,成就感降低、情绪体力耗竭、运动负评价、自尊为自变量)

Q5残差是否具有独立性、方差齐性和正态分布?

A需要检验残差是否满足独立性、方差齐性和正态性。

Q6各自变量之间是否存在多重共线性?

A:需要检验

概括而言,如果数据满足以下条件,则采用多元线性回归分析。

PART3

SPSS操作

(一)绘制散点图

对于线性关系的条件,一般要求当x是连续型变量或者等级变量时,需绘制散点图探讨与y是否存在着线性趋势的关系;如x为二分类或者无序多分类,无须绘制散点图。


本例绘制成就感降低、情绪体力耗竭、运动负评价、自尊与训练比赛满意感之间关系的散点图分析。具体操作如下。

Step1: 图形—图形画板模板选择器

Step2: 按Shift选择左边的对话框所有的变量,同时点击【散点图矩阵】,点击【确定】。

输出结果如下, 重点关注最后一行 ,即各自变量(成就感降低、情绪体力耗竭、运动负评价、自尊)与因变量(训练比赛满意感)之间线性关系。从图中可知,各自变量与因变量之间存有线性关系。

(二)线性回归分析操作

Step1: 依次点击“分析——回归——线性

Step2: 将“训练比赛满意感”纳入“因变量”;将成就感降低、情绪体力耗竭、运动负评价、自尊放入“自变量”;方法选择“输入”

Step3: 点击“统计” 默认选项“估算值”;“模型拟合”;另选择“durin waston(德宾-沃森)和“描述”。设置完后,点击“继续”。

Step4 : 在弹出“线性回归:图”对话框中将 “*ZRESID”(标准化残差)放入Y轴中,将“*ZPRED”(标准化预测值)放入X轴中,勾选“直方图”和“正态概率图”,单击“继续”。点击“确定”。

Step5: 点击“保存”后勾选预测值的“未标准化”和“残差的未标准化”。

PART4

结果解读

第一,呈现的是R方结果和残差独立性检验(德宾沃森检验):

模型摘要是判断两者之间线性关系的重要指标,也反映了回归的拟合程度。

①一般情况下,R²看的是“调整R²”,该值相对不受自变量个数的影响,结果更为可靠。本例包括多个自变量,建议报告调整R²=0.487。表明“所有自变量” 解释“训练比赛满意感”的48.7%变异。

②德宾沃森检验若结果在0-4之间,基本可认为数据独立性符合。本例的德宾沃森值为1.761,符合独立性。

第二个结果为方差分析(ANOVA):

主要探讨模型的是否成功建成。

本案例F=24.464,P<0.001,说明至少有一个自变量解释了一部分的因变量的变异,从而使得回归变异变大,残差变异减少,模型成功建立。

值得注意的是,本题“平方”和即变异程度(离均差平方和),R²=回归变异平方和/总的平方和=1807.759/3562.760=0.507。因此方差分析和R²结果同出一源, 方差分析侧重于分析模型是否成功 , R²侧重于探讨模型有多成功(相当于效应量) 。

如果P<0.05,就说明多重线性回归模型中至少有一个自变量的系数不为零。同时,回归模型有统计学意义也说明相较于空模型,纳入自变量有助于预测因变量,或说明该模型优于空模型。

第三个结果,回归分析的主要结果:

计算回归系数、并对回归系数进行假设检验,探讨影响因素。

本研究结果显示:

①成就感降低(b=-0.72,β=-0.353,P<0.001)、情绪体力耗竭(b=-0.358,β=-0.209,P=0.009)和自尊(b=0.604,β=0.352,P<0.001)均会影响训练比赛满意感。其中,成就感降低和情绪体力耗竭负向预测(因为回归系数为负)训练比赛满意感,而自尊正向预测(因为回归系数为正)训练比赛满意感。

②运动负评价不会影响训练比赛满意感(b=-0.106,β=-0.052,P=0.552)。

③共线性统计包括方差膨胀因子(VIF)和容差两个指标,事实上,VIF=容差的倒数(1/容差),我们只需要判断其中一个指标即可。如果容忍度小于0.1(或方差膨胀因子大于10),提示数据存在多重共线性。在本研究中,所有容忍度值都大于0.1(最小值为0.639),说明本研究自变量多重共线不严重。

第四个结果,由于本例选择计算残差和预测值,可以通过下表来看预测值和残差结果

在数据库中,可以发现增加了PRE_1(预测值)和RES_1(残差) ,两组相加,刚好是y“训练比赛满意感”

第五个结果,残差直方图和P-P图。

可以看出,本例残差直方图服从正态分布,且均数接近于0,标准差接近于1(标准正态分布),这意味着线性回归在正态性条件是达到的。P-P图也表明满足正态性条件。

第六个结果,残差图。

残差图的x、y轴分别是因变量预测值的标准化值和残差的标准化值(一般x轴是预测值的标准化值)。本例从图形来看,标准化残差图分布在0值周围,基本是上下对称分布,分布特征不随预测值的增加而发生改变,意味着数据方差齐性、独立性条件符合。

PART5

规范报告

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

2、规范文字

采用多元线性回归分析结果显示,回归方程显著,F=24.464,p<0.001。其中,成就感降低(β=-0.353,P<0.001)、情绪体力耗竭(β=-0.209,p=0.009)显著负向预测训练比赛满意感,自尊(β=-0.352,p<0.001)显著正向预测训练比赛满意感。运动负评价不能预测训练比赛满意感(β=-0.596,p=0.552)。这些变量共解释训练比赛满意感48.70%的变异。

划重点

1、多元线性回归分析本质上是探讨变量之间相关关系,只有在理论上满足多个自变量与因变量之间存在因果关系,才可开展回归分析。此外,即使回归分析显著,在解释因果关系也需谨慎。

2、多元线性回归中的因变量需满足连续型变量;自变量可以分类变量、次序变量和连续型变量。

3、如果自变量为连续型变量,则需要满足自变量和因变量之间存在线性关系,如果不能满足,则不能采用线性回归分析,这可通过散点图来判断线性关系。

4、回归分析还需满足独立性、方差齐性和正态性,各自变量之间不存在多重共线性。独立性采用德宾-沃森(D-W)残差相关性检验;方差齐性采用残差散点图来检验;正态性采用残差正态分布图和P-P图来判断。

5、如果回归分析只是建立自变量与因变量之间关系,无须根据自变量预测因变量的容许区间和可信度等,则方差齐性和正态性可以适当放宽。

图文 | 叶嘉诺

编辑 | Steven Lynn

审核 | 项老师

如果觉得文章不错,

就点击关注、分享吧!

关注本公众号,您收获:

【SPSS 26破解版软件】

【所有教学案例数据】

【5本统计科普电子书】

【100套心理权威量表】

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗伊斯兰革命卫队发布全球声明,称已针对以色列发起军事行动

伊朗伊斯兰革命卫队发布全球声明,称已针对以色列发起军事行动

百年历史老号
2026-03-24 08:16:40
唐嫣不再隐忍!突然“摊牌”离婚真相,不给罗晋留一丝“体面”

唐嫣不再隐忍!突然“摊牌”离婚真相,不给罗晋留一丝“体面”

阿握聊事
2026-03-19 14:32:56
房价,大涨了40%?

房价,大涨了40%?

科学发掘
2026-03-23 17:18:35
全体起立!内地楼市“最后一跌”来了

全体起立!内地楼市“最后一跌”来了

扒财经
2026-03-24 15:20:19
来了,皇马!曝1.3亿“节拍器”同意加盟!后防“顶星”转投尤文

来了,皇马!曝1.3亿“节拍器”同意加盟!后防“顶星”转投尤文

头狼追球
2026-03-24 09:01:31
伊朗顶尖弹道导弹科学家全家被炸身亡

伊朗顶尖弹道导弹科学家全家被炸身亡

桂系007
2026-03-24 04:34:10
美方称将推迟对伊朗发电厂的攻击 外交部回应

美方称将推迟对伊朗发电厂的攻击 外交部回应

新京报
2026-03-24 16:05:05
万斯决定“急流勇退”?美国下届总统已无悬念?对华态度更强硬

万斯决定“急流勇退”?美国下届总统已无悬念?对华态度更强硬

兰妮搞笑分享
2026-03-24 16:05:40
贾国龙59元焖面经过实测,网友们纷纷回应,罗永浩算是白说了!

贾国龙59元焖面经过实测,网友们纷纷回应,罗永浩算是白说了!

椰青美食分享
2026-03-24 11:24:56
郝蕾太丰满,穿透视礼服都兜不住好身材,难怪网友这么喜欢她

郝蕾太丰满,穿透视礼服都兜不住好身材,难怪网友这么喜欢她

章眽八卦
2026-03-24 10:59:53
医生研究发现:不易患痴呆的老人,大多有4个习惯,占一个也不错

医生研究发现:不易患痴呆的老人,大多有4个习惯,占一个也不错

任医生聊健康
2026-03-23 14:47:51
招93个博士,引来400余人角逐!山东首所公办职业本科赢麻了

招93个博士,引来400余人角逐!山东首所公办职业本科赢麻了

齐鲁壹点
2026-03-24 18:49:14
韩国总理临时取消访华,发长文请中方谅解,不来中国实在是有苦衷

韩国总理临时取消访华,发长文请中方谅解,不来中国实在是有苦衷

谛听骨语本尊
2026-03-24 18:18:54
终于有了结果,曾医生能保住医院的工作,最应该感谢的三位贵人!

终于有了结果,曾医生能保住医院的工作,最应该感谢的三位贵人!

凌风的世界观
2025-11-14 08:38:31
知情人爆料唐季礼导演接触肖战!女主候选人名单已定,均顶流大咖

知情人爆料唐季礼导演接触肖战!女主候选人名单已定,均顶流大咖

悦君兮君不知
2026-03-24 16:52:09
社评:比利时首相的这封信,是在给欧盟挖坑

社评:比利时首相的这封信,是在给欧盟挖坑

环球网资讯
2026-03-24 00:29:39
斯诺克世锦赛将继续留在克鲁斯堡举办,新协议至少延长至2045年

斯诺克世锦赛将继续留在克鲁斯堡举办,新协议至少延长至2045年

懂球帝
2026-03-24 21:53:05
消费降级!今年什么行业最惨淡?评论区:钱难挣,屎难吃

消费降级!今年什么行业最惨淡?评论区:钱难挣,屎难吃

霹雳炮
2026-03-22 22:36:39
为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

为什么闲鱼很多卖家只支持自提?网友:等你碰上到手刀的就老实了

另子维爱读史
2026-03-22 22:34:48
大突破!中国水稻再破世界难题,以后种地再也不用年年买种子了?

大突破!中国水稻再破世界难题,以后种地再也不用年年买种子了?

老特有话说
2026-03-24 14:58:09
2026-03-24 23:15:00
运动健康网
运动健康网
运动健康科普公益平台
1582文章数 2229关注度
往期回顾 全部

科技要闻

年仅41岁,教育名师张雪峰猝然离世

头条要闻

外媒披露特朗普"急转弯"原因:盟友和海湾国家发出警告

头条要闻

外媒披露特朗普"急转弯"原因:盟友和海湾国家发出警告

体育要闻

NBA最强左手射手,是个右撇子

娱乐要闻

张雪峰经抢救无效不幸去世 年仅41岁

财经要闻

特朗普再TACO 可以押注伊朗局势降级?

汽车要闻

尚界Z7双车预售22.98万起 问界M6预售26.98万起

态度原创

健康
家居
艺术
旅游
公开课

转头就晕的耳石症,能开车上班吗?

家居要闻

智慧生活 奢享家居

艺术要闻

揭秘!伊丽莎白泰勒如何复制埃及艳后的魅惑魅力?

旅游要闻

今年黄埔“波罗诞”千年庙会,夜游、剧本游、主题车都安排上

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版