Table of contents
简单回归 分析通常用于估计两个变量之间的关系,例如,作物产量与降雨量之间的关系或面包味道与烤箱温度之间的关系。 然而,我们更经常需要调查一个因变量与两个或多个自变量之间的关系。 例如,一个房地产经纪人可能想知道房子的大小、卧室的数量和附近地区的平均收入等措施是否与房子的售价有关系,以及如何有关系。 这类问题可以通过以下方式解决 多重回归分析。 而本文将为您总结如何使用Excel做多元回归分析。
问题
假设我们随机抽取了5名销售人员,并收集了如下表所示的信息。 教育或激励对年销售额是否有影响?
完成学业的最高年份 | 用希金斯动机量表衡量的动机 | 年销售额(美元 |
12 | 32 | $350,000 |
14 | 35 | $399,765 |
15 | 45 | $429,000 |
16 | 50 | $435,000 |
18 | 65 | $433,000 |
方程式
一般来说。 多重回归分析 假设因变量(y)和自变量(x1, x2, x3 ... xn)之间存在线性关系。 而这种线性关系可以用以下公式描述。
Y = 常数 + β1*x1 + β2*x2+...+ βn*xn
下面是对常数和系数的解释。
Y | Y的预测值 |
恒定 | Y-截距 |
β1 | X1每增加1个增量,Y就会发生变化 |
β2 | X2每增加1个增量,Y就会发生变化 |
... | ... |
βn | Xn每增加1个增量,Y就会发生变化 |
常数和β1, β2...βn可以根据现有的样本数据计算出来。 在你得到常数、β1, β2...βn的数值后,你可以用它们来进行预测。
至于我们的问题,只有两个我们感兴趣的因素。 因此,方程式将是。
年销售额=常数+β1*(完成学业的最高年份)+β2*(由希金斯动机量表衡量的动机)。
设置模型
如图1所示,年销售额、完成学业的最高年份和动机被输入A栏、B栏和C栏。 最好总是把因变量(这里的年销售额)放在自变量之前。
图一
下载分析工具包
Excel为我们提供了数据分析功能,它可以返回常数和系数的值。 但是在使用这个功能之前,你需要下载Analysis ToolPak。 下面是你如何安装它。
点击进入 文件 tab -> 选择 然后点击 附加元件 在 Excel选项 对话框中,点击 进展 的底部的按钮。 Excel选项 对话框,以打开 附加元件 对话框中。 附加元件 对话框,选择 分析 TookPak 复选框,然后点击 好的 .
现在,如果你点击 数据 标签,你会看到 数据分析 出现在 分析报告 组(右图)。
图2 [点击图片以获得全貌]
多重回归分析
点击进入 数据分析 在 分析报告 的小组。 数据 标签:选择 回归 在提示的 数据分析 你还可以做其他 统计分析 如t检验,方差分析,等等。
图3.1
A 回归 在你选择了 回归 .填写图3.2所示的对话框。
输入Y范围包含因变量和数据,而输入X范围包含自变量和数据。 这里我必须提醒你,自变量应该在相邻的列中。 而且自变量的最大数量是15。
由于A1: C1范围包括变量标签,因此应该选择标签复选框。 事实上,我建议你每次在填写输入Y范围和输入X范围时都要包括标签。这些标签在你审查Excel返回的汇总报告时很有帮助。
图3.2
通过选择 "残差 "复选框,你可以使Excel列出每个观察值的残差。 看图1,总共有5个观察值,你将得到5个残差。 残差是你从观察值中减去预测值后剩下的东西。 标准化残差是残差除以其标准偏差。
你也可以选择 "残差图 "复选框,它可以使Excel返回残差图。 残差图的数量等于自变量的数量。 残差图是一个在Y轴上显示残差,在X轴上显示自变量的图形。 残差图中X轴周围随机分散的点意味着 线性回归 例如,图3.3显示了三种典型的残差图模式。 只有左边的模式表明它是一个很好的线性模型的拟合。 其他两个模式表明非线性模型的拟合更好。
图3.3
如果你选择了拟合线图复选框,Excel将返回一个拟合线图。 拟合线图可以绘制一个因变量和一个自变量之间的关系。 换句话说,Excel将返回与自变量相同数量的拟合线图。 例如,对于我们的问题,你将得到2个拟合线图。
结果
在你点击 "确定 "按钮后,Excel将返回一个总结报告,如下所示。 绿色和黄色突出显示的单元格是最重要的部分,你应该注意。
图3.4
R-square(单元格F5)越高,因变量和自变量之间的关系就越紧密。 而第三个表格中的系数(范围F17:F19)给你返回了常数和系数的值。 方程应该是年销售额=1589.2+19928.3*(最高毕业年份)+11.9*(希金斯动机量表衡量的动机)。
但是,为了了解结果是否可靠,你还需要检查黄色显示的p值。 只有当单元格J12中的p值小于0.05时,整个回归方程才是可靠的。 但是你还需要检查I17:I19范围内的p值,以了解常数和自变量对因变量的预测是否有用。 对于我们的问题,我们最好放弃在考虑独立变量时的动机。
阅读更多:如何在Excel中计算线性回归的P值(3种方法)。
从自变量中删除动机
在删除 "动机 "这个自变量后,我运用同样的方法做了一个简单的回归分析。 你可以看到,现在所有的数值都小于0.05。 最后的方程式应该是。
年销售额=1167.8+19993.3*(完成学业的最高年份)
图3.5 [点击图片以获得全貌]
注意事项
图4
除了Add-Ins工具,你还可以使用LINEST函数来做多元回归分析。 LINEST函数是一个数组函数,可以在一个单元格或一个单元格范围内返回结果。 首先,选择范围A8:B12,然后在这个范围的第一个单元格(A8)中输入公式"=LINEST(A2:A6,B2:B6,TRUE,TRUE)"。 在你按CTRL+SHIFT+ENTER后,Excel将返回结果为通过与图3.4的比较,你可以看到19993.3是完成学业的最高年份的系数,而1167.8是常数。 无论如何,我建议你使用Add-Ins工具。 它要容易得多。
阅读更多...
Excel中的逆向假设分析
如何在Excel中使用通配符?
下载工作文件
从以下链接下载工作文件。
多重回归分析.xlsx