用Excel进行多元回归分析

  • Share This
Hugh West

简单回归 分析通常用于估计两个变量之间的关系,例如,作物产量与降雨量之间的关系或面包味道与烤箱温度之间的关系。 然而,我们更经常需要调查一个因变量与两个或多个自变量之间的关系。 例如,一个房地产经纪人可能想知道房子的大小、卧室的数量和附近地区的平均收入等措施是否与房子的售价有关系,以及如何有关系。 这类问题可以通过以下方式解决 多重回归分析。 而本文将为您总结如何使用Excel做多元回归分析。

问题

假设我们随机抽取了5名销售人员,并收集了如下表所示的信息。 教育或激励对年销售额是否有影响?

完成学业的最高年份 用希金斯动机量表衡量的动机 年销售额(美元
12 32 $350,000
14 35 $399,765
15 45 $429,000
16 50 $435,000
18 65 $433,000

方程式

一般来说。 多重回归分析 假设因变量(y)和自变量(x1, x2, x3 ... xn)之间存在线性关系。 而这种线性关系可以用以下公式描述。

Y = 常数 + β1*x1 + β2*x2+...+ βn*xn

下面是对常数和系数的解释。

Y Y的预测值
恒定 Y-截距
β1 X1每增加1个增量,Y就会发生变化
β2 X2每增加1个增量,Y就会发生变化
... ...
βn Xn每增加1个增量,Y就会发生变化

常数和β1, β2...βn可以根据现有的样本数据计算出来。 在你得到常数、β1, β2...βn的数值后,你可以用它们来进行预测。

至于我们的问题,只有两个我们感兴趣的因素。 因此,方程式将是。

年销售额=常数+β1*(完成学业的最高年份)+β2*(由希金斯动机量表衡量的动机)。

设置模型

如图1所示,年销售额、完成学业的最高年份和动机被输入A栏、B栏和C栏。 最好总是把因变量(这里的年销售额)放在自变量之前。

图一

下载分析工具包

Excel为我们提供了数据分析功能,它可以返回常数和系数的值。 但是在使用这个功能之前,你需要下载Analysis ToolPak。 下面是你如何安装它。

点击进入 文件 tab -> 选择 然后点击 附加元件 Excel选项 对话框中,点击 进展 的底部的按钮。 Excel选项 对话框,以打开 附加元件 对话框中。 附加元件 对话框,选择 分析 TookPak 复选框,然后点击 好的 .

现在,如果你点击 数据 标签,你会看到 数据分析 出现在 分析报告 组(右图)。

图2 [点击图片以获得全貌]

多重回归分析

点击进入 数据分析 分析报告 的小组。 数据 标签:选择 回归 在提示的 数据分析 你还可以做其他 统计分析 如t检验,方差分析,等等。

图3.1

A 回归 在你选择了 回归 .填写图3.2所示的对话框。

输入Y范围包含因变量和数据,而输入X范围包含自变量和数据。 这里我必须提醒你,自变量应该在相邻的列中。 而且自变量的最大数量是15。

由于A1: C1范围包括变量标签,因此应该选择标签复选框。 事实上,我建议你每次在填写输入Y范围和输入X范围时都要包括标签。这些标签在你审查Excel返回的汇总报告时很有帮助。

图3.2

通过选择 "残差 "复选框,你可以使Excel列出每个观察值的残差。 看图1,总共有5个观察值,你将得到5个残差。 残差是你从观察值中减去预测值后剩下的东西。 标准化残差是残差除以其标准偏差。

你也可以选择 "残差图 "复选框,它可以使Excel返回残差图。 残差图的数量等于自变量的数量。 残差图是一个在Y轴上显示残差,在X轴上显示自变量的图形。 残差图中X轴周围随机分散的点意味着 线性回归 例如,图3.3显示了三种典型的残差图模式。 只有左边的模式表明它是一个很好的线性模型的拟合。 其他两个模式表明非线性模型的拟合更好。

图3.3

如果你选择了拟合线图复选框,Excel将返回一个拟合线图。 拟合线图可以绘制一个因变量和一个自变量之间的关系。 换句话说,Excel将返回与自变量相同数量的拟合线图。 例如,对于我们的问题,你将得到2个拟合线图。

结果

在你点击 "确定 "按钮后,Excel将返回一个总结报告,如下所示。 绿色和黄色突出显示的单元格是最重要的部分,你应该注意。

图3.4

R-square(单元格F5)越高,因变量和自变量之间的关系就越紧密。 而第三个表格中的系数(范围F17:F19)给你返回了常数和系数的值。 方程应该是年销售额=1589.2+19928.3*(最高毕业年份)+11.9*(希金斯动机量表衡量的动机)。

但是,为了了解结果是否可靠,你还需要检查黄色显示的p值。 只有当单元格J12中的p值小于0.05时,整个回归方程才是可靠的。 但是你还需要检查I17:I19范围内的p值,以了解常数和自变量对因变量的预测是否有用。 对于我们的问题,我们最好放弃在考虑独立变量时的动机。

阅读更多:如何在Excel中计算线性回归的P值(3种方法)。

从自变量中删除动机

在删除 "动机 "这个自变量后,我运用同样的方法做了一个简单的回归分析。 你可以看到,现在所有的数值都小于0.05。 最后的方程式应该是。

年销售额=1167.8+19993.3*(完成学业的最高年份)

图3.5 [点击图片以获得全貌]

注意事项

图4

除了Add-Ins工具,你还可以使用LINEST函数来做多元回归分析。 LINEST函数是一个数组函数,可以在一个单元格或一个单元格范围内返回结果。 首先,选择范围A8:B12,然后在这个范围的第一个单元格(A8)中输入公式"=LINEST(A2:A6,B2:B6,TRUE,TRUE)"。 在你按CTRL+SHIFT+ENTER后,Excel将返回结果为通过与图3.4的比较,你可以看到19993.3是完成学业的最高年份的系数,而1167.8是常数。 无论如何,我建议你使用Add-Ins工具。 它要容易得多。

阅读更多...

Excel中的逆向假设分析

如何在Excel中使用通配符?

下载工作文件

从以下链接下载工作文件。

多重回归分析.xlsx

Hugh West is a highly experienced Excel trainer and analyst with over 10 years of experience in the industry. He holds a Bachelor's degree in Accounting and Finance and a Master's degree in Business Administration. Hugh has a passion for teaching and has developed a unique teaching approach that is easy to follow and understand. His expert knowledge of Excel has helped thousands of students and professionals worldwide improve their skills and excel in their careers. Through his blog, Hugh shares his knowledge with the world, offering free Excel tutorials and online training to help individuals and businesses reach their full potential.