Table of contents
回归分析几乎存在于每一种统计软件中,如 SPSS , R, 回归可以给我们提供关于变量之间关系的全貌。 线性回归可以在Excel中快速完成,使用的是 数据分析 这篇文章将说明你如何能够 在Excel中解释回归结果。
下载实践工作手册
在下面下载这个练习手册。
解释回归结果.xlsx什么是回归?
回归分析通常用于数据分析,以确定多个变量之间的关联。 回归分析允许你选择如果其中一个自变量发生变化,因变量会发生什么。 它还允许你从数学上找出哪些自变量有影响。
简单线性回归 有别于a 多重线性回归 在统计学中,使用一个线性函数,简单的 线性回归分析 变量与一个独立变量之间的关联。 多重线性回归 是指用两个或更多的解释因素来确定变量。 使用非线性回归代替因变量被描述为非线性函数,因为数据关系不是线性的。 本文将集中讨论 多重线性回归 来证明你如何能够 在Excel中解释回归结果。
在Excel中做回归的步骤
为了回归的目的,我们将使用以下数据集进行分析。 这里的自变量将是 价格 栏目和 已售 列。 独立的 列将是 需求 列。
阶梯
- 我们需要去 数据 选项卡,并点击 数据分析 要做回归 .
- 会有一个新的窗口;选择因变量和自变量数据范围。
- 然后勾选 标签 箱子和 信心 箱子。
- 然后点击输出单元格范围框,选择输出单元格地址
- 接下来,在 剩余 来计算残差。
- 之后,勾选 剩余 绘图和 线型拟合图框
- 点击 认可 在这之后。
- 在点击 好的。 分析的主要输出参数将在指定的单元中。
- 然后你还会得到一些参数,如 重要性 中的值等。 方差分析 ( 差异分析 )表。
- 在这里。 df 表示与方差源有关的自由度。
- 党卫军 你的模型将更好地反映数据,如果 剩余 SS小于 共计SS。
- MS 是指方形。
- F 表示的是 F -对无效假设的检验。
- 显著性 F 表示的是 P -的价值 F .
- 然后你还会在一个表格中得到变量的系数、显著性值等。
- 然后你会在系数表下面得到一个最后的表格,其中包含每个条目的残值。
- 接下来,你将得到 需求 vs 价格 回归图,有一条趋势线。
- 在这之后,你会得到 需求 VS 已售 带有趋势线的回归图。
- 还有一张图表显示了每个条目的残差分布,从 已售 变量。
- 还有一张图表显示了每个条目的残差分布,从 价格 变量。
接下来,我们将告诉你如何在Excel中解释这些回归结果。
阅读更多。 如何在Excel中进行逻辑回归(快速步骤)?
如何在Excel中解释回归结果
做完回归分析后,你需要做的下一件事就是解释它们。 下面对结果进行描述和阐述。
多重R平方回归值分析
ǞǞǞ R-squared 数表示数据集的元素的关系有多密切,以及回归线与数据的匹配程度。 我们将使用多元线性回归分析,在这种分析中,我们要确定两个或多个变量对主要因素的影响。 这指的是当其中一个自变量变化时,因变量如何变化。 这个系数的范围是从-1到1,这里。
- 1表示有密切的积极关系
- 0意味着变量之间没有关系。 换句话说,数据点是随机的。
- -1表示变量之间的逆向或负向关系。
在上面显示的输出结果中,给定数据集的多重R值为o.7578( 近似值 ),这表明变量之间有很强的关系。
R平方
R平方 在我们的案例中,该值为0.574(约),可以解释为变量之间的关系相当好。
调整后的R平方
这仅仅是一个备用版本的 R平方 这只是将 预测者 变量,同时预测 回应 它的计算方法为
R^2 1-[(1-R^2)*(n-1)/(n-k-1)]
在这里。 R^2 : 报道 R^2 我们从数据集中得到的值。
n : 观察值的数量。
K :预测变量的数量。
这个值的意义是在对两组数据进行回归分析时产生的。 预测者 变量。 如果有一个以上的 预测者 调整后的R平方值是非常不理想的。 R平方 值调整了这种通货膨胀,并给出了变量的准确情况。
标准误差
另一个拟合度指标,表明你的回归分析的准确性;该值越低,你的回归分析就越有把握。
标准误差 是一个经验指标,代表各点偏离趋势线的平均距离。 相比之下。 R2 代表因变量变化的比例。 在这种情况下, 标准误差 是288.9( 近似值 ),这表示我们的数据点,平均来说,从趋势线下降了288.9。
观察到的情况
指明观察或条目的数量。
确定重要的变量
ǞǞǞ 显著值 表示我们的分析的可信度(统计学上的合理性)。 换句话说,它表示我们的数据集出错的概率。 这个值应该低于5%。 但在这种情况下,我们的显著性值是0.00117,转化为0.1%,远远低于5%。 所以我们的分析是可以的。 否则,我们可能要选择不同的变量进行分析。
回归分析中的P值
与一个重要的价值密切相关,即 P值 表示系数值错误的概率。 P值表示无效假设与变量的关联。
如果你的 P值 <the 重要性 这意味着变量之间存在着非零的相关性。
但如果 P值 > 重要性 这意味着变量之间不可能有关联性。
在这种情况下, P值 变量的 价格 =0.000948 <0.00117(显著值)。
因此,这里不存在无效假设,而且有足够的证据宣布变量之间存在关联性。
另一方面,对于变量 已售 ,(P值)0.0038515 <0.0011723(显著值)。
所以这里可能有一个无效假设,没有足够的证据来宣布变量之间的非零相关。
在大多数情况下,这个P值决定了一个变量是否会出现在数据集中。 例如,我们应该将 已售 变量,以保持数据集的稳健性。
回归方程
由于我们在Excel中确定了线性回归分析,趋势线也应该是线性的。 一般形式是:。
Y=mX+C。
在这里。 Y 是因变量。
而X是这里的自变量,意味着我们将确定变量X的变化对变量Y的影响。
C 将只是直线的Y轴交点的值。
在这种情况下,C的截距值等于9502.109853
而两个变量的m值为-809.265和0.424818。
因此,我们有了两个独立变量的最终方程式。
第一个是。
Y=-809.265771X+9502.12而第二个变量的方程是。
y=0.4248x+9502.12系数
我们得到的系数是 m1=-809.2655 和 m2=04248 .还有拦截器。 C= 9502.12 .
- 首先,拦截值表明,当价格为零时,需求将为9502。
- 和的值。 m 价格系数值为-809.265,表明每单位价格的增加将使需求量下降大约809个单位。
- 对于第二个变量 "销售",m值为0.424。这表示每单位销售项目的变化将导致产品的0424次单位增加。
残留物
ǞǞǞ 剩余 原始的和从回归线计算出来的条目之间的差额就是差额。 残留物 表示实际值离线有多远。 例如,第一个条目的回归分析的计算条目是9497。 而第一个原始值是9500。 所以残差大约是2.109。
T-Statistics值
T-静力学值是系数除以标准值的结果,该值越高,表明系数的可靠性越好。
这个值还有另一个意义,它需要的是 计算P值。
95%的置信区间
在这里,我们一开始就把变量的置信度设定为95。 不过,它可以改变。
- 这里,95%以下的系数值计算为8496.84,意味着95%以上的系数计算为10507.37。
- 这意味着,虽然我们的主要系数约为9502.1,但在95%的情况下,该值很可能低于8496,有5%的机会超过10507.37。
阅读更多。
需要记住的事情
✎ 回归分析法只评估被研究的变量之间的关系。 它不确定因果关系。 在其他方面,只考虑相关的方面。 当某些行为导致某些事情时,它就成为因果关系。 当一个变量的改变产生变化时,它可以被视为因果关系。
✎ 回归分析受到异常值的严重影响。 在分析前必须去除各种异常值。 要在Excel中分析和解释回归分析结果,你需要考虑以下几点。
总结
综上所述,"如何在Excel中解释回归结果 "的问题是通过精心分析和后来的解释来回答的。 分析是通过 数据分析 的工具。 数据 标签。
对于这个问题,有一本工作手册可以下载,你可以在这里练习回归分析并进行解释。
欢迎通过评论区提出任何问题或反馈。 任何关于改进的建议 优秀 社区将受到高度赞赏。