Táboa de contidos
A análise de regresión está en case todos os tipos de software estatístico como SPSS , R, e sen esquecer Excel. A regresión pode darnos unha visión xeral das relacións entre variables. A regresión lineal pódese facer moi rapidamente en Excel usando a ferramenta Análise de datos . Este artigo mostrará como podes interpretar os resultados da regresión en Excel.
Descargar o libro de prácticas
Descarga este libro de prácticas a continuación.
Interpretar os resultados da regresión.xlsx
Que é a regresión?
A análise de regresión úsase a miúdo na análise de datos para determinar as asociacións entre varias variables. A análise de regresión permítelle escoller que ocorre coa variable dependente se unha das variables independentes se altera. Tamén permíteche descubrir matematicamente cales son as variables independentes que inflúen.
A regresión lineal simple é distinta dunha regresión lineal múltiple en estatística. Usando unha función lineal, a regresión lineal simple analiza a asociación entre as variables e unha variable independente. Regresión lineal múltiple é cando se utilizan dous ou máis factores explicativos para determinar as variables. Usar a regresión non lineal en lugar da variable dependente descríbese como unha función non lineal xa que as relacións de datos non son lineais. Este artigo centrarase en múltiples lineaisregresión para demostrar como pode interpretar os resultados da regresión en Excel.
Pasos para facer a regresión en Excel
Para efectos de regresión, utilizaremos o seguinte conxunto de datos para fins de análise. Aquí a variable independente será a columna Prezo e a columna Vendido . A columna independente será a columna Demanda .
Pasos
- Temos que ir á pestana Datos e facer clic en Análise de datos para facer regresión .
- Haberá unha nova xanela; seleccione a variable dependente e o intervalo de datos da variable independente.
- A continuación, marque a caixa Etiquetas e a caixa Confianza .
- A continuación, faga clic no intervalo de celas de saída. para seleccionar o enderezo da cela de saída
- A continuación, marque o Residual para calcular os residuos.
- Despois diso, marque os gráficos Residual e Caixas de axuste de liñas
- Fai clic en Aceptar despois disto.
- Despois de facer clic OK, os parámetros de saída primarios da análise estarán nas celas especificadas.
- Entón tamén obterás algúns parámetros como Significancia valor, etc. na táboa ANOVA ( Análise da varianza ).
- Aquí, df denota o grao de liberdade relacionado coa fonte da varianza.
- SS denota a suma de cadrados. O teu modelo reflectirá mellor os datos se Residual SS é menor que o SS total.
- MS significa cadrado.
- F denota o F -test para a hipótese nula.
- Significación F denota o P -valor de F .
- Entón tamén obterá nunha táboa os coeficientes da variable, o valor de significación, etc.
- A continuación, obterás unha táboa final debaixo da táboa de coeficientes que contén o valor residual de cada entrada.
- A continuación, obterá o gráfico de regresión Demanda vs Prezo , cunha liña de tendencia.
- Despois isto, obtén o gráfico de regresión Demanda vs Vendido cunha liña de tendencia.
- Hai outro gráfico que mostra a distribución dos residuos de cada entrada da variable Vendido .
- Hai outro gráfico que mostra a distribución dos residuos. de cada entrada da variable Prezo .
A continuación, mostrarémosche como podes n interprete estes resultados de regresión en Excel.
Ler máis: Como facer regresión loxística en Excel (con pasos rápidos)
Como interpretar Resultados da regresión en Excel
O seguinte que debes facer despois de facer a análise de regresión e interpretalos. Os resultados descríbense e elabóranse a continuación.
Análise de valores de regresión múltiple R-cuadrado
OO número R-cadrado indica a estreita relación entre os elementos do conxunto de datos e o ben que a liña de regresión coincide cos datos. Imos utilizar a análise de regresión lineal múltiple, na que imos determinar o impacto de dúas ou máis variables sobre o factor principal. Isto refírese a como cambia a variable dependente a medida que cambia unha das variables independentes. O rango deste coeficiente é de -1 a 1. Aquí,
- 1 significa unha relación positiva estreita
- 0 significa que non hai relacións entre as variables. Noutras palabras, os puntos de datos son aleatorios.
- -1 significa relación inversa ou negativa entre as variables.
Nos resultados de saída mostrados anteriormente, o valor R múltiple do dado conxuntos de datos é o,7578( aprox ), o que indica relacións fortes entre as variables.
R cadrado
R cadrado valor explica como varía a resposta das variables dependentes á variable independente. No noso caso, o valor é 0,574 (aprox.), o que se pode interpretar como unha relación razoablemente correcta entre as variables.
R-cuadrado axustado
Isto é só unha versión alternativa do valor R cadrado . Isto simplemente baralla as variables predictoras mentres pronostica a variable resposta . Calcúlase como
R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]
Aquí, R^2 : o valor R^2 do que obtivemoso conxunto de datos.
n : o número de observacións.
K : o número de variables predictoras.
A significación deste valor xorde ao facer unha análise de regresión entre dúas variables preditoras . Se hai máis dunha variable predictora no conxunto de datos, o valor de R cadrado inflárase, o que é moi indesexable. O valor axustado de R cadrado axusta esta inflación e dá unha imaxe precisa das variables.
Erro estándar
Outra métrica de bondade de axuste que indica a precisión da súa análise de regresión; canto menor sexa o valor, máis seguro estará na súa análise de regresión.
Erro estándar é unha métrica empírica que representa a distancia media á que se desvían os puntos da liña de tendencia. Pola contra, R2 representa a proporción da variación da variable dependente. Neste caso, o valor de Erro estándar é 288,9 ( aprox ), o que indica que os nosos puntos de datos, de media, baixan 288,9 desde a liña de tendencia.
Observacións
Indique o número de observacións ou entradas.
Determine a variable significativa
O Valor de significación indica a fiabilidade (estatisticamente sólida) da nosa análise. Noutras palabras, indica a probabilidade de que o noso conxunto de datos sexa incorrecto. Este valor debe ser inferior ao 5%. Pero neste caso, o noso valor de significación é 0,00117,o que se traduce nun 0,1%, que está moi por debaixo do 5%. Entón, a nosa análise está ben. En caso contrario, poderemos ter que escoller diferentes variables para a nosa análise.
Valor P na análise de regresión
Intimamente ligado a un valor significativo, o P- valor indica a probabilidade de que o valor do coeficiente sexa incorrecto. O valor p indica a asociación da hipótese nula coas variables.
Se o teu valor p < o número Significación , hai probas suficientes para rexeitar a hipótese do valor nulo. Isto significa que hai unha correlación distinta de cero entre as variables.
Pero se o valor p > Valor de significación , non haberá evidencia suficiente para descartar o hipótese nula. Iso indica que non podería haber correlación entre as variables.
Nel caso, o valor P da variable Prezo =0,000948 < 0,00117 (valor de significación),
Polo que non hai hipótese nula aquí, e hai evidencia suficiente para declarar unha correlación entre variables.
Por outra banda, para a variable Vendido , o (valor P) 0,0038515 < 0,0011723 (Valor de significación)
Polo que aquí podería haber unha hipótese nula e non hai evidencia suficiente para declarar unha correlación distinta de cero entre as variables.
Na maioría dos casos, esta P -value determina se unha variable estará ou non no conxunto de datos. Por exemplo, deberíamos eliminar o Vendido variable para preservar a robustez do conxunto de datos.
Ecuación de regresión
Como determinamos a análise de regresión lineal en Excel, a liña de tendencia tamén debería ser lineal. A forma xeral é:
Y=mX+C.
Aquí, Y é a variable dependente.
E X é a variable independente aquí, o que significa que determinaremos o efecto do cambio da variable x na variable Y.
C será só o valor da intersección do eixe Y do liña.
Neste caso, o valor da intersección C é igual a 9502,109853
E o valor de m para as dúas variables é -809,265 e 0,424818.
Entón, temos a ecuación final para as dúas variables separadas.
A primeira é:
Y=-809,265771X+9502,12E a ecuación para a segunda variable é:
Y=0,4248X+9502,12Coeficientes
Os coeficientes que obtivemos son m1=-809,2655 e m2=04248 . E interceptor, C= 9502,12 .
- En primeiro lugar, o valor do interceptor indica que a demanda será 9502 cando o prezo sexa cero.
- E os valores de m indican a taxa á que cambia a demanda por unidade de cambio de prezo. O valor do coeficiente de prezo é -809,265, o que indica que un aumento por unidade do prezo fará baixar a demanda en aproximadamente 809 unidades.
- Para a segunda variable, Vendido, o valor m é 0,424. Isto indica que o cambio por unidade de artigo vendidoproducirá un aumento de 0424 unidades de tempo do produto.
Residuos
A diferenza residual entre o orixinal e o calculado entrada desde a recta de regresión é a diferenza. Os residuos indican a que distancia está o valor real da liña. Por exemplo, a entrada calculada a partir da análise de regresión para a primeira entrada é 9497. E o primeiro valor orixinal é 9500. Polo tanto, o residual é de aproximadamente 2,109.
Valor T-Statistics
O valor T-estático é a división do coeficiente polo valor estándar. Canto maior sexa o valor, mellor indica a fiabilidade do coeficiente.
Hai outro significado deste valor, que é necesario para calcular o valor P.
O intervalo de confianza do 95 %
Aquí a confianza da variable que establecemos como 95 ao principio. Non obstante, pode cambiar.
- Aquí, o valor do coeficiente do 95 % inferior calcúlase como 8496,84 significa que o 95 % superior calcúlase como 10507,37,
- Isto significa que mentres o coeficiente principal é de aproximadamente 9502,1. Hai unha alta probabilidade de que o valor estea por debaixo de 8496 no 95% dos casos e un 5% de probabilidade de que sexa superior a 10507,37
Ler máis:
Cousas para recordar
✎ O método de análise de regresión só avalía a relación entre as variables que se examinan. Non establece a causalidade. Noutro xeito, só o aspectode correlación considera. Cando algún acto causa algo, convértese en causalidade. Cando unha alteración dunha variable crea cambios, pódese considerar causal.
✎ A análise de regresión dificulta moito os valores atípicos. Todo tipo de valores atípicos deben eliminarse antes de realizar a análise. Para analizar e interpretar os resultados da análise de regresión en Excel, cómpre ter en conta estes puntos.
Conclusión
Para resumir, a pregunta "como interpretar os resultados da regresión en Excel" responde de forma elaborada. analizándoo e interpretándoo posteriormente. A análise realízase mediante a ferramenta Análise de datos na pestana Datos .
Para este problema, hai dispoñible para descargar un libro de traballo onde podes practicar a análise de regresión e interpretar iso.
Non dubides en facer calquera pregunta ou comentario a través da sección de comentarios. Calquera suxestión para mellorar a comunidade Exceldemy será moi apreciable.