Cómo hacer regresión logística en Excel (con pasos rápidos)

  • Compartir Este
Hugh West

Análisis de regresión es un cálculo estadístico muy utilizado. A menudo realizamos este tipo de cálculos según nuestro deseo. En Excel, podemos realizar múltiples tipos de análisis de regresión En este artículo mostraremos cómo realizar una regresión logística en Excel. Si tú también estás interesado en aprender este análisis, descárgate el libro de prácticas y síguenos.

Descargar el cuaderno de prácticas

Descárgate este cuaderno de ejercicios para practicar mientras lees este artículo.

Regresión Logística.xlsx

¿Qué es la regresión logística?

El análisis de regresión logística es un algoritmo de aprendizaje estadístico que se utiliza para predecir el valor de una variable dependiente en función de algunos criterios independientes. Ayuda a una persona a obtener el resultado de un gran conjunto de datos en función de su categoría deseada. El análisis de regresión logística es principalmente de tres tipos:

  1. Regresión logística binaria
  2. Regresión logística multinomial
  3. Regresión logística ordinal

Regresión logística binaria: En el modelo de análisis de regresión binaria, definimos una categoría mediante sólo dos casos: Sí/No o Positivo/Negativo.

Regresión logística multinomial: El análisis logístico multinominal funciona con tres o más clasificaciones. Si tenemos más de dos secciones clasificadas para categorizar nuestros datos, entonces podemos utilizar este modelo de análisis de regresión.

Regresión logística ordinal: Este modelo de análisis de regresión funciona para más de dos categorías. Sin embargo, en este modelo necesitamos un orden predeterminado para categorizarlas.

Procedimiento Paso a Paso para Hacer Regresión Logística en Excel

En este artículo, realizaremos el análisis de regresión logística binaria. Este tipo de análisis nos proporciona un valor de predicción de la variable deseada. Para realizar el análisis, consideramos un conjunto de datos de 10 máquinas de una industria. La disponibilidad de la máquina puede ser positiva o negativa. Los dígitos binarios 1=positivo y 0=negativo y estos valores se muestran en la columna B La edad de esas máquinas está en la columna C y la media de horas de trabajo semanales se indica en la columna D Por lo tanto, nuestro conjunto de datos está en el rango de celdas B5:D14 Los valores de la variable inicial del solucionador de regresión están en el rango de celdas C16:D18 A continuación se explica paso a paso todo el procedimiento de análisis:

Paso 1: Introducir el conjunto de datos

En este paso, vamos a importar su conjunto de datos:

  • En primer lugar, introduzca el conjunto de datos con precisión en Excel. Para nuestro análisis, introducimos el conjunto de datos en el rango de celdas B5:D14 .

  • A continuación, introduzca su Solver Decisión Varibles' Los introducimos en el rango de celdas D16:D18.
  • Suponemos que todos los valores de las variables son 0.01 .

Más información: Regresión lineal múltiple en conjuntos de datos de Excel (2 métodos)

Paso 2: Evaluar el valor Logit

En este paso, vamos a calcular el Logit para nuestro conjunto de datos. Definimos el valor Logit como X en nuestro cálculo. La fórmula de Logit valor es:

Toma, b0, b1, y b2 son variables de regresión.

  • Escriba la siguiente fórmula en la celda E5 Utilice el signo Absoluto para congelar el valor de celda de las variables. Si no sabe cómo introducir el signo Referencia absoluta de celda puede introducirlo de varias maneras.

=$D$16+$D$17*C5+$D$18*D5

  • A continuación, pulse la tecla Entre en del teclado.

  • Después de eso, haga doble clic en en el Asa de llenado para copiar la fórmula hasta la celda E14 .

  • Obtendrá todos los valores de X .

Más información: Cómo realizar una regresión lineal simple en Excel (4 métodos sencillos)

Paso 3: Determinar el exponencial de Logit para cada dato

Aquí, vamos a calcular el valor exponencial del valor logit, Para ello, vamos a utilizar la función EXP :

  • Para determinar el valor exponencial de X escriba la siguiente fórmula en la celda F5 :

=EXP(E5)

  • Del mismo modo, haga doble clic en en el Asa de llenado para copiar la fórmula como en el paso anterior. Obtendrá todos los valores exponenciales de X .

Paso 4: Calcular el valor de probabilidad

P(X) es el valor de la probabilidad de que se produzca el X La probabilidad del suceso X puede definir como:

  • Para calcularlo, escriba la siguiente fórmula en la celda G5 .

=F5/(1+F5)

  • Pulse el botón Entre en llave.
  • Ahora, arrastre el Asa de llenado icono hasta G15 para obtener el valor de todos los valores.

Más información: Cómo Calcular el Valor P en Regresión Lineal en Excel (3 Maneras)

Paso 5: Evaluar la suma del valor de la log-verosimilitud

En los siguientes pasos, vamos a evaluar el valor de Log-Likelihood. Después utilizaremos la función SUMA para añadir todos los datos:

  • Para calcular el Log-Likelihood vamos a utilizar el LN función en nuestro conjunto de datos. En la celda H5 escribe la siguiente fórmula:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Ahora, pulse el botón Entre en del teclado.

  • Entonces, haga doble clic en en el Asa de llenado para determinar todos los valores de log-verosimilitud.

  • Después, en la celda H15 escribe la siguiente fórmula para sumar todos los valores.

=SUMA(H5:H14)

🔍 Desglose de la fórmula

Estamos haciendo este desglose para la célula H5 .

👉 LN(G5): Esta función devuelve -0.384.

👉 LN(1-G5): Esta función devuelve -1.144.

👉 (B5*LN(G5))+((1-B5)*LN(1-G5)): Esta función devuelve -0.384.

Paso 6: Utilizar la herramienta de análisis Solver para el análisis final

Ahora, realizaremos el análisis de regresión final. Realizaremos el análisis a través de la herramienta Solucionador Si no lo ve en el comando Datos tiene que activar la opción Solucionador del Complementos de Excel .

  • Para activarlo, seleccione Archivo> Opciones .

  • Como resultado, aparece un cuadro de diálogo llamado Opciones de Excel aparecerá.
  • En este cuadro de diálogo, seleccione la opción Complementos opción.
  • Ahora, elija el Complementos de Excel en el Gestione y haga clic en Vaya a .

  • Aparece un pequeño cuadro de diálogo titulado Complementos aparecerá.
  • A continuación, compruebe el Complemento Solver y haga clic en OK .

  • A continuación, vaya a la página Datos y encontrará la pestaña Solucionador en el Análisis grupo.

  • Ahora, haga clic en el botón Solucionador mando.
  • Un nuevo cuadro de diálogo titulado Parámetros del solucionador aparecerá.
  • En el Objetivo fijado seleccione la celda $H$15 con el ratón. También puede escribir la referencia de la celda con el teclado. Asegúrese de utilizar la tecla Referencia absoluta de celda firme aquí.
  • A continuación, en el Cambiando las celdas variables seleccione el rango de celdas $D$16:$D$18 .
  • A continuación, desmarque la casilla Hacer no negativas las variables sin restricciones para obtener los valores negativos si ya aparece como marcado.
  • Por último, haga clic en el botón Resuelva botón.

  • Como resultado, el Solver Resultado aparecerá delante de ti.
  • Ahora, elija el Solución Keep Solver Este cuadro también le mostrará si su análisis de regresión convergió o divergió.
  • Haga clic en OK para cerrar la caja.

  • Por fin, verá los valores de la variable en el rango de celdas D16:D18 Además, también verá los valores de las columnas E, F, G y H también muestran diferencias respecto a los pasos anteriores.

🔍 Ilustración del resultado del análisis de regresión binaria

Después de completar el análisis de regresión logística binaria en Excel, verá que el valor de nuestra variable de regresión supuesta se sustituye por el nuevo valor de análisis y estos valores son el valor correcto de la variable de regresión de nuestro conjunto de datos. Podemos considerar el resultado de cualquier dato específico, como la máquina que tiene una edad de 68 meses y 4 El valor de P(X) es 0.67 Nos ilustra que si buscamos la máquina en estado de funcionamiento la posibilidad de que ocurra es de aproximadamente 67% .

También podemos mostrarlo por separado, utilizando los valores finales de la variable de regresión.

Por lo tanto, podemos decir que nuestro procedimiento de trabajo ha funcionado correctamente y podemos realizar el análisis de regresión logística binaria.

Conclusión

Este es el final de este artículo. Espero que este artículo te sea útil y puedas hacer regresión logística en Excel. Por favor, comparte con nosotros cualquier otra duda o recomendación en la sección de comentarios más abajo.

No olvide consultar nuestro sitio web ExcelWIKI para varios problemas y soluciones relacionados con Excel. ¡Sigue aprendiendo nuevos métodos y sigue creciendo!

Hugh West es un capacitador y analista de Excel altamente experimentado con más de 10 años de experiencia en la industria. Tiene una Licenciatura en Contabilidad y Finanzas y una Maestría en Administración de Empresas. Hugh tiene una pasión por la enseñanza y ha desarrollado un enfoque de enseñanza único que es fácil de seguir y comprender. Su conocimiento experto de Excel ha ayudado a miles de estudiantes y profesionales en todo el mundo a mejorar sus habilidades y sobresalir en sus carreras. A través de su blog, Hugh comparte su conocimiento con el mundo, ofreciendo tutoriales gratuitos de Excel y capacitación en línea para ayudar a las personas y empresas a alcanzar su máximo potencial.