Inhaltsverzeichnis
Regressionsanalyse ist eine weit verbreitete statistische Berechnung. Wir führen diese Art von Berechnung oft nach unseren Wünschen durch. In Excel können wir Folgendes durchführen mehrere Arten der Regressionsanalyse In diesem Artikel zeigen wir Ihnen, wie man eine logistische Regression in Excel durchführt. Wenn Sie ebenfalls daran interessiert sind, diese Analyse zu erlernen, laden Sie die Übungsmappe herunter und folgen Sie uns.
Download Arbeitsbuch Praxis
Laden Sie dieses Übungsheft herunter, um zu üben, während Sie diesen Artikel lesen.
Logistische Regression.xlsx
Was ist logistische Regression?
Die logistische Regressionsanalyse ist ein statistischer Lernalgorithmus, mit dem der Wert einer abhängigen Variable auf der Grundlage einiger unabhängiger Kriterien vorhergesagt werden kann. Sie hilft einer Person, das Ergebnis aus einem großen Datensatz auf der Grundlage der gewünschten Kategorie zu erhalten. Die logistische Regressionsanalyse umfasst hauptsächlich drei Typen:
- Binäre logistische Regression
- Multinomiale logistische Regression
- Ordinale logistische Regression
Binäre logistische Regression: Im Modell der binären Regressionsanalyse wird eine Kategorie nur durch zwei Fälle definiert: Ja/Nein oder Positiv/Negativ.
Multinomiale logistische Regression: Die multinomiale logistische Analyse funktioniert mit drei oder mehr Klassifikationen. Wenn wir mehr als zwei klassifizierte Abschnitte haben, um unsere Daten zu kategorisieren, können wir dieses Regressionsanalysemodell verwenden.
Ordinale logistische Regression: Dieses Regressionsanalysemodell funktioniert für mehr als zwei Kategorien, allerdings benötigen wir bei diesem Modell eine vorgegebene Reihenfolge, um sie zu kategorisieren.
Schritt-für-Schritt-Verfahren zur Durchführung einer logistischen Regression in Excel
In diesem Artikel werden wir die binäre logistische Regressionsanalyse durchführen. Diese Art der Analyse liefert uns einen Vorhersagewert für die gewünschte Variable. Um die Analyse durchzuführen, betrachten wir einen Datensatz von 10 Maschinen aus einer Branche. Die Verfügbarkeit der Maschine kann positiv oder negativ sein. Die binären Ziffern 1=positiv und 0=negativ , und diese Werte sind in der Spalte B Das Alter dieser Maschinen ist in der Spalte C und die durchschnittliche Arbeitszeit pro Woche in der Spalte D Unser Datensatz liegt also im Bereich der Zellen B5:D14 Die Werte der anfänglichen Regressionslöservariablen liegen im Bereich der Zellen C16:D18 Das gesamte Analyseverfahren wird im Folgenden Schritt für Schritt erläutert:
Schritt 1: Eingabe Ihres Datensatzes
In diesem Schritt werden wir Ihren Datensatz importieren:
- Geben Sie zunächst Ihren Datensatz genau in Excel ein. Für unsere Analyse geben wir den Datensatz in den Bereich der Zellen B5:D14 .
- Geben Sie dann Ihre Solver Entscheidung Varibles' Wir geben sie in den Bereich der Zellen D16:D18.
- Wir nehmen für alle Variablen folgende Werte an 0.01 .
Lesen Sie mehr: Multiple lineare Regression auf Excel-Datensätzen (2 Methoden)
Schritt 2: Bewertung des Logit-Wertes
In diesem Schritt werden wir die Logit Wert für unseren Datensatz. Wir definieren den Logit Wert als X In unserer Berechnung wird die Formel von Logit Wert ist:
Hier, b0, b1, und b2 sind Regressionsvariablen.
- Schreiben Sie die folgende Formel in die Zelle E5 Verwenden Sie das Zeichen Absolute, um den Zellwert von Variablen einzufrieren. Wenn Sie nicht wissen, wie Sie die Absoluter Zellbezug können Sie es auf verschiedene Weise eingeben.
=$D$16+$D$17*C5+$D$18*D5
- Drücken Sie dann die Eingabe Taste auf Ihrer Tastatur.
- Und dann, Doppelklicken Sie auf über die Füllen Griff Symbol, um die Formel in die Zelle E14 .
- Sie erhalten alle Werte von X .
Lesen Sie mehr: Wie man eine einfache lineare Regression in Excel durchführt (4 einfache Methoden)
Schritt 3: Bestimmen Sie den Exponential- oder Logitwert für die einzelnen Daten
Hier werden wir den Exponentialwert des Logit-Wertes berechnen, dazu verwenden wir die EXP-Funktion :
- Zur Bestimmung des Exponentialwertes von X schreiben Sie die folgende Formel in die Zelle F5 :
=EXP(E5)
- Ähnlich, Doppelklicken Sie auf über die Füllen Griff um die Formel wie im vorherigen Schritt zu kopieren. Sie werden alle Exponentialwerte von X .
Schritt 4: Berechnung des Wahrscheinlichkeitswertes
P(X) ist der Wahrscheinlichkeitswert für das Auftreten der X Die Wahrscheinlichkeit des Ereignisses X definieren kann als:
- Um ihn zu berechnen, notieren Sie die folgende Formel in der Zelle G5 .
=F5/(1+F5)
- Drücken Sie die Eingabe Schlüssel.
- Ziehen Sie nun die Füllen Griff Symbol bis zu G15 um den Wert für alle Werte zu erhalten.
Lesen Sie mehr: Wie berechnet man den P-Wert bei einer linearen Regression in Excel (3 Möglichkeiten)?
Schritt 5: Auswertung der Summe der Log-Likelihood-Werte
In den folgenden Schritten werden wir den Wert von Log-Likelihood. Danach werden wir die Funktion SUMME um alle Daten hinzuzufügen:
- Zur Berechnung der Log-Likelihood Wert, werden wir die der LN Funktion in unserem Datensatz. In der Zelle H5 schreiben Sie die folgende Formel ab:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Drücken Sie nun die Eingabe Taste auf der Tastatur.
- Dann, Doppelklicken Sie auf über die Füllen Griff Symbol, um alle Log-Wahrscheinlichkeitswerte zu ermitteln.
- Danach, in Zelle H15 schreiben Sie die folgende Formel auf, um alle Werte zu summieren.
=SUMME(H5:H14)
🔍 Aufschlüsselung der Formel
Wir machen diese Aufschlüsselung für die Zelle H5 .
👉
LN(G5): Diese Funktion gibt zurück -0.384.
👉
LN(1-G5): Diese Funktion gibt zurück -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Diese Funktion gibt zurück -0.384.
Schritt 6: Verwenden Sie das Solver-Analysetool für die endgültige Analyse
Nun führen wir die abschließende Regressionsanalyse durch, die wir mit Hilfe des Löser Wenn Sie den Befehl nicht in der Daten müssen Sie die Option Löser von der Excel-Zusatzmodule .
- Um sie zu aktivieren, wählen Sie Datei> Optionen .
- Infolgedessen wird ein Dialogfeld mit der Bezeichnung Excel-Optionen erscheinen wird.
- Wählen Sie in diesem Dialogfeld die Option Add-ins Option.
- Wählen Sie nun die Excel-Zusatzmodule Option in der Verwalten Sie Abschnitt und klicken Sie auf Weiter .
- Ein kleines Dialogfeld mit dem Titel Add-ins erscheinen wird.
- Prüfen Sie dann die Solver Add-in Option und klicken Sie auf OK .
- Danach gehen Sie auf die Seite Daten und Sie finden die Registerkarte Löser Befehl in der Analyse Gruppe.
- Klicken Sie nun auf die Schaltfläche Löser Befehl.
- Ein neues Dialogfenster mit dem Titel Löser-Parameter erscheinen wird.
- In der Zielsetzung wählen Sie die Zelle $H$15 mit der Maus. Sie können die Zellreferenz auch mit der Tastatur eingeben. Achten Sie darauf, dass Sie die Absoluter Zellbezug hier unterschreiben.
- Als nächstes wird in der Durch Ändern der variablen Zellen wählen Sie den Zellbereich aus $D$16:$D$18 .
- Deaktivieren Sie dann das Kontrollkästchen Unbeschränkte Variablen nicht-negativ machen um die negativen Werte zu erhalten, wenn sie bereits als angekreuzt angezeigt werden.
- Klicken Sie schließlich auf die Schaltfläche Lösen Sie Taste.
- Infolgedessen ist die Solver Ergebnis wird vor Ihnen erscheinen.
- Wählen Sie nun die Keep Solver Lösung Dieses Feld zeigt Ihnen auch an, ob Ihre Regressionsanalyse konvergiert oder divergiert.
- Klicken Sie auf OK um das Feld zu schließen.
- Schließlich sehen Sie die Werte der Variablen im Bereich der Zellen D16:D18 Außerdem sehen Sie auch die Werte der Spalten E, F, G und H weisen ebenfalls Unterschiede zu den vorherigen Schritten auf.
🔍 Illustration des Ergebnisses der binären Regressionsanalyse
Nach Abschluss der binären logistischen Regressionsanalyse in Excel werden Sie sehen, dass unser angenommener Wert der Regressionsvariablen durch den neuen Analysewert ersetzt wird und diese Werte die korrekten Werte der Regressionsvariablen unseres Datensatzes sind. Wir können das Ergebnis für alle spezifischen Daten betrachten, wie z. B. die Maschine mit einem Alter von 68 Monate und 4 Durchschnittlich keine Schicht pro Woche. Der Wert von P(X) ist 0.67 Es zeigt uns, dass, wenn wir die Maschine in funktionierendem Zustand suchen, die Wahrscheinlichkeit eines solchen Ereignisses etwa 67% .
Wir können sie auch separat darstellen, indem wir die Endwerte der Regressionsvariablen verwenden.
Wir können also sagen, dass unser Arbeitsverfahren erfolgreich war und wir in der Lage sind, eine binäre logistische Regressionsanalyse durchzuführen.
Schlussfolgerung
Das ist das Ende dieses Artikels. Ich hoffe, dass dieser Artikel für Sie hilfreich ist und Sie in der Lage sind, eine logistische Regression in Excel durchzuführen. Bitte teilen Sie uns weitere Fragen oder Empfehlungen in den Kommentaren unten mit.
Vergessen Sie nicht, unsere Website zu besuchen ExcelWIKI für verschiedene Excel-Probleme und -Lösungen. Lernen Sie weiterhin neue Methoden und entwickeln Sie sich weiter!