Logistische regressie in Excel (met snelle stappen)

  • Deel Dit
Hugh West

Regressieanalyse is een veel gebruikte statistische berekening. We doen dit soort berekeningen vaak naar wens. In Excel kunnen we meerdere soorten regressieanalyse In dit artikel laten we zien hoe je logistische regressie uitvoert in Excel. Als je ook geïnteresseerd bent om deze analyse te leren, download dan de oefenwerkmap en volg ons.

Download Praktijk Werkboek

Download dit oefenwerkboek om te oefenen terwijl u dit artikel leest.

Logistische regressie.xlsx

Wat is logistische regressie?

Logistische regressieanalyse is een statistisch leeralgoritme dat gebruikt wordt om de waarde van een afhankelijke variabele te voorspellen op basis van enkele onafhankelijke criteria. Het helpt een persoon om het resultaat van een grote dataset te krijgen op basis van zijn gewenste categorie. Logistische regressieanalyse voornamelijk drie types:

  1. Binaire logistische regressie
  2. Multinomiale logistische regressie
  3. Ordinale logistische regressie

Binaire Logistische Regressie: In het binaire regressiemodel definiëren wij een categorie met slechts twee gevallen: Ja/Nee of Positief/Negatief.

Multinomiale Logistische Regressie: Multinominale logistische analyse werkt met drie of meer classificaties. Als we meer dan twee geclassificeerde secties hebben om onze gegevens te categoriseren, dan kunnen we dit regressiemodel gebruiken.

Ordinale Logistische Regressie: Dit regressiemodel werkt voor meer dan twee categorieën. In dit model hebben we echter een vooraf bepaalde volgorde nodig om ze in te delen.

Stap-voor-stap procedure voor logistische regressie in Excel

In dit artikel zullen we de binaire logistische regressieanalyse uitvoeren. Dit type analyse geeft ons een voorspellingswaarde van de gewenste variabele. Om de analyse uit te voeren, beschouwen we een dataset van 10 machines uit een industrie. De beschikbaarheid van de machine kan positief of negatief zijn. De binaire cijfers 1=positief en 0=negatief en deze waarden staan in kolom B De leeftijd van deze machines is in kolom C en het gemiddelde aantal diensturen van hen per week staat in kolom D Dus, onze dataset is in het bereik van cellen B5:D14 De initiële waarden van de regressieoplosser liggen in het bereik van de cellen C16:D18 De hele analyseprocedure wordt hieronder stap voor stap uitgelegd:

Stap 1: Voer uw dataset in

In deze stap gaan we uw dataset importeren:

  • Allereerst voert u uw dataset nauwkeurig in Excel in. Voor onze analyse voeren wij de dataset in in het cellenbereik B5:D14 .

  • Voer dan uw Oplosser Besluit Varibles' We voeren ze in in het cellenbereik D16:D18.
  • Wij nemen alle waarden van de variabelen aan als 0.01 .

Lees meer: Meervoudige lineaire regressie op Excel-gegevensreeksen (2 methoden)

Stap 2: Evaluatie van de logitwaarde

In deze stap gaan we de Logit waarde voor onze dataset. We definiëren de Logit waarde als X in onze berekening. De formule van Logit waarde is:

Hier, b0, b1, en b2 zijn regressievariabelen.

  • Schrijf de volgende formule op in cel E5 Gebruik het Absolute-teken om de celwaarde van variabelen te bevriezen. Als je niet weet hoe je de Absolute celverwijzing teken, kunt u op verschillende manieren invoeren.

=$D$16+$D$17*C5+$D$18*D5

  • Druk vervolgens op de Ga naar toets op uw toetsenbord.

  • Daarna, dubbelklik op op de Vulgreep om de formule te kopiëren naar cel E14 .

  • U krijgt alle waarden van X .

Lees meer: Eenvoudige lineaire regressie in Excel (4 eenvoudige methoden)

Stap 3: Bepaal het exponentieel van de logit voor elk gegeven

Hier berekenen we de exponentiële waarde van de logitwaarde, daarvoor gebruiken we de EXP-functie :

  • Om de exponentiële waarde van X schrijf de volgende formule op in cel F5 :

=EXP(E5)

  • Insgelijks, dubbelklik op op de Vulgreep pictogram om de formule te kopiëren zoals bij de vorige stap. U zult alle exponentiële waarden van X .

Stap 4: Bereken de waarschijnlijkheidswaarde

P(X) is de waarschijnlijkheidswaarde voor het optreden van de X gebeurtenis. De waarschijnlijkheid van de gebeurtenis X kan definiëren als:

  • Om het te berekenen, schrijft u de volgende formule op in cel G5 .

=F5/(1+F5)

  • Druk op de Ga naar sleutel.
  • Sleep nu de Vulgreep pictogram tot G15 om de waarde voor alle waarden te krijgen.

Lees meer: Hoe P-waarde berekenen in lineaire regressie in Excel (3 manieren)

Stap 5: Evalueer de som van de log-likelihood-waarde

In de volgende stappen gaan we de waarde van Log-Likelihood. Daarna gebruiken we de SUM-functie om alle gegevens toe te voegen:

  • Om de Log-Likelihood waarde, gaan we de LN functie in onze dataset. In cel H5 schrijf de volgende formule op:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Druk nu op de Ga naar toets op het toetsenbord.

  • Dan, dubbelklik op op de Vulgreep om alle log-likelihood-waarden te bepalen.

  • Daarna, in cel H15 Schrijf de volgende formule op om alle waarden op te tellen.

=SUM(H5:H14)

🔍 Uitsplitsing van de formule

We doen deze uitsplitsing voor cel H5 .

👉 LN(G5): Deze functie retourneert -0.384.

👉 LN(1-G5): Deze functie retourneert -1.144.

👉 (B5*LN(G5))+((1-B5)*LN(1-G5)): Deze functie retourneert -0.384.

Stap 6: Gebruik het analysehulpmiddel Solver voor de uiteindelijke analyse

Nu zullen we de uiteindelijke regressieanalyse uitvoeren. We zullen de analyse uitvoeren via de Oplosser commando. Als je het niet ziet in de Gegevens tabblad, moet u de Oplosser van de Excel-add-ins .

  • Om het in te schakelen, selecteert u Bestand> Opties .

  • Het resultaat is een dialoogvenster met de naam Excel-opties zal verschijnen.
  • Selecteer in dit dialoogvenster de Toevoegingen optie.
  • Kies nu de Excel-add-ins optie in de Beheer sectie en klik op Ga naar .

  • Een klein dialoogvenster met de titel Toevoegingen zal verschijnen.
  • Controleer vervolgens de Oplosser-invoegtoepassing optie en klik op OK .

  • Ga daarna naar de Gegevens tabblad, en u vindt de Oplosser commando in de Analyse groep.

  • Klik nu op de Oplosser commando.
  • Een nieuw dialoogvenster getiteld Solverparameters zal verschijnen.
  • In de Doelstelling bepalen vak, kies de cel $H$15 U kunt de celverwijzing ook op uw toetsenbord schrijven. Zorg ervoor dat u de Absolute celverwijzing teken hier.
  • Vervolgens, in de Door variabele cellen te veranderen optie selecteer het cellenbereik $D$16:$D$18 .
  • Haal dan het vinkje weg bij Niet-beperkte variabelen niet-negatief maken om de negatieve waarden te krijgen als het al gecontroleerd is.
  • Klik ten slotte op de Oplossen knop.

  • Als gevolg daarvan zijn de Oplosser Resultaat box zal voor je verschijnen.
  • Kies nu de Oplossing houden In dit kader kunt u ook zien of uw regressieanalyse convergeerde of divergeerde.
  • Klik op OK om de doos te sluiten.

  • Uiteindelijk ziet u de waarden van de variabele in het cellenbereik D16:D18 is veranderd. Daarnaast ziet u ook de waarden van de kolommen E, F, G en H verschillen ook van de vorige stappen.

Illustratie van het resultaat van de binaire regressieanalyse

Na het voltooien van de binaire logistische regressieanalyse in Excel, zult u zien dat onze aangenomen regressievariabele waarde is vervangen door de nieuwe analysewaarde en deze waarden zijn de correcte regressievariabele waarde van onze dataset. We kunnen het resultaat van elk specifiek gegeven beschouwen, zoals de machine die een leeftijd heeft van 68 maanden en 4 gemiddeld geen dienst per week. De waarde van P(X) is 0.67 Het illustreert ons dat als we zoeken naar de machine in werkende staat de mogelijkheid van die gebeurtenis ongeveer 67% .

We kunnen het ook afzonderlijk laten zien, met de eindwaarden van de regressievariabele.

Wij kunnen dus zeggen dat onze werkwijze succesvol was en dat wij een binaire logistische regressieanalyse kunnen uitvoeren.

Conclusie

Dat is het einde van dit artikel. Ik hoop dat dit artikel nuttig voor u is en dat u logistische regressie kunt uitvoeren in Excel. Deel eventuele verdere vragen of aanbevelingen met ons in het commentaarveld hieronder.

Vergeet niet onze website te bekijken ExcelWIKI voor verschillende Excel-gerelateerde problemen en oplossingen. Blijf nieuwe methoden leren en blijf groeien!

Hugh West is een zeer ervaren Excel-trainer en -analist met meer dan 10 jaar ervaring in de branche. Hij heeft een bachelor in Accounting en Finance en een master in Business Administration. Hugh heeft een passie voor lesgeven en heeft een unieke lesaanpak ontwikkeld die gemakkelijk te volgen en te begrijpen is. Zijn deskundige kennis van Excel heeft duizenden studenten en professionals over de hele wereld geholpen hun vaardigheden te verbeteren en uit te blinken in hun carrière. Via zijn blog deelt Hugh zijn kennis met de wereld en biedt hij gratis Excel-tutorials en online trainingen aan om individuen en bedrijven te helpen hun volledige potentieel te bereiken.