Innehållsförteckning
Regressionsanalys är en allmänt använd statistisk beräkning. Vi gör ofta den här typen av beräkningar enligt våra önskemål. I Excel kan vi göra följande flera typer av regressionsanalyser I den här artikeln visar vi hur man gör logistisk regression i Excel. Om du också är intresserad av att lära dig den här analysen kan du ladda ner arbetsboken och följa oss.
Ladda ner övningsboken
Ladda ner den här arbetsboken för att träna medan du läser den här artikeln.
Logistisk regression.xlsx
Vad är logistisk regression?
Logistisk regressionsanalys är en statistisk inlärningsalgoritm som används för att förutsäga värdet av en beroende variabel baserat på vissa oberoende kriterier. Den hjälper en person att få fram ett resultat från en stor datamängd baserat på den önskade kategorin. Logistisk regressionsanalys består huvudsakligen av tre typer:
- Binär logistisk regression
- Multinomial logistisk regression
- Ordinal logistisk regression
Binär logistisk regression: I modellen för binär regressionsanalys definierar vi en kategori genom endast två fall: Ja/Nej eller Positiv/Negativ.
Multinomial logistisk regression: Multinominal logistisk analys fungerar med tre eller fler klassificeringar. Om vi har mer än två klassificerade avsnitt för att kategorisera våra data kan vi använda denna regressionsanalysmodell.
Ordinal logistisk regression: Denna regressionsanalysmodell fungerar för fler än två kategorier, men i denna modell behöver vi en förutbestämd ordning för att kategorisera dem.
Steg-för-steg-förfarande för logistisk regression i Excel
I den här artikeln kommer vi att utföra en binär logistisk regressionsanalys. Denna typ av analys ger oss ett förutsägelsevärde för den önskade variabeln. För att utföra analysen betraktar vi ett dataset med 10 maskiner från en industri. Maskinens tillgänglighet kan vara positiv eller negativ. De binära siffrorna 1=positiv , och 0=negativ , och dessa värden visas i kolumnen B Åldern på dessa maskiner är i kolumn C och deras genomsnittliga arbetstid per vecka anges i kolumnen D Vårt dataset är alltså i intervallet celler. B5:D14 Värdena för den initiala variabeln för regressionslösare ligger inom intervallet celler. C16:D18 Hela analysförfarandet förklaras steg för steg nedan:
Steg 1: Ange din datamängd
I det här steget ska vi importera ditt dataset:
- Först och främst ska du ange ditt dataset korrekt i Excel. För vår analys anger vi datasetetet i cellintervallet B5:D14 .
- Ange sedan din Lösare Beslut Varibles Vi matar in dem i området med celler D16:D18.
- Vi antar att alla variabler har följande värden 0.01 .
Läs mer: Multipel linjär regression på Excel-dataset (2 metoder)
Steg 2: Utvärdering av logitvärdet
I det här steget ska vi beräkna Logit värde för vårt dataset. Vi definierar Logit värde som X i vår beräkning. Formeln för Logit värdet är:
Här, b0, b1, och b2 är regressionsvariabler.
- Skriv ned följande formel i cell E5 . Använd Absoluttecknet för att frysa cellvärdet för variabler. Om du inte vet hur du ska mata in Absolut cellreferens kan du ange det på flera olika sätt.
=$D$16+$D$17*C5+$D$18*D5
- Tryck sedan på Gå in på tangenten på tangentbordet.
- Efter det, dubbelklicka på på den Handtag för fyllning för att kopiera formeln upp till cell E14 .
- Du får alla värden för X .
Läs mer: Hur man gör enkel linjär regression i Excel (4 enkla metoder)
Steg 3: Bestäm exponential eller logit för varje data
Här kommer vi att beräkna exponentialvärdet av logitvärdet. EXP-funktionen :
- För att bestämma det exponentiella värdet av X , skriv ned följande formel i cell F5 :
=EXP(E5)
- På samma sätt, dubbelklicka på på den Handtag för fyllning ikonen för att kopiera formeln på samma sätt som i föregående steg. Du kommer att få alla exponentialvärden för X .
Steg 4: Beräkna sannolikhetsvärdet
P(X) är sannolikhetsvärdet för att den X händelsen. Sannolikheten för händelsen X kan definieras som:
- För att beräkna den skriver du följande formel i cell G5 .
=F5/(1+F5)
- Tryck på Gå in på nyckel.
- Dra nu i Handtag för fyllning ikon upp till G15 för att få fram värdet för alla värden.
Läs mer: Hur man beräknar P-värdet i linjär regression i Excel (3 sätt)
Steg 5: Utvärdera summan av loglikelihood-värdet
I följande steg kommer vi att utvärdera värdet av Log-liklighet. Därefter kommer vi att använda funktionen SUM för att lägga till alla uppgifter:
- För att beräkna Log-likelihood värde, kommer vi att använda LN funktion i vårt dataset. I cellen H5 , skriver man följande formel:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Tryck nu på Gå in på tangenten på tangentbordet.
- Då, dubbelklicka på på den Handtag för fyllning ikonen för att bestämma alla log-likelihood-värden.
- Därefter, i cell H15 , skriv ned följande formel för att summera alla värden.
=SUMMA(H5:H14)
🔍 Uppdelning av formeln
Vi gör denna uppdelning för cell H5 .
👉
LN(G5): Denna funktion returnerar -0.384.
👉
LN(1-G5): Denna funktion returnerar -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Denna funktion returnerar -0.384.
Steg 6: Använd analysverktyget Solver för den slutliga analysen
Nu ska vi genomföra den slutliga regressionsanalysen. Vi utför analysen med hjälp av Lösare kommandot. Om du inte ser det i Uppgifter måste du aktivera Lösare från Excel-tillägg .
- För att aktivera den väljer du Fil> Alternativ .
- Som ett resultat visas en dialogruta som heter Excel-alternativ kommer att visas.
- I den här dialogrutan väljer du Tilläggsfunktioner alternativ.
- Välj nu den Excel-tillägg i alternativet i Hantera och klicka på Gå till .
- En liten dialogruta med titeln Tilläggsfunktioner kommer att visas.
- Kontrollera sedan Tillägg till Solver och klicka på OK .
- Gå därefter till Uppgifter och där hittar du fliken Lösare kommandot i Analys grupp.
- Klicka nu på Lösare kommandot.
- En ny dialogruta med titeln Parametrar för lösaren kommer att visas.
- I Fastställa mål väljer du cellen $H$15 med musen. Du kan också skriva cellreferensen på tangentbordet. Se till att du använder Absolut cellreferens skriva under här.
- Därefter, i Genom att ändra variabla celler alternativ välja intervallet av celler $D$16:$D$18 .
- Avmarkera sedan Gör icke-begränsade variabler icke-negativa för att få fram de negativa värdena om det redan visas som markerat.
- Slutligen klickar du på Lös knapp.
- Som ett resultat av detta har Lösare Resultat rutan visas framför dig.
- Välj nu den Keep Solver-lösning Denna ruta visar också om regressionsanalysen konvergerade eller divergerade.
- Klicka på OK för att stänga rutan.
- Till sist kommer du att se variabelns värden i intervallet av celler. D16:D18 har ändrats. Dessutom ser du också värdena för kolumnerna E, F, G , och H visar också på skillnader jämfört med de tidigare stegen.
🔍 Illustration av resultatet av den binära regressionsanalysen
När den binära logistiska regressionsanalysen i Excel har slutförts kommer du att se att vårt antagna värde för regressionsvariabeln har ersatts med det nya analysvärdet och att dessa värden är det korrekta värdet för regressionsvariabeln för vårt dataset. Vi kan betrakta resultatet för alla specifika data, som maskinen som har en ålder på 68 månader och 4 genomsnittligt inget skift per vecka. Värdet av P(X) är 0.67 Det visar oss att om vi letar efter en maskin i fungerande skick så är möjligheten att den händelsen inträffar ungefär 67% .
Vi kan också visa den separat med hjälp av regressionsvariabelns slutliga värden.
Vi kan alltså säga att vårt arbetssätt fungerade bra och att vi kan göra en binär logistisk regressionsanalys.
Slutsats
Det är slutet på den här artikeln. Jag hoppas att den här artikeln kommer att vara till hjälp för dig och att du kommer att kunna göra logistisk regression i Excel. Dela gärna med dig av eventuella ytterligare frågor eller rekommendationer till oss i kommentarsfältet nedan.
Glöm inte att besöka vår webbplats ExcelWIKI för flera Excel-relaterade problem och lösningar. Fortsätt att lära dig nya metoder och fortsätt att växa!