Indholdsfortegnelse
Regressionsanalyse er en meget anvendt statistisk beregning. Vi foretager ofte denne type beregninger efter vores ønske. I Excel kan vi udføre flere typer af regressionsanalyse I denne artikel vil vi vise, hvordan man udfører logistisk regression i Excel. Hvis du også er interesseret i at lære denne analyse, kan du downloade arbejdsbogen og følge os.
Download arbejdsbog til øvelser
Download denne arbejdsbog til øvelse, så du kan øve dig, mens du læser denne artikel.
Logistisk regression.xlsx
Hvad er logistisk regression?
Logistisk regressionsanalyse er en statistisk læringsalgoritme, der bruges til at forudsige værdien af en afhængig variabel baseret på nogle uafhængige kriterier. Den hjælper en person med at få resultatet fra et stort datasæt baseret på den ønskede kategori. Logistisk regressionsanalyse består hovedsageligt af tre typer:
- Binær logistisk regression
- Multinomial logistisk regression
- Ordinal logistisk regression
Binær logistisk regression: I den binære regressionsanalysemodel definerer vi en kategori ved kun to tilfælde: Ja/Nej eller Positiv/Negativ.
Multinomial logistisk regression: Multinominal logistisk analyse fungerer med tre eller flere klassifikationer. Hvis vi har mere end to klassificerede afsnit til at kategorisere vores data, kan vi bruge denne regressionsanalysemodel.
Ordinal logistisk regression: Denne regressionsanalysemodel fungerer for mere end to kategorier, men i denne model har vi brug for en forudbestemt rækkefølge for at kategorisere dem.
Trin-for-trin procedure til logistisk regression i Excel
I denne artikel vil vi udføre den binære logistiske regressionsanalyse. Denne type analyse giver os en forudsigelsesværdi for den ønskede variabel. For at udføre analysen betragter vi et datasæt på 10 maskiner fra en industri. Maskinens tilgængelighed kan være positiv eller negativ. De binære tal 1=positiv , og 0=negativ , og disse værdier er vist i kolonne B . disse maskiners alder er angivet i kolonne C og deres gennemsnitlige ugentlige arbejdstid er angivet i kolonne D Så vores datasæt er i området med celler B5:D14 . værdierne indledende regression solver variabel er i området af cellerne C16:D18 Hele analyseproceduren forklares nedenfor trin for trin:
Trin 1: Indtast dit datasæt
I dette trin skal vi importere dit datasæt:
- Først og fremmest skal du indtaste dit datasæt korrekt i Excel. I vores analyse indtaster vi datasættet i cellerne i området B5:D14 .
- Indtast derefter din Beslutning om opløsningsmiddel Varibles' Vi indtaster dem i området af celler D16:D18.
- Vi antager, at alle variablernes værdier er 0.01 .
Læs mere: Multipel lineær regression på Excel-datasæt (2 metoder)
Trin 2: Vurdering af logit-værdi
I dette trin skal vi beregne den Logit værdi for vores datasæt. Vi definerer den Logit værdi som X i vores beregning. Formlen for Logit værdi er:
Her, b0, b1, og b2 er regressionsvariabler.
- Skriv følgende formel i celle E5 . Brug absolut-tegnet til at fastfryse variablernes celleværdi. Hvis du ikke ved, hvordan du skal indtaste Absolut cellehenvisning tegn, kan du indtaste det på flere måder.
=$D$16+$D$17*C5+$D$18*D5
- Derefter skal du trykke på Indtast på dit tastatur.
- Derefter, dobbeltklik på på den Håndtag til påfyldning ikonet for at kopiere formlen op til celle E14 .
- Du får alle værdierne for X .
Læs mere: Hvordan man laver simpel lineær regression i Excel (4 enkle metoder)
Trin 3: Bestem eksponential eller logit for hver data
Her vil vi beregne den eksponentielle værdi af logit-værdien, Til dette formål skal vi bruge EXP-funktionen :
- For at bestemme den eksponentielle værdi af X , skriv følgende formel i celle F5 :
=EXP(E5)
- På samme måde, dobbeltklik på på den Håndtag til påfyldning ikonet for at kopiere formlen som i det foregående trin. Du vil alle de eksponentielle værdier af X .
Trin 4: Beregn sandsynlighedsværdien
P(X) er sandsynlighedsværdien for, at der opstår den X begivenhed. Sandsynligheden for begivenhed X kan defineres som:
- For at beregne den skal du skrive følgende formel i celle G5 .
=F5/(1+F5)
- Tryk på Gå ind på nøgle.
- Træk nu den Håndtag til påfyldning ikon op til G15 for at få værdien for alle værdier.
Læs mere: Sådan beregnes P-værdien i lineær regression i Excel (3 måder)
Trin 5: Vurdering af summen af log-likelihood-værdien
I de følgende trin vil vi evaluere værdien af Log-sandsynlighed. Derefter vil vi bruge funktionen SUM for at tilføje alle data:
- For at beregne den Log-Likelihood værdi, skal vi bruge LN funktion i vores datasæt. I celle H5 , skriv følgende formel:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Tryk nu på Indtast på tastaturet.
- Derefter, dobbeltklik på på den Håndtag til påfyldning ikonet for at bestemme alle log-likelihood-værdier.
- Herefter, i celle H15 , skriv følgende formel for at summere alle værdierne.
=SUM(H5:H14)
🔍 Opdeling af formlen
Vi foretager denne opdeling for celle H5 .
👉
LN(G5): Denne funktion returnerer -0.384.
👉
LN(1-G5): Denne funktion returnerer -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Denne funktion returnerer -0.384.
Trin 6: Brug Solver-analyseværktøjet til den endelige analyse
Nu skal vi foretage den endelige regressionsanalyse. Vi vil udføre analysen ved hjælp af Løser kommandoen. Hvis du ikke kan se den i Data fanen, skal du aktivere Løser fra den Excel-tilføjelser .
- For at aktivere den skal du vælge Fil> Indstillinger .
- Som følge heraf vises en dialogboks kaldet Excel-muligheder vil blive vist.
- I denne dialogboks skal du vælge den Tilføjelser mulighed.
- Vælg nu den Excel-tilføjelser i Administrer og klik på Gå til .
- En lille dialogboks med titlen Tilføjelser vil blive vist.
- Kontroller derefter den Solver Add-in og klik på OK .
- Derefter skal du gå til Data fanen, og du vil finde Løser kommandoen i den Analyse gruppe.
- Klik nu på Løser kommando.
- En ny dialogboks med titlen Parametre for opløseren vil blive vist.
- I den Sæt mål boksen, vælg cellen $H$15 med musen. Du kan også skrive cellehenvisningen på dit tastatur. Sørg for at bruge Absolut cellehenvisning underskrive her.
- Dernæst, i den Ved at ændre variable celler mulighed vælge området af celler $D$16:$D$18 .
- Fjern derefter markeringen af Gør ubegrænsede variabler ikke-negative for at få de negative værdier, hvis den allerede er markeret.
- Endelig skal du klikke på Løs knap.
- Som følge heraf har Solver Resultat boksen vises foran dig.
- Vælg nu den Keep Solver-løsning Denne boks viser dig også, om din regressionsanalyse konvergerede eller divergerede.
- Klik på OK for at lukke boksen.
- Til sidst vil du se værdierne af variablen i området af cellerne D16:D18 er ændret. Derudover vil du også se værdierne for kolonnerne E, F, G , og H viser også forskelle i forhold til de foregående trin.
🔍 Illustration af resultatet af den binære regressionsanalyse
Efter afslutningen af den binære logistiske regressionsanalyse i Excel vil du se, at vores antagne regressionsvariabelværdi er erstattet med den nye analyseværdi, og disse værdier er den korrekte regressionsvariabelværdi for vores datasæt. Vi kan overveje resultatet af enhver specifik data, som f.eks. maskinen, der har en alder på 68 måneder og 4 gennemsnitligt ingen skift pr. uge. Værdien af P(X) er 0.67 Det viser os, at hvis vi leder efter maskinen i funktionsdygtig stand, er muligheden for denne begivenhed ca. 67% .
Vi kan også vise den separat ved hjælp af de endelige værdier for regressionsvariablen.
Vi kan således sige, at vores arbejdsprocedure har fungeret godt, og at vi er i stand til at foretage en binær logistisk regressionsanalyse.
Konklusion
Det er slutningen af denne artikel. Jeg håber, at denne artikel vil være nyttig for dig, og at du vil være i stand til at udføre logistisk regression i Excel. Del eventuelle yderligere spørgsmål eller anbefalinger med os i kommentarfeltet nedenfor.
Glem ikke at tjekke vores websted ExcelWIKI til flere Excel-relaterede problemer og løsninger. Bliv ved med at lære nye metoder og bliv ved med at vokse!