Kazalo
Regresijska analiza je pogosto uporabljen statistični izračun. tovrstne izračune pogosto izvajamo po svoji želji. v Excelu lahko izvedemo več vrst regresijske analize V tem članku bomo prikazali, kako v Excelu opraviti logistično regresijo. Če se želite tudi vi naučiti te analize, prenesite vadbeni zvezek in nam sledite.
Prenesi delovni zvezek za prakso
Prenesite ta delovni zvezek za vadbo, medtem ko berete ta članek.
Logistična regresija.xlsx
Kaj je logistična regresija?
Logistična regresijska analiza je algoritem statističnega učenja, ki se uporablja za napovedovanje vrednosti odvisne spremenljivke na podlagi nekaterih neodvisnih meril. Osebi pomaga, da iz velikega nabora podatkov dobi rezultat na podlagi želene kategorije. Logistična regresijska analiza ima večinoma tri vrste:
- Binarna logistična regresija
- Multinomična logistična regresija
- Ordinalna logistična regresija
Binarna logistična regresija: V modelu binarne regresijske analize kategorijo opredelimo samo z dvema primeroma: da/ne ali pozitivno/negativno.
Multinomialna logistična regresija: Multinominalna logistična analiza deluje s tremi ali več klasifikacijami. Če imamo za kategorizacijo podatkov več kot dva razvrščena odseka, lahko uporabimo ta model regresijske analize.
Ordinalna logistična regresija: Ta model regresijske analize deluje za več kot dve kategoriji. Vendar pa v tem modelu potrebujemo vnaprej določen vrstni red za razvrščanje v kategorije.
Postopek korak za korakom za izvajanje logistične regresije v Excelu
V tem članku bomo izvedli binarno logistično regresijsko analizo. Ta vrsta analize nam zagotavlja napovedno vrednost želene spremenljivke. Za izvedbo analize upoštevamo nabor podatkov o 10 strojih iz industrije. Razpoložljivost stroja je lahko pozitivna ali negativna. Binarne števke 1=pozitiven in 0=negativno in te vrednosti so prikazane v stolpcu B Starost teh strojev je v stolpcu C povprečno število delovnih ur na teden pa je v stolpcu D Naš nabor podatkov je torej v območju celic B5:D14 Vrednosti začetne spremenljivke regresijskega reševalca so v območju celic C16:D18 V nadaljevanju je po korakih razložen celoten postopek analize:
Korak 1: Vnesite svoj nabor podatkov
V tem koraku bomo uvozili nabor podatkov:
- Najprej v Excel natančno vnesite nabor podatkov. Za našo analizo smo nabor podatkov vnesli v razpon celic B5:D14 .
- Nato vnesite Solver Odločitev Varibles' Vnesemo jih v območje celic D16:D18.
- Vrednosti vseh spremenljivk predpostavljamo kot 0.01 .
Preberite več: Večkratna linearna regresija na podatkovnih nizih programa Excel (2 metodi)
Korak 2: Ocenite vrednost logita
V tem koraku bomo izračunali Logit za naš nabor podatkov. Logit vrednost kot X v našem izračunu. Formula Logit vrednost je:
Tukaj, b0, b1, in . b2 so regresijske spremenljivke.
- V celico zapišite naslednjo formulo E5 . Za zamrznitev vrednosti spremenljivk v celici uporabite znak Absolute. Če ne veste, kako vnesti Absolutni sklic na celico lahko vnesete na več načinov.
=$D$16+$D$17*C5+$D$18*D5
- Nato pritisnite Vnesite na tipkovnici.
- Nato, dvakrat kliknite na Ročaj za polnjenje ikona za kopiranje formule do celice E14 .
- Dobili boste vse vrednosti X .
Preberite več: Kako narediti preprosto linearno regresijo v Excelu (4 preproste metode)
Korak 3: Določite eksponentno logit za vsak podatek
Tu bomo izračunali eksponentno vrednost vrednosti logit, Za to bomo uporabili funkcija EXP :
- Za določitev eksponentne vrednosti X , v celico zapišite naslednjo formulo F5 :
=EXP(E5)
- Podobno, dvakrat kliknite na Ročaj za polnjenje ikono za kopiranje formule kot v prejšnjem koraku. Vsa eksponentna vrednost X .
Korak 4: Izračunajte vrednost verjetnosti
P(X) je vrednost verjetnosti za pojav X dogodek. Verjetnost dogodka X lahko opredelimo kot:
- Če ga želite izračunati, v celico zapišite naslednjo formulo G5 .
=F5/(1+F5)
- Pritisnite Vnesite ključ.
- Zdaj povlecite Ročaj za polnjenje ikona do G15 za pridobitev vrednosti za vse vrednosti.
Preberite več: Kako izračunati vrednost P pri linearni regresiji v Excelu (3 načini)
Korak 5: Ocenite vsoto vrednosti logaritemske verjetnosti
V naslednjih korakih bomo ocenili vrednost Logaritemska verjetnost. Nato bomo uporabili funkcija SUM da dodate vse podatke:
- Za izračun Logaritemska verjetnost bomo uporabili LN funkcija v našem naboru podatkov. V celici H5 , napišite naslednjo formulo:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Zdaj pritisnite tipko Vnesite na tipkovnici.
- Nato, dvakrat kliknite na Ročaj za polnjenje za določitev vseh vrednosti logaritemske verjetnosti.
- Nato v celici H15 , zapišite naslednjo formulo za seštevek vseh vrednosti.
=SUM(H5:H14)
🔍 Razčlenitev formule
To razčlenitev izvajamo za celice H5 .
👉
LN(G5): Ta funkcija vrne -0.384.
👉
LN(1-G5): Ta funkcija vrne -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Ta funkcija vrne -0.384.
Korak 6: Za končno analizo uporabite orodje Solver Analysis Tool
Zdaj bomo izvedli končno regresijsko analizo. Analizo bomo izvedli s pomočjo Rešitelj Če ga ne vidite v ukazu Podatki omogočite možnost Rešitelj iz Excelovi dodatki .
- Če jo želite omogočiti, izberite Datoteka> Možnosti .
- Posledično se odpre pogovorno okno z imenom Možnosti programa Excel se prikaže.
- V tem pogovornem oknu izberite Dodatki možnost.
- Zdaj izberite Excelovi dodatki možnost v Upravljanje in kliknite Pojdi na .
- Majhno pogovorno okno z naslovom Dodatki se prikaže.
- Nato preverite Dodatek Solver in kliknite možnost V REDU .
- Nato pojdite v Podatki in našli boste zavihek Rešitelj ukaz v Analiza skupina.
- Zdaj kliknite na Rešitelj ukaz.
- Odpre se novo pogovorno okno z naslovom Parametri rešilnika se prikaže.
- V Določite cilj izberite celico $H$15 z miško. Sklic na celico lahko zapišete tudi na tipkovnici. Absolutni sklic na celico podpišite tukaj.
- Nato v S spreminjanjem spremenljivih celic možnost izberite obseg celic $D$16:$D$18 .
- Nato odstranite potrditev Neomejene spremenljivke naj bodo nenegativne za pridobitev negativnih vrednosti, če je že prikazana kot označena.
- Na koncu kliknite Rešite gumb.
- Zaradi tega je Rezultat reševalca pred vami se bo pojavilo polje.
- Zdaj izberite Ohranite rešitev Solver V tem oknu je prikazano tudi, ali je regresijska analiza konvergirala ali divergirala.
- Kliknite . V REDU za zaprtje polja.
- Končno boste videli vrednosti spremenljivke v območju celic D16:D18 Poleg tega bodo prikazane tudi vrednosti stolpcev E, F, G in H se prav tako razlikujejo od prejšnjih korakov.
🔍 Prikaz rezultatov binarne regresijske analize
Po končani binarni logistični regresijski analizi v programu Excel boste videli, da je naša predpostavljena vrednost regresijske spremenljivke nadomeščena z novo vrednostjo analize in te vrednosti so pravilne vrednosti regresijske spremenljivke našega nabora podatkov. Upoštevamo lahko rezultat katerega koli posebnega podatka, na primer stroja, ki ima starost 68 mesecev in 4 povprečno nobena izmena na teden. Vrednost P(X) je . 0.67 . To nam kaže, da če iščemo stroj v delujočem stanju, je možnost tega dogodka približno 67% .
Prikažemo jo lahko tudi ločeno, z uporabo končnih vrednosti regresijske spremenljivke.
Tako lahko rečemo, da je naš delovni postopek deloval uspešno in da lahko opravimo binarno logistično regresijsko analizo.
Zaključek
To je konec tega članka. Upam, da vam bo ta članek v pomoč in da boste lahko izvedli logistično regresijo v programu Excel. V spodnjem razdelku za komentarje z nami delite morebitna dodatna vprašanja ali priporočila.
Ne pozabite preveriti naše spletne strani ExcelWIKI za več težav in rešitev, povezanih z Excelom. Še naprej se učite novih metod in rastite!