Sadržaj
Regresijska analiza široko je korišten statistički izračun. Ovakvu vrstu izračuna često radimo prema vlastitoj želji. U Excelu možemo izvesti više vrsta regresijske analize . U ovom ćemo članku pokazati kako napraviti logističku regresiju u Excelu. Ako ste i vi zainteresirani naučiti ovu analizu, preuzmite radnu bilježnicu za vježbe i pratite nas.
Preuzmite bilježnicu za vježbe
Preuzmite ovu bilježnicu za vježbe za vježbanje dok čitate ovaj članak.
Logistička regresija.xlsx
Što je logistička regresija?
Logistička regresijska analiza algoritam je statističkog učenja koji se koristi za predviđanje vrijednosti zavisne varijable na temelju nekih neovisnih kriterija. Pomaže osobi da dobije rezultat iz velikog skupa podataka na temelju željene kategorije. Logistička regresijska analiza uglavnom tri vrste:
- Binarna logistička regresija
- Multinomijalna logistička regresija
- Ordinalna logistička regresija
Binarna Logistička regresija: U modelu analize binarne regresije kategoriju definiramo pomoću samo dva slučaja. Da/Ne ili Pozitivno/Negativno.
Multinomalna logistička regresija: Multinomalna logistička analiza radi s tri ili više klasifikacija. Ako imamo više od dva klasificirana odjeljka za kategorizaciju naših podataka, tada možemo koristiti ovaj model regresijske analize.
Ordinalna logistikaRegresija: Ovaj model regresijske analize radi za više od dvije kategorije. Međutim, u ovom modelu potreban nam je unaprijed određeni redoslijed da ih kategoriziramo.
Korak po korak postupak za izvođenje logističke regresije u Excelu
U ovom ćemo članku izvesti binarnu logističku regresiju analiza. Ova vrsta analize daje nam prediktivnu vrijednost željene varijable. Za izvođenje analize uzimamo u obzir skup podataka od 10 strojeva iz industrije. Dostupnost stroja može biti pozitivna ili negativna. Binarne znamenke 1=pozitivno , i 0=negativno , te su vrijednosti prikazane u stupcu B . Starost tih strojeva je u stupcu C , a prosječni broj radnih sati za njih tjedno je u stupcu D . Dakle, naš skup podataka je u rasponu ćelija B5:D14 . Vrijednosti početne varijable rješavača regresije su u rasponu ćelija C16:D18 . Cijeli postupak analize objašnjen je u nastavku korak po korak:
Korak 1: Unesite svoj skup podataka
U ovom koraku ćemo uvesti vaš skup podataka:
- Prije svega, točno unesite svoj skup podataka u Excel. Za našu analizu unosimo skup podataka u raspon ćelija B5:D14 .
- Zatim unesite svoj Varijable odluke Solvera' Unosimo ih u raspon ćelija D16:D18.
- Pretpostavljamo da su vrijednosti svih varijabli 0,01 .
PročitajViše: Višestruka linearna regresija na Excel skupovima podataka (2 metode)
Korak 2: Procijenite logit vrijednost
U ovom koraku ćemo izračunati Logit vrijednost za naš skup podataka. Definiramo Logit vrijednost kao X u našem izračunu. Formula vrijednosti Logit je:
Ovdje, b0, b1, i b2 su regresija varijable.
- Zapišite sljedeću formulu u ćeliju E5 . Upotrijebite znak Apsolutni za zamrzavanje vrijednosti ćelije varijabli. Ako ne znate kako unijeti znak Apsolutna referenca ćelije , možete ga unijeti na nekoliko načina.
=$D$16+$D$17*C5+$D$18*D5
- Zatim pritisnite tipku Enter na tipkovnici.
- Nakon toga, Dvaput kliknite na ikonu Ručka za popunjavanje da kopirate formulu do ćelije E14 .
- Dobit ćete sve vrijednosti X .
Pročitajte više: Kako napraviti jednostavnu linearnu regresiju u Excelu (4 jednostavne metode)
Korak 3: Odredite eksponencijalni logit za svaki podatak
Ovdje ćemo izračunati eksponencijalnu vrijednost logit-a vrijednost, Za to ćemo koristiti funkciju EXP :
- Da biste odredili eksponencijalnu vrijednost X , zapišite sljedeću formulu u ćeliju F5 :
=EXP(E5)
- Slično, Dvaput kliknite na ikonu Ručka za popunjavanje da kopirate formulu kaoprethodni korak. Dobit ćete sve eksponencijalne vrijednosti X .
Korak 4: Izračunajte vrijednost vjerojatnosti
P( X) je vrijednost vjerojatnosti za pojavu događaja X . Vjerojatnost događaja X može se definirati kao:
- Da biste je izračunali, zapišite sljedeću formulu u ćeliju G5 .
=F5/(1+F5)
- Pritisnite Enter ključ.
- Sada povucite ikonu Ručka za popunjavanje do G15 da dobijete vrijednost za sve vrijednosti.
Pročitajte više: Kako izračunati P vrijednost u linearnoj regresiji u Excelu (3 načina)
Korak 5: Procijenite zbroj log- Vrijednost vjerojatnosti
U sljedećim koracima procijenit ćemo vrijednost Log-Likelihood. Nakon toga koristit ćemo funkciju SUM za dodavanje svih podataka:
- Da bismo izračunali vrijednost Log-Likelihood , mi ćemo koristite LN funkciju u našem skupu podataka. U ćeliju H5 napišite gotovo sljedeću formulu:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Sada pritisnite tipku Enter na tipkovnici.
- Zatim, dvaput kliknite na Ikona Ručka za popunjavanje za određivanje svih vrijednosti log-vjerojatnosti.
- Nakon toga, u ćeliju H15 zapišite sljedeću formulu za zbroj svih vrijednosti.
=SUM(H5:H14)
🔍 Raščlamba formule
Radimoova raščlamba za ćeliju H5 .
👉
LN(G5): Ova funkcija vraća -0,384.
👉
LN(1-G5): Ova funkcija vraća -1,144.
👉
(B5*LN(G5))+((1-B5)* LN(1-G5)): Ova funkcija vraća -0,384.
Korak 6: Koristite alat za analizu rješavača za konačnu analizu
Sada ćemo provesti konačnu regresijsku analizu. Analizu ćemo izvršiti preko naredbe Solver . Ako ga ne vidite na kartici Podaci , morate omogućiti Solver iz Excel dodataka .
- Da biste ga omogućili, odaberite Datoteka > Opcije .
- Kao rezultat, pojavit će se dijaloški okvir pod nazivom Opcije programa Excel .
- U ovom dijaloškom okviru odaberite opciju Add-ins .
- Sada odaberite opciju Excel Add-ins u odjeljku Manage i kliknite Idi .
- Pojavit će se mali dijaloški okvir pod nazivom Dodaci .
- Zatim označite opciju Solver Add-in i kliknite OK .
- Nakon toga idite na karticu Podaci i pronaći ćete naredbu Solver u grupi Analiza .
- Sada kliknite naredbu Solver .
- Pojavit će se novi dijaloški okvir pod nazivom Parametri Solvera .
- U okviru Postavi cilj mišem odaberite ćeliju $H$15 . Također možete napisati referencu ćelije na tipkovnici. Obavezno koristiteOvdje se prijavite Apsolutna referenca ćelije .
- Dalje, u opciji Promjenom varijabilnih ćelija odaberite raspon ćelija $D$16:$D$18 .
- Zatim poništite oznaku Učini neograničene varijable nenegativnima da dobijete negativne vrijednosti ako se već prikazuje kao označeno.
- Na kraju kliknite Rješavanje gumb.
- Kao rezultat, okvir Rezultat rješavača pojavit će se ispred vas.
- Sada odaberite Keep Solver Solution Ovaj okvir će vam također pokazati je li vaša regresijska analiza konvergirala ili divergirala.
- Kliknite OK da zatvorite okvir.
- Napokon ćete vidjeti da su vrijednosti varijable u rasponu ćelija D16:D18 promijenjene. Osim toga, vidjet ćete i vrijednosti stupaca E, F, G i H koje također pokazuju razlike u odnosu na prethodne korake.
🔍 Ilustracija rezultata analize binarne regresije
Nakon završetka analize binarne logističke regresije u Excelu, vidjeti da je naša pretpostavljena vrijednost varijable regresije zamijenjena novom vrijednošću analize i da su te vrijednosti ispravna vrijednost varijable regresije našeg skupa podataka. Možemo uzeti u obzir rezultat bilo kojeg specifičnog podatka, poput stroja koji je star 68 mjeseci i 4 prosječno bez smjene tjedno. Vrijednost P(X) je 0,67 . To nam ilustrira da ako pogledamoza stroj u radnom stanju mogućnost tog događaja je oko 67% .
Možemo ga prikazati i odvojeno, koristeći konačne vrijednosti regresijske varijable.
Dakle, možemo reći da je naš radni postupak uspješno funkcionirao i da smo u mogućnosti napraviti binarnu logističku regresijsku analizu.
Zaključak
Ovo je kraj ovog članka . Nadam se da će vam ovaj članak biti od pomoći i da ćete moći raditi logističku regresiju u Excelu. Podijelite s nama sva dodatna pitanja ili preporuke u odjeljku za komentare ispod.
Ne zaboravite provjeriti našu web stranicu ExcelWIKI za nekoliko problema i rješenja povezanih s Excelom. Nastavite učiti nove metode i rasti!