Kako napraviti logističku regresiju u Excelu (sa brzim koracima)

  • Podijeli Ovo
Hugh West

Regresiona analiza je široko korištena statistička kalkulacija. Često radimo ovu vrstu proračuna prema našoj želji. U Excelu možemo izvesti više tipova regresione analize . U ovom članku ćemo pokazati kako napraviti logističku regresiju u Excelu. Ako ste i vi zainteresovani da naučite ovu analizu, preuzmite radnu svesku za vežbu i pratite nas.

Preuzmite svesku za vežbu

Preuzmite ovu radnu svesku za vežbanje dok čitate ovaj članak.

Logistička regresija.xlsx

Šta je logistička regresija?

Logistička regresijska analiza je statistički algoritam učenja koji koristi za predviđanje vrijednosti zavisne varijable na osnovu nekih nezavisnih kriterija. Pomaže osobi da dobije rezultat iz velikog skupa podataka na osnovu njegove željene kategorije. Logistička regresijska analiza uglavnom tri tipa:

  1. Binarna logistička regresija
  2. Multinomijalna logistička regresija
  3. Ordinalna logistička regresija

Binarna Logistička regresija: U modelu analize binarne regresije, definišemo kategoriju sa samo dva slučaja. Da/Ne ili Pozitivno/Negativno.

Multinomalna logistička regresija: Multinomalna logistička analiza radi s tri ili više klasifikacija. Ako imamo više od dva klasificirana odjeljka za kategorizaciju naših podataka, onda možemo koristiti ovaj model regresijske analize.

Ordinal LogisticRegresija: Ovaj model regresione analize radi za više od dvije kategorije. Međutim, u ovom modelu nam je potreban unaprijed određen redoslijed da ih kategoriziramo.

Korak po korak procedura za izvođenje logističke regresije u Excelu

U ovom članku ćemo izvesti binarnu logističku regresiju analiza. Ova vrsta analize nam daje vrijednost predviđanja željene varijable. Da bismo izvršili analizu, uzimamo u obzir skup podataka od 10 mašina iz industrije. Dostupnost mašine može biti pozitivna ili negativna. Binarne cifre 1=pozitivno i 0=negativno i ove vrijednosti su prikazane u koloni B . Starost ovih mašina je u koloni C , a prosječni radni sati njih sedmično su u koloni D . Dakle, naš skup podataka je u rasponu ćelija B5:D14 . Vrijednosti varijable inicijalne regresije rješavača su u rasponu ćelija C16:D18 . Cijela procedura analize je objašnjena u nastavku korak po korak:

Korak 1: Unesite svoj skup podataka

U ovom koraku ćemo uvesti vaš skup podataka:

  • Pre svega, precizno unesite svoj skup podataka u Excel. Za našu analizu unosimo skup podataka u raspon ćelija B5:D14 .

  • Zatim unesite svoj Varijable odluke rješavanja' Unosimo ih u raspon ćelija D16:D18.
  • Pretpostavljamo vrijednosti svih varijabli kao 0.01 .

PročitajViše: Višestruka linearna regresija na Excel skupovima podataka (2 metode)

Korak 2: Procijenite logit vrijednost

U ovom koraku ćemo izračunati Logit vrijednost za naš skup podataka. Mi definiramo Logit vrijednost kao X u našem proračunu. Formula Logit vrijednosti je:

Ovdje, b0, b1, i b2 su regresija varijable.

  • Zapišite sljedeću formulu u ćeliju E5 . Koristite znak Apsolutno da zamrznete vrijednost ćelije varijabli. Ako ne znate kako da unesete znak Apsolutna referenca ćelije , možete ga unijeti na nekoliko načina.

=$D$16+$D$17*C5+$D$18*D5

  • Zatim pritisnite tipku Enter na svojoj tastaturi.

  • Nakon toga, dvaput kliknite na ikonu Ručica za popunjavanje da kopirate formulu do ćelije E14 .

  • Dobit ćete sve vrijednosti X .

Pročitajte više: Kako napraviti jednostavnu linearnu regresiju u Excelu (4 jednostavna metoda)

Korak 3: Odredite eksponencijalnu logitu za svaki podatak

Ovdje ćemo izračunati eksponencijalnu vrijednost logita vrijednost, Za to ćemo koristiti EXP funkciju :

  • Da bismo odredili eksponencijalnu vrijednost X , zapišite sljedeću formulu u ćeliju F5 :

=EXP(E5)

  • Slično, dvaput kliknite na ikonu Fill Handle da kopirate formulu kaoprethodni korak. Dobit ćete sve eksponencijalne vrijednosti X .

Korak 4: Izračunajte vrijednost vjerovatnoće

P( X) je vrijednost vjerovatnoće za pojavljivanje događaja X . Vjerovatnoća događaja X se može definirati kao:

  • Da biste je izračunali, zapišite sljedeću formulu u ćeliju G5 .

=F5/(1+F5)

  • Pritisnite Enter taster.
  • Sada povucite ikonu Ručica za popunjavanje do G15 da dobijete vrijednost za sve vrijednosti.

Pročitajte više: Kako izračunati P vrijednost u linearnoj regresiji u Excelu (3 načina)

Korak 5: Procijenite zbroj log- Vrijednost vjerovatnoće

U sljedećim koracima procijenit ćemo vrijednost Log-Likelihood. Nakon toga ćemo koristiti funkciju SUM za dodavanje svih podataka:

  • Da bismo izračunali vrijednost Log-Likelihood , mi ćemo koristite LN funkciju u našem skupu podataka. U ćeliju H5 upišite urađenu sljedeću formulu:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Sada pritisnite tipku Enter na tastaturi.

  • Zatim, dvaput kliknite na Ikona Ispunite Handle da odredite sve vrijednosti vjerovatnoće dnevnika.

  • Nakon toga, u ćeliju H15 , zapišite sljedeću formulu za zbrajanje svih vrijednosti.

=SUM(H5:H14)

🔍 Raščlamba formule

Radimoova podjela za ćeliju H5 .

👉 LN(G5): Ova funkcija vraća -0.384.

👉 LN(1-G5): Ova funkcija vraća -1.144.

👉 (B5*LN(G5))+((1-B5)* LN(1-G5)): Ova funkcija vraća -0.384.

Korak 6: Koristite alat za analizu rješavača za konačnu analizu

Sada ćemo provesti konačnu regresionu analizu. Analizu ćemo izvršiti putem naredbe Solver . Ako ga ne vidite na kartici Data , morate omogućiti Solver iz Excel dodataka .

  • Da biste to omogućili, odaberite Datoteka > Opcije .

  • Kao rezultat, pojavit će se dijaloški okvir Opcije Excel .
  • U ovom dijaloškom okviru odaberite opciju Dodaci .
  • Sada odaberite opciju Excel dodaci u odjeljku Upravljanje i kliknite Idi .

  • Mali dijaloški okvir pod nazivom Dodaci će se pojaviti.
  • Zatim označite opciju Dodatak za rješavanje i kliknite na OK .

  • Nakon toga idite na karticu Podaci i naći ćete naredbu Rješač u grupi Analiza .

  • Sada kliknite na naredbu Solver .
  • Pojavit će se novi dijaloški okvir pod nazivom Parametri rješavača .
  • U polju Postavi cilj , odaberite ćeliju $H$15 pomoću miša. Takođe možete napisati referencu ćelije na tastaturi. Obavezno koristite Apsolutna referenca ćelije potpišite ovdje.
  • Sljedeće, u opciji Promjenom varijabilnih ćelija odaberite raspon ćelija $D$16:$D$18 .
  • Zatim, poništite Negativne varijable bez ograničenja da dobijete negativne vrijednosti ako se već prikazuje kao označeno.
  • Konačno, kliknite na Reši dugme.

  • Kao rezultat, pred vama će se pojaviti okvir Rezultat rješavanja .
  • Sada odaberite Zadrži rješenje rješenja Ovaj okvir će vam također pokazati da li se vaša regresiona analiza konvergirala ili razišla.
  • Kliknite na OK da zatvorite okvir.

  • Konačno ćete vidjeti da su vrijednosti varijable u rasponu ćelija D16:D18 promijenjene. Osim toga, vidjet ćete i vrijednosti kolona E, F, G i H koje također pokazuju razlike u odnosu na prethodne korake.

🔍 Ilustracija rezultata analize binarne regresije

Nakon završetka analize binarne logističke regresije u Excelu, vidimo da je naša pretpostavljena vrijednost varijable regresije zamijenjena novom vrijednošću analize i ove vrijednosti su ispravna vrijednost regresijske varijable našeg skupa podataka. Možemo uzeti u obzir rezultat bilo kojeg specifičnog podatka, kao što je mašina koja ima starost 68 mjeseci i 4 prosječno. nema smjene sedmično. Vrijednost P(X) je 0.67 . To nam ilustruje ako pogledamoza mašinu u radnom stanju mogućnost tog događaja je oko 67% .

Možemo ga prikazati i odvojeno, koristeći konačne vrijednosti varijable regresije.

Dakle, možemo reći da je naša radna procedura uspješno funkcionirala i da smo u mogućnosti napraviti analizu binarne logističke regresije.

Zaključak

To je kraj ovog članka . Nadam se da će vam ovaj članak biti od pomoći i da ćete moći napraviti logističku regresiju u Excelu. Molimo podijelite s nama sve daljnje upite ili preporuke u odjeljku za komentare ispod.

Ne zaboravite provjeriti našu web stranicu ExcelWIKI za nekoliko problema i rješenja vezanih za Excel. Nastavite učiti nove metode i nastavite rasti!

Hugh West je vrlo iskusan Excel trener i analitičar s više od 10 godina iskustva u industriji. Diplomirao je računovodstvo i finansije i magistrirao poslovnu administraciju. Hugh ima strast prema podučavanju i razvio je jedinstven pristup podučavanju koji je lako pratiti i razumjeti. Njegovo stručno znanje o Excel-u pomoglo je hiljadama studenata i profesionalaca širom svijeta da poboljšaju svoje vještine i napreduju u karijeri. Kroz svoj blog, Hugh dijeli svoje znanje sa svijetom, nudeći besplatne Excel tutorijale i online obuku kako bi pomogli pojedincima i preduzećima da ostvare svoj puni potencijal.