Turinys
Regresinė analizė yra plačiai naudojamas statistinis skaičiavimas. Dažnai atliekame tokio tipo skaičiavimus pagal savo norą. Excel programoje galime atlikti kelių tipų regresinė analizė . Šiame straipsnyje parodysime, kaip atlikti logistinę regresiją "Excel" programa. Jei taip pat norite išmokti šios analizės, atsisiųskite pratybų sąsiuvinį ir sekite mus.
Atsisiųsti praktikos sąsiuvinį
Skaitydami šį straipsnį atsisiųskite šį pratybų sąsiuvinį, kad galėtumėte praktikuotis.
Logistinė regresija.xlsx
Kas yra logistinė regresija?
Logistinė regresinė analizė yra statistinio mokymosi algoritmas, kuris naudojamas priklausomo kintamojo vertei prognozuoti pagal tam tikrus nepriklausomus kriterijus. Jis padeda asmeniui gauti rezultatą iš didelės duomenų aibės pagal jo norimą kategoriją. Logistinė regresinė analizė daugiausia yra trijų tipų:
- Dvejetainė logistinė regresija
- Multinominė logistinė regresija
- Ordinalinė logistinė regresija
Dvejetainė logistinė regresija: Dvejetainės regresinės analizės modelyje kategoriją apibrėžiame tik dviem atvejais: Taip/Ne arba Teigiamas/Neigiamas.
Multinominė logistinė regresija: Multinominalinė logistinė analizė veikia su trimis ar daugiau klasifikacijų. Jei turime daugiau nei du klasifikuotus skyrius duomenims klasifikuoti, galime naudoti šį regresinės analizės modelį.
Įsakomoji logistinė regresija: Šis regresinės analizės modelis tinka daugiau nei dviem kategorijoms. Tačiau šiame modelyje mums reikia iš anksto nustatytos jų skirstymo į kategorijas tvarkos.
Žingsnis po žingsnio logistinės regresijos atlikimo "Excel" programa procedūra
Šiame straipsnyje atliksime dvejetainę logistinę regresinę analizę. Šio tipo analizė mums suteikia norimo kintamojo prognozuojamąją vertę. Norėdami atlikti analizę, nagrinėjame duomenų rinkinį, kurį sudaro 10 pramonės šakos mašinų. Mašinų prieinamumas gali būti teigiamas arba neigiamas. Dvejetainiai skaitmenys 1 = teigiamas , ir 0 = neigiamas , o šios vertės pateikiamos stulpelyje B . Šių mašinų amžius nurodytas stulpelyje C o jų vidutinis darbo valandų skaičius per savaitę - stulpelyje D . Taigi mūsų duomenų rinkinys yra iš langelių B5:D14 . Pradinio regresijos sprendimo kintamojo reikšmės yra langelių intervale C16:D18 Toliau žingsnis po žingsnio paaiškinama visa analizės procedūra:
1 žingsnis: įveskite duomenų rinkinį
Šiame etape importuosime duomenų rinkinį:
- Pirmiausia tiksliai įveskite savo duomenų rinkinį į "Excel". Atlikdami analizę, duomenų rinkinį įvedame į ląstelių intervalą B5:D14 .
- Tada įveskite Sprendiklis Sprendimas Varibės' Juos įvedame į ląstelių intervalą D16:D18.
- Darome prielaidą, kad visų kintamųjų reikšmės yra 0.01 .
Skaityti daugiau: Daugkartinė tiesinė regresija "Excel" duomenų rinkiniams (2 metodai)
2 veiksmas: įvertinti logit reikšmę
Šiame etape apskaičiuosime Logit vertę mūsų duomenų rinkiniui. Apibrėžiame Logit reikšmę kaip X mūsų skaičiavimuose. Logit vertė yra:
Čia, b0, b1, ir b2 yra regresijos kintamieji.
- Ląstelėje įrašykite šią formulę E5 . Naudokite absoliuto ženklą, kad įšaldytumėte kintamųjų langelio vertę. Jei nežinote, kaip įvesti Absoliuti ląstelės nuoroda ženklą galite įvesti keliais būdais.
=$D$16+$D$17*C5+$D$18*D5
- Tada paspauskite Įveskite klaviatūros klavišą.
- Po to, dukart spustelėkite apie Užpildymo rankena piktogramą, kad nukopijuotumėte formulę iki ląstelės E14 .
- Gausite visas reikšmes X .
Skaityti daugiau: Kaip atlikti paprastą tiesinę regresiją "Excel" programa (4 paprasti metodai)
3 veiksmas: Nustatykite logit eksponentinę iš logit kiekvieniems duomenims
Čia apskaičiuosime logit reikšmės eksponentinę vertę, Tam naudosime EXP funkcija :
- Eksponentinei vertei nustatyti X , ląstelėje įrašykite šią formulę F5 :
=EXP(E5)
- Panašiai, dukart spustelėkite apie Užpildymo rankena piktogramą, kad nukopijuotumėte formulę, kaip ir ankstesniame žingsnyje. X .
4 veiksmas: apskaičiuokite tikimybės vertę
P(X) yra tikimybės, kad įvyks X įvykis. Įvykio tikimybė X galima apibrėžti kaip:
- Norėdami jį apskaičiuoti, ląstelėje įrašykite šią formulę G5 .
=F5/(1+F5)
- Paspauskite Įveskite raktas.
- Dabar vilkite Užpildymo rankena piktogramą iki G15 kad gautumėte visų verčių vertę.
Skaityti daugiau: Kaip apskaičiuoti P reikšmę tiesinės regresijos programoje "Excel" (3 būdai)
5 veiksmas: įvertinkite logaritminės tikimybės vertės sumą
Tolesniuose žingsniuose įvertinsime vertę Loginė tikimybė. Po to naudosime funkcija SUMA pridėti visus duomenis:
- Apskaičiuoti Loginė tikimybė reikšmę, naudosime LN funkcija mūsų duomenų rinkinyje. H5 , parašykite šią formulę:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Dabar paspauskite Įveskite klaviatūros klavišą.
- Tada, dukart spustelėkite apie Užpildymo rankena piktogramą, kad būtų nustatytos visos logaritminės tikimybės reikšmės.
- Po to ląstelėje H15 , užrašykite šią formulę visoms reikšmėms sudėti.
=SUMA(H5:H14)
🔍 Formulės suskirstymas
Mes atliekame šį suskirstymą į ląsteles H5 .
👉
LN(G5): Ši funkcija grąžina -0.384.
👉
LN(1-G5): Ši funkcija grąžina -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Ši funkcija grąžina -0.384.
6 veiksmas: galutinei analizei atlikti naudokite "Solver" analizės įrankį
Dabar atliksime galutinę regresinę analizę. Analizę atliksime naudodami Sprendiklis komandą. Jei jos nematote Duomenys kortelėje reikia įjungti Sprendiklis iš "Excel" papildiniai .
- Norėdami ją įjungti, pasirinkite Failas> parinktys .
- Dėl to buvo atidarytas dialogo langas, pavadintas "Excel" parinktys pasirodys.
- Šiame dialogo lange pasirinkite Papildiniai galimybė.
- Dabar pasirinkite "Excel" papildiniai parinktį Tvarkykite ir spustelėkite Eikite į .
- Nedidelis dialogo langas Papildiniai pasirodys.
- Tada patikrinkite Sprendiklio papildinys parinktį ir spustelėkite GERAI .
- Po to eikite į Duomenys skirtuką ir rasite Sprendiklis komanda Analizė grupė.
- Dabar spustelėkite Sprendiklis komanda.
- Naujas dialogo langas pavadinimu Sprendiklio parametrai pasirodys.
- Į Nustatyti tikslą langelį, pasirinkite langelį $H$15 taip pat galite įrašyti ląstelės nuorodą klaviatūra. Įsitikinkite, kad naudojate Absoliuti ląstelės nuoroda pasirašykite čia.
- Toliau, į Keičiant kintamuosius langelius parinktis pasirinkite ląstelių diapazoną $D$16:$D$18 .
- Tada panaikinkite žymėjimą Neįpareigojančių kintamųjų pavertimas neigiamaisiais kad gautumėte neigiamas reikšmes, jei jos jau yra pažymėtos.
- Galiausiai spustelėkite Išspręskite mygtuką.
- Dėl to Sprendiklio rezultatas priešais jus atsiras langas.
- Dabar pasirinkite Laikykite "Solver" sprendimą Šiame lange taip pat matysite, ar regresinė analizė sutapo, ar išsiskyrė.
- Spustelėkite GERAI uždaryti langelį.
- Galiausiai pamatysite kintamojo reikšmes langelių intervale D16:D18 Be to, taip pat matysite stulpelių reikšmes E, F, G , ir H taip pat rodo skirtumus, palyginti su ankstesniais etapais.
🔍 Dvejetainės regresinės analizės rezultatų iliustracija
Baigę dvinarės logistinės regresijos analizę "Excel" programoje, pamatysite, kad mūsų numanoma regresijos kintamojo reikšmė pakeista naująja analizės reikšme ir šios reikšmės yra teisinga mūsų duomenų rinkinio regresijos kintamojo reikšmė. Galime atsižvelgti į bet kokių konkrečių duomenų rezultatą, pvz. 68 mėnesių ir 4 vidutinė pamaina per savaitę. P(X) yra . 0.67 . Tai mums parodo, kad jei ieškosime veikiančios mašinos, tokio įvykio tikimybė yra apie 67% .
Jį taip pat galime parodyti atskirai, naudodami galutines regresijos kintamojo vertes.
Taigi, galime teigti, kad mūsų darbo procedūra pavyko ir galime atlikti dvinarės logistinės regresijos analizę.
Išvada
Tai yra šio straipsnio pabaiga. Tikiuosi, kad šis straipsnis jums bus naudingas ir galėsite atlikti logistinę regresiją "Excel" programoje. Prašome pasidalyti su mumis tolesniais klausimais ar rekomendacijomis toliau pateiktame komentarų skyriuje.
Nepamirškite patikrinti mūsų svetainės ExcelWIKI keletą su "Excel" susijusių problemų ir sprendimų. Mokykitės naujų metodų ir tobulėkite!