Obsah
Regresná analýza je široko používaný štatistický výpočet. Tento typ výpočtu často vykonávame podľa nášho želania. V programe Excel môžeme vykonať viaceré typy regresnej analýzy . V tomto článku si ukážeme, ako urobiť logistickú regresiu v programe Excel. Ak máte aj vy záujem naučiť sa túto analýzu, stiahnite si cvičný zošit a nasledujte nás.
Stiahnite si cvičebnicu
Počas čítania tohto článku si stiahnite tento cvičebnicu na precvičenie.
Logistická regresia.xlsx
Čo je logistická regresia?
Logistická regresná analýza je štatistický algoritmus učenia, ktorý sa používa na predpovedanie hodnoty závislej premennej na základe niektorých nezávislých kritérií. Pomáha človeku získať výsledok z veľkého súboru údajov na základe jeho požadovanej kategórie. Logistická regresná analýza má hlavne tri typy:
- Binárna logistická regresia
- Multinomiálna logistická regresia
- Ordinálna logistická regresia
Binárna logistická regresia: V modeli binárnej regresnej analýzy definujeme kategóriu len dvoma prípadmi. Áno/Nie alebo Pozitívne/Negatívne.
Multinomiálna logistická regresia: Multinominálna logistická analýza pracuje s tromi alebo viacerými klasifikáciami. Ak máme viac ako dve klasifikované časti na kategorizáciu našich údajov, môžeme použiť tento model regresnej analýzy.
Ordinálna logistická regresia: Tento model regresnej analýzy funguje pre viac ako dve kategórie. V tomto modeli však potrebujeme vopred určené poradie na ich kategorizáciu.
Postup krok za krokom na vykonanie logistickej regresie v programe Excel
V tomto článku vykonáme binárnu logistickú regresnú analýzu. Tento typ analýzy nám poskytuje predikciu hodnoty požadovanej premennej. Na vykonanie analýzy uvažujeme súbor údajov 10 strojov z odvetvia. Dostupnosť stroja môže byť kladná alebo záporná. Binárne číslice 1=pozitívny a 0 = záporná hodnota a tieto hodnoty sú uvedené v stĺpci B Vek týchto strojov je v stĺpci C a ich priemerný počet hodín služby za týždeň je v stĺpci D Náš súbor údajov je teda v rozsahu buniek B5:D14 Hodnoty počiatočnej premennej regresného riešiteľa sú v rozsahu buniek C16:D18 Celý postup analýzy je vysvetlený nižšie krok za krokom:
Krok 1: Zadanie súboru údajov
V tomto kroku budeme importovať súbor údajov:
- Najskôr presne zadajte súbor údajov do programu Excel. Pre našu analýzu sme súbor údajov zadali v rozsahu buniek B5:D14 .
- Potom zadajte Riešiteľ Rozhodovacie premenné' Zadávame ich v rozsahu buniek D16:D18.
- Predpokladáme, že všetky hodnoty premenných sú 0.01 .
Prečítajte si viac: Viacnásobná lineárna regresia na súboroch údajov programu Excel (2 metódy)
Krok 2: Vyhodnotenie hodnoty logitu
V tomto kroku vypočítame Logit pre náš súbor údajov. Definujeme Logit hodnotu ako X v našom výpočte. Vzorec Logit hodnota je:
Tu, b0, b1, a b2 sú regresné premenné.
- Do bunky zapíšte nasledujúci vzorec E5 . Na zmrazenie hodnoty premenných v bunke použite znak Absolute. Ak neviete, ako zadať Absolútny odkaz na bunku môžete zadať niekoľkými spôsobmi.
=$D$16+$D$17*C5+$D$18*D5
- Potom stlačte tlačidlo Vstúpte na stránku na klávesnici.
- Potom, dvakrát kliknite na stránku . na Rukoväť náplne skopírovať vzorec do bunky E14 .
- Získate všetky hodnoty X .
Prečítajte si viac: Ako vykonať jednoduchú lineárnu regresiu v programe Excel (4 jednoduché metódy)
Krok 3: Určenie exponenciály logitu pre každý údaj
Tu vypočítame exponenciálnu hodnotu logitu, Na tento účel použijeme funkcia EXP :
- Určenie exponenciálnej hodnoty X , zapíšte do bunky nasledujúci vzorec F5 :
=EXP(E5)
- Podobne, dvakrát kliknite na stránku . na Rukoväť náplne ikonu na skopírovanie vzorca ako v predchádzajúcom kroku. Všetky exponenciálne hodnoty X .
Krok 4: Výpočet hodnoty pravdepodobnosti
P(X) je hodnota pravdepodobnosti výskytu X udalosť. Pravdepodobnosť udalosti X možno definovať ako:
- Ak ho chcete vypočítať, zapíšte do bunky nasledujúci vzorec G5 .
=F5/(1+F5)
- Stlačte tlačidlo Vstúpte na stránku kľúč.
- Teraz potiahnite Rukoväť náplne ikonu až do G15 na získanie hodnoty pre všetky hodnoty.
Prečítajte si viac: Ako vypočítať hodnotu P pri lineárnej regresii v programe Excel (3 spôsoby)
Krok 5: Vyhodnotenie súčtu hodnoty logaritmu
V nasledujúcich krokoch vyhodnotíme hodnotu Logaritmická pravdepodobnosť. Potom použijeme funkcia SUM pridať všetky údaje:
- Výpočet Logaritmická pravdepodobnosť použijeme hodnotu LN funkcia v našom súbore údajov. V bunke H5 , napíšte nasledujúci vzorec:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Teraz stlačte tlačidlo Vstúpte na stránku na klávesnici.
- Potom, dvakrát kliknite na stránku . na Rukoväť náplne na určenie všetkých hodnôt logaritmickej pravdepodobnosti.
- Potom v bunke H15 , zapíšte nasledujúci vzorec na sčítanie všetkých hodnôt.
=SUM(H5:H14)
🔍 Rozdelenie vzorca
Toto rozdelenie robíme pre bunky H5 .
👉
LN(G5): Táto funkcia vracia -0.384.
👉
LN(1-G5): Táto funkcia vracia -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Táto funkcia vracia -0.384.
Krok 6: Použitie nástroja Solver Analysis Tool na konečnú analýzu
Teraz vykonáme záverečnú regresnú analýzu. Analýzu vykonáme prostredníctvom Riešiteľ Ak ho nevidíte v príkaze Údaje musíte povoliť kartu Riešiteľ z Doplnky programu Excel .
- Ak ju chcete povoliť, vyberte Súbor> Možnosti .
- Výsledkom je dialógové okno s názvom Možnosti aplikácie Excel sa objaví.
- V tomto dialógovom okne vyberte Doplnky možnosť.
- Teraz vyberte Doplnky programu Excel možnosť v Spravujte stránku a kliknite na Prejsť na stránku .
- Malé dialógové okno s názvom Doplnky sa objaví.
- Potom skontrolujte Doplnok Solver a kliknite na možnosť OK .
- Potom prejdite na Údaje a nájdete kartu Riešiteľ príkaz v Analýza skupina.
- Teraz kliknite na Riešiteľ príkaz.
- Zobrazí sa nové dialógové okno s názvom Parametre riešiteľa sa objaví.
- V Stanovenie cieľa vyberte bunku $H$15 odkaz na bunku môžete napísať aj na klávesnici. Uistite sa, že používate Absolútny odkaz na bunku podpísať tu.
- Ďalej v Zmenou premenných buniek možnosť vyberte rozsah buniek $D$16:$D$18 .
- Potom zrušte začiarknutie políčka Urobiť nezáporné premenné nezápornými na získanie záporných hodnôt, ak sa už zobrazuje ako začiarknuté.
- Nakoniec kliknite na Riešenie tlačidlo.
- V dôsledku toho sa Výsledok riešenia pred vami sa zobrazí okno.
- Teraz vyberte Uchovávajte riešenie Solver Toto okno vám tiež ukáže, či vaša regresná analýza konvergovala alebo divergovala.
- Kliknite na . OK na zatvorenie poľa.
- Nakoniec sa zobrazia hodnoty premennej v rozsahu buniek D16:D18 Okrem toho sa zobrazia aj hodnoty stĺpcov E, F, G a H tiež vykazujú rozdiely oproti predchádzajúcim krokom.
🔍 Ilustrácia výsledku binárnej regresnej analýzy
Po dokončení binárnej logistickej regresnej analýzy v programe Excel uvidíte, že naša predpokladaná hodnota regresnej premennej je nahradená novou hodnotou analýzy a tieto hodnoty sú správnou hodnotou regresnej premennej nášho súboru údajov. Za výsledok môžeme považovať akýkoľvek konkrétny údaj, napríklad stroj, ktorý má vek 68 mesiacov a 4 priemerne žiadna zmena za týždeň. Hodnota P(X) je . 0.67 . To nám ilustruje, že ak hľadáme stroj v pracovnom stave, možnosť tejto udalosti je asi 67% .
Môžeme ho zobraziť aj samostatne, pomocou konečných hodnôt regresnej premennej.
Môžeme teda povedať, že náš pracovný postup fungoval úspešne a sme schopní vykonať binárnu logistickú regresnú analýzu.
Záver
To je koniec tohto článku. Dúfam, že tento článok bude pre vás užitočný a budete môcť robiť logistickú regresiu v programe Excel. Podeľte sa s nami o ďalšie otázky alebo odporúčania v sekcii komentárov nižšie.
Nezabudnite si pozrieť našu webovú stránku ExcelWIKI pre niekoľko problémov a riešení súvisiacich s programom Excel. Učte sa nové metódy a pokračujte v raste!