Jak provést logistickou regresi v aplikaci Excel (v rychlých krocích)

  • Sdílet Toto
Hugh West

Regresní analýza je hojně používaný statistický výpočet. Tento typ výpočtu často provádíme podle našeho přání. V Excelu můžeme provést např. více typů regresní analýzy . V tomto článku si ukážeme, jak provést logistickou regresi v Excelu. Pokud máte také zájem naučit se tuto analýzu, stáhněte si cvičný sešit a následujte nás.

Stáhnout cvičebnici

Při čtení tohoto článku si stáhněte tento cvičný sešit k procvičování.

Logistická regrese.xlsx

Co je logistická regrese?

Logistická regresní analýza je algoritmus statistického učení, který se používá k předpovídání hodnoty závislé proměnné na základě některých nezávislých kritérií. Pomáhá člověku získat výsledek z velkého souboru dat na základě jeho požadované kategorie. Logistická regresní analýza má především tři typy:

  1. Binární logistická regrese
  2. Multinomiální logistická regrese
  3. Ordinální logistická regrese

Binární logistická regrese: V modelu binární regresní analýzy definujeme kategorii pouze dvěma případy: Ano/Ne nebo Pozitivní/Negativní.

Multinomiální logistická regrese: Multinominální logistická analýza pracuje se třemi a více klasifikacemi. Pokud máme více než dva klasifikované úseky pro kategorizaci našich dat, pak můžeme použít tento model regresní analýzy.

Ordinální logistická regrese: Tento model regresní analýzy funguje pro více než dvě kategorie. V tomto modelu však potřebujeme předem stanovené pořadí pro jejich kategorizaci.

Postup krok za krokem pro provedení logistické regrese v aplikaci Excel

V tomto článku provedeme binární logistickou regresní analýzu. Tento typ analýzy nám poskytne předpověď hodnoty požadované proměnné. Pro provedení analýzy uvažujeme soubor dat 10 strojů z určitého odvětví. Dostupnost stroje může být kladná nebo záporná. Binární číslice 1=pozitivní a 0 = záporná hodnota a tyto hodnoty jsou uvedeny ve sloupci B Stáří těchto strojů je uvedeno ve sloupci C a jejich průměrná týdenní pracovní doba je uvedena ve sloupci D . Náš soubor dat je tedy v rozsahu buněk B5:D14 . Hodnoty počáteční proměnné regresního řešitele jsou v rozsahu buněk C16:D18 Celý postup analýzy je vysvětlen níže krok za krokem:

Krok 1: Zadání datové sady

V tomto kroku naimportujeme vaši datovou sadu:

  • Nejprve do Excelu přesně zadejte soubor dat. Pro naši analýzu zadáme soubor dat v rozsahu buněk B5:D14 .

  • Poté zadejte Řešitel Rozhodnutí Proměnné' Zadáváme je v rozsahu buněk D16:D18.
  • Předpokládáme, že hodnoty všech proměnných jsou takové. 0.01 .

Přečtěte si více: Vícenásobná lineární regrese na souborech dat aplikace Excel (2 metody)

Krok 2: Vyhodnocení hodnoty logitu

V tomto kroku vypočítáme hodnotu Logit pro náš soubor dat. Definujeme hodnotu Logit hodnotu jako X v našem výpočtu. Vzorec Logit hodnota je:

Zde, b0, b1, a b2 jsou regresní proměnné.

  • Do buňky zapište následující vzorec E5 . Pro zmrazení hodnoty proměnných v buňce použijte znaménko Absolutní. Pokud nevíte, jak zadávat Absolutní odkaz na buňku můžete zadat několika způsoby.

=$D$16+$D$17*C5+$D$18*D5

  • Pak stiskněte tlačítko Vstupte na na klávesnici.

  • Poté, dvakrát klikněte na adresu na Plnicí rukojeť zkopírovat vzorec až do buňky E14 .

  • Získáte všechny hodnoty X .

Přečtěte si více: Jak provést jednoduchou lineární regresi v aplikaci Excel (4 jednoduché metody)

Krok 3: Určení exponenciály logitu pro každý údaj

Zde vypočítáme exponenciální hodnotu logitu, K tomu použijeme metodu funkce EXP :

  • Určení exponenciální hodnoty X , zapište do buňky následující vzorec F5 :

=EXP(E5)

  • Podobně, dvakrát klikněte na adresu na Plnicí rukojeť zkopírujete vzorec jako v předchozím kroku. Všechny exponenciální hodnoty X .

Krok 4: Výpočet hodnoty pravděpodobnosti

P(X) je hodnota pravděpodobnosti výskytu X událost. Pravděpodobnost události X lze definovat jako:

  • Chcete-li ji vypočítat, zapište do buňky následující vzorec G5 .

=F5/(1+F5)

  • Stiskněte tlačítko Vstupte na klíč.
  • Nyní přetáhněte Plnicí rukojeť ikonu až do G15 získat hodnotu pro všechny hodnoty.

Přečtěte si více: Jak vypočítat hodnotu P při lineární regresi v aplikaci Excel (3 způsoby)

Krok 5: Vyhodnocení součtu hodnot logaritmické pravděpodobnosti

V následujících krocích vyhodnotíme hodnotu Logaritmická pravděpodobnost. Poté použijeme funkce SUM přidat všechna data:

  • Výpočet Logaritmická pravděpodobnost použijeme hodnotu LN funkce v našem souboru dat. V buňce H5 , napište následující vzorec:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Nyní stiskněte tlačítko Vstupte na na klávesnici.

  • Pak, dvakrát klikněte na adresu na Plnicí rukojeť pro určení všech hodnot logaritmické pravděpodobnosti.

  • Poté v buňce H15 , zapište následující vzorec pro součet všech hodnot.

=SUMA(H5:H14)

🔍 Rozdělení vzorce

Toto rozdělení provádíme pro buňky H5 .

👉 LN(G5): Tato funkce vrací -0.384.

👉 LN(1-G5): Tato funkce vrací -1.144.

👉 (B5*LN(G5))+((1-B5)*LN(1-G5)): Tato funkce vrací -0.384.

Krok 6: Použití nástroje Solver Analysis Tool pro konečnou analýzu

Nyní provedeme závěrečnou regresní analýzu. Analýzu provedeme pomocí nástroje Řešitel Pokud jej nevidíte v příkazu Data na kartě je třeba povolit Řešitel z Doplňky aplikace Excel .

  • Chcete-li ji povolit, vyberte možnost Soubor> Možnosti .

  • V důsledku toho se zobrazí dialogové okno s názvem Možnosti aplikace Excel se objeví.
  • V tomto dialogovém okně vyberte Doplňky možnost.
  • Nyní vyberte Doplňky aplikace Excel možnost v Správa a klikněte na tlačítko Přejít na .

  • Zobrazí se malé dialogové okno s názvem Doplňky se objeví.
  • Pak zkontrolujte Doplněk Solver a klikněte na možnost OK .

  • Poté přejděte do Data na kartě najdete Řešitel v příkazu Analýza skupina.

  • Nyní klikněte na Řešitel příkaz.
  • Zobrazí se nové dialogové okno s názvem Parametry řešitele se objeví.
  • V Stanovení cíle vyberte buňku $H$15 můžete také napsat odkaz na buňku na klávesnici. Ujistěte se, že jste použili Absolutní odkaz na buňku podepište se zde.
  • Dále v Změnou proměnných buněk možnost vybrat rozsah buněk $D$16:$D$18 .
  • Potom zrušte zaškrtnutí políčka Udělejte neomezené proměnné nezápornými abyste získali záporné hodnoty, pokud se již zobrazují jako zaškrtnuté.
  • Nakonec klikněte na Řešení tlačítko.

  • V důsledku toho se Řešitel Výsledek před vámi se objeví okno.
  • Nyní vyberte Řešení Keep Solver V tomto rámečku se také zobrazí, zda regresní analýza konvergovala nebo divergovala.
  • Klikněte na OK zavřete rámeček.

  • Nakonec se zobrazí hodnoty proměnné v rozsahu buněk. D16:D18 Kromě toho se zobrazí také hodnoty sloupců E, F, G a H se rovněž liší od předchozích kroků.

🔍 Ilustrace výsledku binární regresní analýzy

Po dokončení binární logistické regresní analýzy v Excelu uvidíte, že naše předpokládaná hodnota regresní proměnné je nahrazena novou hodnotou analýzy a tyto hodnoty jsou správnou hodnotou regresní proměnné našeho souboru dat. Můžeme uvažovat výsledek jakýchkoli konkrétních dat, jako je stroj, který má věk 68 měsíců a 4 průměrně žádná směna za týden. Hodnota P(X) je 0.67 . To nám ilustruje, že pokud budeme hledat stroj v provozním stavu, možnost této události je o 67% .

Můžeme ji také zobrazit samostatně pomocí konečných hodnot regresní proměnné.

Můžeme tedy říci, že náš pracovní postup úspěšně fungoval a jsme schopni provést binární logistickou regresní analýzu.

Závěr

To je konec tohoto článku. Doufám, že vám tento článek pomůže a budete umět provádět logistickou regresi v Excelu. O případné další dotazy nebo doporučení se s námi podělte v komentářích níže.

Nezapomeňte se podívat na naše webové stránky ExcelWIKI pro několik problémů a řešení souvisejících s Excelem. Učte se novým metodám a neustále se rozvíjejte!

Hugh West je velmi zkušený školitel a analytik Excelu s více než 10 lety zkušeností v oboru. Má bakalářský titul v oboru Účetnictví a finance a magisterský titul v oboru Business Administration. Hugh má vášeň pro výuku a vyvinul jedinečný přístup k výuce, který lze snadno sledovat a pochopit. Jeho odborné znalosti Excelu pomohly tisícům studentů a profesionálů po celém světě zlepšit své dovednosti a vyniknout ve své kariéře. Prostřednictvím svého blogu Hugh sdílí své znalosti se světem a nabízí bezplatné výukové programy Excelu a online školení, které jednotlivcům a firmám pomohou dosáhnout jejich plného potenciálu.