Viacnásobná regresná analýza pomocou programu Excel

  • Zdieľajte To
Hugh West

Jednoduchá regresia analýza sa bežne používa na odhad vzťahu medzi dvoma premennými, napríklad vzťahu medzi výnosmi plodín a zrážkami alebo vzťahu medzi chuťou chleba a teplotou v peci. častejšie však potrebujeme skúmať vzťah medzi závislou premennou a dvoma alebo viacerými nezávislými premennými. Napríklad realitný maklér môže chcieť vedieťči a ako súvisia ukazovatele ako veľkosť domu, počet spální a priemerný príjem v okolí s cenou, za ktorú sa dom predáva. Tento druh problému možno vyriešiť použitím viacnásobná regresná analýza. Tento článok vám poskytne prehľad o tom, ako používať viacnásobnú regresnú analýzu pomocou programu Excel.

Problém

Predpokladajme, že sme vzali 5 náhodne vybraných predajcov a zozbierali sme informácie podľa nasledujúcej tabuľky. Má vzdelanie alebo motivácia vplyv na ročný predaj alebo nie?

Najvyšší ukončený ročník školy Motivácia meraná Higginsovou motivačnou škálou Ročný predaj v dolároch
12 32 $350,000
14 35 $399,765
15 45 $429,000
16 50 $435,000
18 65 $433,000

Rovnica

Všeobecne, viacnásobná regresná analýza predpokladá, že medzi závislou premennou (y) a nezávislými premennými (x1, x2, x3 ... xn) existuje lineárny vzťah. A tento druh lineárneho vzťahu možno opísať pomocou nasledujúceho vzorca:

Y = konštanta + β1*x1 + β2*x2+...+ βn*xn

Tu sú vysvetlenia konštánt a koeficientov:

Y Predpokladaná hodnota Y
Neustále Intercept Y
β1 Zmena Y pri každej zmene x1 o 1 prírastok
β2 Zmena Y pri každej zmene x2 o 1 prírastok
... ...
βn Zmena Y pri každej zmene xn o 1 prírastok

Konštantu a β1, β2... βn môžete vypočítať na základe dostupných údajov o vzorke. Po získaní hodnôt konštanty, β1, β2... βn ich môžete použiť na vytvorenie predpovede.

Pokiaľ ide o náš problém, existujú len dva faktory, ktoré nás zaujímajú. Preto bude rovnica nasledovná:

Ročné tržby = konštanta + β1*(najvyšší ukončený ročník školy) + β2*(motivácia meraná Higginsovou stupnicou motivácie)

Nastavenie modelu

Ročné tržby, najvyšší ukončený ročník školy a Motivácia boli zadané do stĺpca A, stĺpca B a stĺpca C, ako je znázornené na obrázku 1. Je lepšie vždy uviesť závislú premennú (tu ročné tržby) pred nezávislými premennými.

Obrázok 1

Stiahnite si Analysis ToolPak

Excel nám ponúka funkciu Analýza údajov, ktorá dokáže vrátiť hodnoty konštánt a koeficientov. Pred použitím tejto funkcie si však musíte stiahnuť Analysis ToolPak. Tu je uvedený postup, ako si ho môžete nainštalovať.

Kliknite na Súbor tab -> Možnosti a potom kliknite na Doplnky na stránke Možnosti aplikácie Excel Dialógové okno. Kliknite na Prejsť na stránku tlačidlo v spodnej časti Možnosti aplikácie Excel otvorenie dialógového okna Doplnky dialógové okno. V Doplnky dialógové okno, vyberte Analýza TookPak začiarkavacie políčko a potom kliknite na Ok .

Ak teraz kliknete na Údaje na karte sa zobrazí Analýza údajov sa objaví v Analýza (pravý panel).

Obrázok 2 [kliknutím na obrázok sa zobrazí celý]

Viacnásobná regresná analýza

Kliknite na Analýza údajov v Analýza skupinu na Údaje tab. Vyberte Regresia Vo vyzvanom Analýza údajov dialógové okno. Môžete tiež vykonať iné štatistická analýza ako napríklad t-test, ANOVA a podobne.

Obrázok 3.1

A Regresia Po výbere položky sa zobrazí dialógové okno Regresia . vyplňte dialógové okno podľa obrázku 3.2.

Vstupný rozsah Y obsahuje závislú premennú a údaje, zatiaľ čo vstupný rozsah X obsahuje nezávislé premenné a údaje. Tu musím pripomenúť, že nezávislé premenné by mali byť v susedných stĺpcoch. A maximálny počet nezávislých premenných je 15.

Keďže rozsah A1: C1 obsahuje premenné štítky, a preto by malo byť zaškrtnuté políčko Štítky. V skutočnosti vám odporúčam zahrnúť štítky zakaždým, keď vypĺňate Vstupný rozsah Y a Vstupný rozsah X. Tieto štítky sú užitočné pri prezeraní súhrnných správ vrátených programom Excel.

Obrázok 3.2

Zaškrtnutím políčka Residuals (Rezíduá) môžete programu Excel povoliť, aby pre každé pozorovanie vypísal rezíduá. Pozrite sa na obrázok 1, celkovo je 5 pozorovaní a dostanete 5 rezíduí. Rezíduum je niečo, čo zostane, keď od pozorovanej hodnoty odpočítate predpovedanú hodnotu. Štandardizované rezíduum je rezíduum vydelené jeho štandardnou odchýlkou.

Môžete tiež zaškrtnúť políčko Residual Plot (Reziduálny graf), ktoré môže umožniť programu Excel vrátiť reziduálne grafy. Počet reziduálnych grafov sa rovná počtu nezávislých premenných. Reziduálny graf je graf, ktorý zobrazuje rezíduá na osi Y a nezávislé premenné na osi x. Náhodne rozptýlené body okolo osi x v reziduálnom grafe znamenajú, že lineárna regresia Napríklad na obrázku 3.3 sú znázornené tri typické vzory reziduálnych grafov. Iba ten v ľavom paneli naznačuje, že ide o dobrú zhodu s lineárnym modelom. Ostatné dva vzory naznačujú lepšiu zhodu s nelineárnym modelom.

Obrázok 3.3

Excel vráti fitovaný lineárny graf, ak zaškrtnete políčko Line Fit Plots (Fitované lineárne grafy). Fitovaný lineárny graf môže vykresliť vzťah medzi jednou závislou premennou a jednou nezávislou premennou. Inými slovami, Excel vám vráti rovnaký počet fitovaných lineárnych grafov s tým, že ide o nezávislú premennú. Napríklad pre náš problém dostanete 2 fitované lineárne grafy.

Výsledky

Po kliknutí na tlačidlo Ok vám Excel vráti súhrnnú správu, ako je uvedené nižšie. Zelene a žlto zvýraznené bunky sú najdôležitejšou časťou, ktorej by ste mali venovať pozornosť.

Obrázok 3.4

Čím vyšší je R-kvadrát (bunka F5), tým tesnejší vzťah existuje medzi závislými premennými a nezávislými premennými. A koeficienty (rozsah F17: F19) v tretej tabuľke vám vrátili hodnoty konštánt a koeficientov. Rovnica by mala byť Ročné tržby = 1589,2 + 19928,3*(Najvyšší ukončený ročník školy) + 11,9*(Motivácia meraná Higginsovou motivačnou škálou).

Aby ste však zistili, či sú výsledky spoľahlivé, musíte skontrolovať aj žlto zvýraznené p-hodnoty. Len ak je p-hodnota v bunke J12 menšia ako 0,05, celá regresná rovnica je spoľahlivá. Musíte však skontrolovať aj p-hodnoty v rozsahu I17: I19, aby ste zistili, či sú konštanta a nezávislé premenné užitočné pre predikciu závislej premennej. V prípade nášho problému je pre nás lepšie vyradiťmotivácia pri posudzovaní nezávislých premenných.

Čítajte viac: Ako vypočítať hodnotu P v lineárnej regresii v programe Excel (3 spôsoby)

Odstrániť motiváciu z nezávislých premenných

Po odstránení motivácie ako nezávislej premennej som použil rovnaký prístup a vykonal jednoduchú regresnú analýzu. Môžete vidieť, že všetky hodnoty sú teraz menšie ako 0,05. Konečná rovnica by mala byť:

Ročné tržby = 1167,8 + 19993,3*(najvyšší ukončený ročník školy)

Obrázok 3.5 [kliknutím na obrázok sa zobrazí celý]

Poznámka

Obrázok 4

Okrem nástroja Add-Ins môžete na vykonanie viacnásobnej regresnej analýzy použiť aj funkciu LINEST. Funkcia LINEST je funkcia poľa, ktorá môže vrátiť výsledok buď v jednej bunke, alebo v rozsahu buniek. Najprv vyberte rozsah A8:B12 a potom do prvej bunky tohto rozsahu (A8) zadajte vzorec "=LINEST (A2:A6, B2:B6, TRUE, TRUE)". Po stlačení klávesovej skratky CTRL + SHIFT +ENTER program Excel vráti výsledky akonižšie. Porovnaním s obrázkom 3.4 vidíte, že 19993,3 je koeficient Najvyššieho ukončeného ročníka školy, zatiaľ čo 1167,8 je konštantný. V každom prípade vám odporúčam použiť nástroj Add-Ins. Je to oveľa jednoduchšie.

Čítajte viac...

Reverzná analýza What-If v programe Excel

Ako používať záložné znaky v programe Excel?

Stiahnite si pracovný súbor

Pracovný súbor si stiahnite z nižšie uvedeného odkazu.

Viacnásobná regresná analýza.xlsx

Hugh West je veľmi skúsený tréner a analytik Excelu s viac ako 10-ročnými skúsenosťami v tomto odvetví. Má bakalársky titul v odbore účtovníctvo a financie a magisterský titul v odbore Business Administration. Hugh má vášeň pre vyučovanie a vyvinul jedinečný vyučovací prístup, ktorý sa dá ľahko sledovať a pochopiť. Jeho odborné znalosti Excelu pomohli tisíckam študentov a profesionálov na celom svete zlepšiť svoje zručnosti a vyniknúť vo svojej kariére. Hugh sa prostredníctvom svojho blogu delí o svoje znalosti so svetom a ponúka bezplatné výukové programy Excelu a online školenia, ktoré jednotlivcom a firmám pomôžu naplno využiť ich potenciál.