Ako interpretovať výsledky regresie v programe Excel (podrobná analýza)

Obsah

Regresná analýza je takmer v každom type štatistického softvéru, ako napr. SPSS , R, Regresia nám môže poskytnúť celkový obraz o vzťahoch medzi premennými. Lineárnu regresiu možno v Exceli vykonať pomerne rýchlo pomocou funkcie Analýza údajov Tento článok vám ukáže, ako môžete interpretovať výsledky regresie v programe Excel.

Stiahnite si cvičebnicu

Stiahnite si tento cvičebnicu nižšie.

Interpretácia výsledkov regresie.xlsx

Čo je regresia?

Regresná analýza sa často používa pri analýze údajov na určenie súvislostí medzi viacerými premennými. Regresná analýza umožňuje vybrať, čo sa stane so závislou premennou, ak sa zmení jedna z nezávislých premenných. Umožňuje tiež matematicky zistiť, ktoré nezávislé premenné majú vplyv.

Jednoduchá lineárna regresia sa líši od a viacnásobná lineárna regresia v štatistike. Pomocou lineárnej funkcie, jednoduchej lineárne regresné analýzy spojenie medzi premennými a jednou nezávislou premennou. Viacnásobná lineárna regresia je, keď sa na určenie premenných používajú dva alebo viac vysvetľujúcich faktorov. Použitie nelineárnej regresie namiesto závislej premennej sa označuje ako nelineárna funkcia, pretože vzťahy medzi údajmi nie sú lineárne. Tento článok sa zameria na viacnásobná lineárna regresia ukázať, ako môžete interpretovať výsledky regresie v programe Excel.

Kroky na vykonanie regresie v programe Excel

Na účely regresie použijeme na analýzu nižšie uvedený súbor údajov. Tu bude nezávislou premennou Cena stĺpec a Predáva sa na stĺpec. nezávislý stĺpec bude Dopyt stĺpec.

Kroky

Musíme ísť do Údaje a kliknite na kartu Analýza údajov vykonávať regresiu .

Zobrazí sa nové okno; vyberte rozsah údajov závislej premennej a nezávislej premennej.
Potom začiarknite políčko Štítky box a Dôvera box.
Potom kliknite na pole rozsahu výstupných buniek a vyberte adresu výstupnej bunky
Potom začiarknite políčko Zvyšok na výpočet rezíduí.
Potom začiarknite políčko Zvyšok pozemky a Polia Line Fit Plots
Kliknite na . OK po tomto.

Po kliknutí na V PORIADKU, primárne výstupné parametre analýzy budú v zadaných bunkách.

Potom získate aj niektoré parametre, ako napr. Význam hodnota atď. v ANOVA ( Analýza odchýlok ) tabuľka.
Tu, df označuje stupeň voľnosti súvisiaci so zdrojom rozptylu.
SS označuje súčet štvorcov. Váš model bude lepšie odrážať údaje, ak Zvyšok SS je menšia ako Celkom SS.
MS znamená štvorcový.
F označuje F -test nulovej hypotézy.
Významnosť F označuje P -hodnota F .

V tabuľke potom získate aj koeficienty premennej, hodnotu významnosti atď.

Potom sa pod tabuľkou koeficientov zobrazí konečná tabuľka, ktorá obsahuje reziduálnu hodnotu pre každú položku.

Ďalej získate Dopyt vs Cena regresný graf s trendovou čiarou.

Potom získate Dopyt vs Predáva sa na regresný graf s trendovou čiarou.

Existuje ďalší graf, ktorý zobrazuje rozdelenie rezíduí jednotlivých položiek z Predáva sa na premenná.

Existuje ďalší graf, ktorý zobrazuje rozdelenie rezíduí jednotlivých položiek z Cena premenná.

Ďalej vám ukážeme, ako môžete tieto výsledky regresie interpretovať v programe Excel.

Prečítajte si viac: Ako vykonať logistickú regresiu v programe Excel (s rýchlymi krokmi)

Ako interpretovať výsledky regresie v programe Excel

Ďalšia vec, ktorú musíte urobiť po vykonaní regresnej analýzy a interpretovať ich. Výsledky sú opísané a rozpracované nižšie.

Viacnásobná analýza regresnej hodnoty R-Squared

Stránka R-kvadrát číslo udáva, ako úzko sú prvky súboru údajov prepojené a ako dobre regresná priamka zodpovedá údajom. Použijeme viacnásobnú lineárnu regresnú analýzu, pri ktorej budeme zisťovať vplyv dvoch alebo viacerých premenných na hlavný faktor. Ide o to, ako sa mení závislá premenná pri zmene jednej z nezávislých premenných. Rozsah tohto koeficientu je od-1 až 1. Tu,

1 znamená blízky pozitívny vzťah
0 znamená, že medzi premennými neexistujú žiadne vzťahy. Inými slovami, dátové body sú náhodné.
-1 znamená inverzný alebo negatívny vzťah medzi premennými.

Vo vyššie uvedených výstupných výsledkoch je násobná hodnota R daných súborov údajov o,7578( približne ), čo naznačuje silné vzťahy medzi premennými.

R Squared

R na druhú hodnota vysvetľuje, ako sa mení odozva závislých premenných na nezávislú premennú. V našom prípade je hodnota 0,574 (približne), čo možno interpretovať ako pomerne dobrý vzťah medzi premennými.

Upravený R-Squared

Toto je len alternatívna verzia R na druhú hodnota. Tým sa jednoducho premieša prediktor premenných pri predpovedaní odpoveď Vypočíta sa ako

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Tu, R^2 : The R^2 hodnotu, ktorú sme získali zo súboru údajov.

n : počet pozorovaní.

K : počet prediktívnych premenných.

Význam tejto hodnoty vzniká pri regresnej analýze medzi dvoma prediktor premenné. Ak existuje viac ako jedna prediktor v súbore údajov, potom bude hodnota R štvorca nadhodnotená, čo je veľmi nežiaduce. R na druhú hodnota upravuje túto infláciu a poskytuje presný obraz premenných.

Štandardná chyba

Ďalšia metrika dobrej zhody, ktorá udáva presnosť regresnej analýzy; čím je hodnota nižšia, tým istejší si môžete byť vo svojej regresnej analýze.

Štandardná chyba je empirická metrika, ktorá predstavuje priemernú vzdialenosť, v ktorej sa body odchyľujú od trendovej čiary, R2 predstavuje podiel variability závislej premennej. V tomto prípade je hodnota Štandardná chyba je 288,9 ( približne ), čo znamená, že naše dátové body v priemere klesajú o 288,9 od trendovej čiary.

Pozorovania

Uveďte počet pozorovaní alebo záznamov.

Určenie významnej premennej

Stránka Hodnota významnosti označuje dôveryhodnosť (štatistickú spoľahlivosť) našej analýzy. Inými slovami, označuje pravdepodobnosť, že náš súbor údajov je nesprávny. Táto hodnota by mala byť nižšia ako 5 %. V tomto prípade je však naša hodnota významnosti 0,00117, čo znamená 0,1 %, čo je výrazne pod 5 %. Naša analýza je teda v poriadku. V opačnom prípade budeme musieť pre našu analýzu zvoliť iné premenné.

P-hodnota v regresnej analýze

Úzko spojená s významnou hodnotou, tzv. P-hodnota označuje pravdepodobnosť nesprávnej hodnoty koeficientu. P-hodnota označuje súvislosť nulovej hypotézy s premennými.

Ak váš p-hodnota <the Význam číslo, existuje dostatok dôkazov na zamietnutie hypotézy o nulovej hodnote. To znamená, že medzi premennými existuje nenulová korelácia.

Ale ak p-hodnota > Význam hodnota, nebude dostatočný dôkaz na zamietnutie nulovej hypotézy. To znamená, že medzi premennými nemôže existovať žiadna korelácia.

V takomto prípade sa P-hodnota premennej Cena =0,000948 <0,00117 (hodnota významnosti),

Neexistuje tu teda nulová hypotéza a existuje dostatok dôkazov na to, aby sme mohli vyhlásiť koreláciu medzi premennými.

Pozri tiež: Ako vytvoriť kalkulačku kilometrov ZIP na ZIP v programe Excel (2 efektívne spôsoby)

Na druhej strane, pre premennú Predáva sa na (P-hodnota) 0,0038515 <0,0011723 (hodnota významnosti)

Mohla by tu teda platiť nulová hypotéza a neexistuje dostatok dôkazov na vyhlásenie nenulovej korelácie medzi premennými.

Vo väčšine prípadov táto P-hodnota určuje, či premenná bude v súbore údajov alebo nie. Predáva sa na premennú, aby sa zachovala robustnosť súboru údajov.

Regresná rovnica

Keďže v programe Excel určíme lineárnu regresnú analýzu, aj trendová čiara by mala byť lineárna. Všeobecný tvar je:

Y=mX+C.

Tu, Y je závislá premenná.

A X je tu nezávislá premenná, čo znamená, že budeme určovať vplyv zmeny premennej x na premennú Y.

C bude práve hodnota priesečníka osi Y tejto priamky.

V tomto prípade sa hodnota intercepcie C rovná 9502,109853

A hodnota m pre tieto dve premenné je -809,265 a 0,424818.

Máme teda konečnú rovnicu pre dve samostatné premenné.

Prvý z nich je:

Y=-809.265771X+9502.12

Rovnica pre druhú premennú je:

Y=0,4248X+9502,12

Koeficienty

Koeficienty, ktoré sme dostali, sú m1=-809.2655 a m2=04248 . A interceptor, C= 9502.12 .

Po prvé, hodnota interceptora naznačuje, že dopyt bude 9502, keď je cena nulová.
A hodnoty m Hodnota cenového koeficientu je -809,265, čo znamená, že zvýšenie ceny na jednotku zníži dopyt približne o 809 jednotiek.
Pre druhú premennú, Predané, je hodnota m 0,424. To znamená, že zmena na jednotku predanej položky bude mať za následok 0424-násobné jednotkové zvýšenie produktu.

Zvyšky

Stránka Zvyšok rozdiel medzi pôvodným a vypočítaným údajom z regresnej priamky je rozdiel. Zvyšky udávajú, ako je skutočná hodnota vzdialená od priamky. Napríklad vypočítaný údaj z regresnej analýzy pre prvý údaj je 9497. A prvá pôvodná hodnota je 9500. Takže rezíduum je približne 2,109.

Hodnota T-štatistiky

Hodnota T-štatistiky je podiel koeficientu a štandardnej hodnoty. Čím je hodnota vyššia, tým vyššiu spoľahlivosť koeficient vykazuje.

Pozri tiež: Ako urobiť zošit programu Excel len na čítanie s heslom (s jednoduchými krokmi)

Táto hodnota má ešte jeden význam, ktorý je potrebný na vypočítať P-hodnotu.

95 % interval spoľahlivosti

Tu sme na začiatku nastavili dôveru premennej na 95. Môže sa však zmeniť.

Tu sa hodnota koeficientu dolných 95 % vypočíta ako 8496,84, čo znamená, že horných 95 % sa vypočíta ako 10507,37,
To znamená, že hoci náš hlavný koeficient je približne 9502,1, existuje vysoká pravdepodobnosť, že v 95 % prípadov môže byť hodnota nižšia ako 8496 a 5 % pravdepodobnosť, že bude vyššia ako 10507,37.

Prečítajte si viac:

Čo si treba zapamätať

✎ Metóda regresnej analýzy výlučne posudzuje vzťah medzi skúmanými premennými. Nestanovuje príčinnú súvislosť. Inými spôsobmi sa posudzuje len aspekt korelácie. Keď nejaký čin niečo spôsobuje, stáva sa príčinou. Keď zmena jednej premennej spôsobuje zmeny, možno to považovať za príčinu.

✎ Regresnú analýzu výrazne sťažujú odľahlé hodnoty. Pred vykonaním analýzy je potrebné odstrániť všetky druhy odľahlých hodnôt. Ak chcete analyzovať a interpretovať výsledky regresnej analýzy v programe Excel, musíte zohľadniť tieto body.

Záver

Ak to zhrnieme, na otázku "ako interpretovať výsledky regresie v programe Excel" sa odpovedá ich podrobnou analýzou a následnou interpretáciou. Analýza sa vykonáva prostredníctvom Analýza údajov nástroj v Údaje tab.

K tomuto problému je k dispozícii na stiahnutie pracovný zošit, v ktorom si môžete precvičiť regresnú analýzu a interpretovať ju.

Neváhajte položiť akékoľvek otázky alebo spätnú väzbu prostredníctvom sekcie komentárov. Akékoľvek návrhy na zlepšenie Exceldemy komunita bude vysoko cenená.

Predchádzajúci príspevok Jedinečné hodnoty COUNTIFS v programe Excel (3 jednoduché spôsoby)

Ďalší príspevok Ako vytvoriť dvojitý stĺpcový graf v programe Excel (s jednoduchými krokmi)

Hugh West

Hugh West je veľmi skúsený tréner a analytik Excelu s viac ako 10-ročnými skúsenosťami v tomto odvetví. Má bakalársky titul v odbore účtovníctvo a financie a magisterský titul v odbore Business Administration. Hugh má vášeň pre vyučovanie a vyvinul jedinečný vyučovací prístup, ktorý sa dá ľahko sledovať a pochopiť. Jeho odborné znalosti Excelu pomohli tisíckam študentov a profesionálov na celom svete zlepšiť svoje zručnosti a vyniknúť vo svojej kariére. Hugh sa prostredníctvom svojho blogu delí o svoje znalosti so svetom a ponúka bezplatné výukové programy Excelu a online školenia, ktoré jednotlivcom a firmám pomôžu naplno využiť ich potenciál.

#EXEL.WIKI