Kako interpretirati rezultate regresije u Excelu (detaljna analiza)

  • Podijeli Ovo
Hugh West

Regresijska analiza postoji u gotovo svakoj vrsti statističkog softvera kao što je SPSS , R, a da ne spominjemo Excel. Regresija nam može dati širu sliku o odnosima između varijabli. Linearna regresija može se napraviti prilično brzo u Excelu pomoću alata Analiza podataka . Ovaj će članak pokazati kako možete tumačiti rezultate regresije u Excelu.

Preuzmite radnu bilježnicu za vježbe

Preuzmite ovu radnu bilježnicu za vježbe u nastavku.

Interpret Regression Results.xlsx

Što je regresija?

Regresijska analiza često se koristi u analizi podataka za utvrđivanje povezanosti između više varijabli. Regresijska analiza omogućuje vam da odaberete što će se dogoditi s ovisnom varijablom ako se jedna od nezavisnih varijabli promijeni. Također vam omogućuje da matematički odredite koje nezavisne varijable imaju utjecaj.

Jednostavna linearna regresija razlikuje se od višestruke linearne regresije u statistici. Koristeći linearnu funkciju, jednostavna linearna regresija analizira vezu između varijabli i jedne nezavisne varijable. Višestruka linearna regresija je kada se za određivanje varijabli koriste dva ili više eksplanatornih faktora. Korištenje nelinearne regresije umjesto zavisne varijable opisuje se kao nelinearna funkcija budući da odnosi podataka nisu linearni. Ovaj će se članak usredotočiti na višestruko linearnoregresiju kako biste pokazali kako možete interpretirati rezultate regresije u Excelu.

Koraci za izvođenje regresije u Excelu

U svrhu regresije, koristit ćemo donji skup podataka za svrhe analize. Ovdje će nezavisna varijabla biti stupac Cijena i stupac Prodano . Neovisni stupac bit će Potražnja stupac.

Koraci

  • Moramo otići na karticu Podaci i kliknuti na Analizu podataka da napravimo regresiju .

  • Pojavit će se novi prozor; odaberite zavisnu varijablu i raspon podataka nezavisne varijable.
  • Zatim označite okvir Oznake i okvir Pouzdanost .
  • Zatim kliknite na izlazni raspon ćelija okvir za odabir izlazne adrese ćelije
  • Zatim označite Rezidualno za izračun reziduala.
  • Nakon toga označite Rezidualno dijagrame i Kutije za dijagrame prilagodbe liniji
  • Kliknite U redu nakon ovoga.

  • Nakon klika OK, primarni izlazni parametri analize bit će u navedenim ćelijama.

  • Tada ćete također dobiti neke parametre kao što je Značaj vrijednost itd. u tablici ANOVA ( Analiza varijance ).
  • Ovdje, df označava stupanj slobode povezan s izvorom varijance.
  • SS označava zbroj kvadrata. Vaš će model bolje odražavati podatke ako Preostali SS je manji od Ukupnog SS.
  • MS znači kvadrat.
  • F označava F -test za nultu hipotezu.
  • Značaj F označava P -vrijednost F .

  • Tada ćete također dobiti koeficijente varijable, vrijednost značajnosti itd. u tablici.

  • Tada ćete dobiti konačnu tablicu ispod tablice koeficijenata koja sadrži preostalu vrijednost za svaki unos.

  • Zatim ćete dobiti regresijski grafikon Potražnje nas Cijene s linijom trenda.

  • Nakon ovo, dobivate regresijski grafikon Potražnje u odnosu na Prodano s linijom trenda.

  • Postoji još jedan grafikon koji prikazuje distribuciju ostataka svakog unosa iz varijable Prodano .

  • Postoji još jedan grafikon koji prikazuje distribuciju ostataka svakog unosa iz varijable Cijena .

Dalje ćemo vam pokazati kako možete n interpretirajte ove rezultate regresije u Excelu.

Pročitajte više: Kako napraviti logističku regresiju u Excelu (s brzim koracima)

Kako interpretirati Rezultati regresije u Excelu

Sljedeća stvar koju trebate učiniti nakon što napravite regresijsku analizu i njihovo tumačenje. Ishodi su opisani i razrađeni u nastavku.

Analiza višestruke regresijske vrijednosti R-kvadrata

R-kvadrat broj označava koliko su blisko povezani elementi skupa podataka i koliko dobro regresijska linija odgovara podacima. Koristit ćemo višestruku linearnu regresijsku analizu, u kojoj ćemo odrediti utjecaj dviju ili više varijabli na glavni faktor. Ovo se odnosi na to kako se zavisna varijabla mijenja kao jedna od nezavisnih varijabli. Raspon ovog koeficijenta je od -1 do 1. Ovdje

  • 1 znači blizak pozitivan odnos
  • 0 znači da nema odnosa među varijablama. Drugim riječima, podatkovne točke su nasumične.
  • -1 znači obrnuti ili negativni odnos među varijablama.

U gore prikazanim izlaznim rezultatima, višestruka R-vrijednost danog skupova podataka je o.7578( približno ), što ukazuje na jake odnose između varijabli.

R na kvadrat

R na kvadrat vrijednost objašnjava kako odgovor zavisnih varijabli varira u odnosu na nezavisnu varijablu. U našem slučaju, vrijednost je 0,574 (približno), što se može protumačiti kao relativno dobar odnos između varijabli.

Prilagođeni R-kvadrat

Ovo je samo alternativna verzija vrijednosti R na kvadrat . Ovo jednostavno miješa varijable prediktora dok predviđa varijablu odgovora . Izračunava se kao

R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]

Ovdje, R^2 : vrijednost R^2 koju smo dobili izskup podataka.

n : broj opažanja.

K : broj prediktorskih varijabli.

Značajnost ove vrijednosti pojavljuje se tijekom regresijske analize između dvije prediktorske varijable. Ako postoji više od jedne prediktorske varijable u skupu podataka, tada će vrijednost R kvadrata biti napuhana, što je krajnje nepoželjno. Prilagođena vrijednost R na kvadrat prilagođava ovu inflaciju i daje točnu sliku varijabli.

Standardna pogreška

Još jedna metrika usklađenosti to ukazuje na točnost vaše regresijske analize; što je niža vrijednost, možete biti sigurniji u svoju regresijsku analizu.

Standardna pogreška je empirijska metrika koja predstavlja prosječnu udaljenost na kojoj točke odstupaju od linije trenda. Nasuprot tome, R2 predstavlja udio varijacije zavisne varijable. U ovom slučaju, vrijednost Standardne pogreške je 288,9 ( približno ), što označava da naše podatkovne točke u prosjeku padaju 288,9 od linije trenda.

Opažanja

Navedite broj opažanja ili unosa.

Odredite značajnu varijablu

Vrijednost značaja ukazuje na pouzdanost (statistički pouzdanu) naše analize. Drugim riječima, označava vjerojatnost da je naš skup podataka pogrešan. Ova vrijednost bi trebala biti ispod 5%. Ali u ovom slučaju, naša vrijednost značajnosti je  0,00117,što znači 0,1%, što je znatno ispod 5%. Dakle, naša analiza je u redu. U suprotnom, možda ćemo morati odabrati različite varijable za našu analizu.

P-vrijednost u regresijskoj analizi

Usko povezana sa značajnom vrijednošću, P- vrijednost označava vjerojatnost da je vrijednost koeficijenta pogrešna. P-vrijednost označava povezanost nulte hipoteze s varijablama.

Ako vaša p-vrijednost < Značaj broja, postoji dovoljno dokaza za odbacivanje hipoteze nulte vrijednosti. To znači da postoji korelacija različita od nule između varijabli.

Ali ako p-vrijednost > Značajnost vrijednost, neće biti dovoljno dokaza da se odbaci Nulta hipoteza. To znači da ne može postojati korelacija između varijabli.

U ili slučaju, P-vrijednost varijable Cijena =0,000948 < 0,00117 (vrijednost značajnosti),

Dakle, ovdje se ne radi o nultoj hipotezi i postoji dovoljno dokaza da se proglasi korelacija između varijabli.

S druge strane, za varijablu Prodano , (P-vrijednost) 0,0038515 < 0,0011723 (Vrijednost značajnosti)

Dakle, ovdje bi mogla postojati nulta hipoteza i nema dovoljno dokaza da se proglasi korelacija između varijabli različita od nule.

U većini slučajeva, ovaj P -vrijednost određuje hoće li varijabla biti u skupu podataka ili ne. Na primjer, trebali bismo ukloniti Prodano varijabla za očuvanje robusnosti skupa podataka.

Regresijska jednadžba

Kako određujemo linearnu regresijsku analizu u Excelu, linija trenda bi također trebala biti linearna. Opći oblik je:

Y=mX+C.

Ovdje, Y je zavisna varijabla.

I X je ovdje nezavisna varijabla, što znači da ćemo odrediti učinak promjene varijable x na varijablu Y.

C će biti samo vrijednost sjecišta Y-osi linija.

U ovom slučaju, vrijednost presjeka C  jednaka je 9502,109853

A vrijednost m za dvije varijable je -809,265 i 0,424818.

Dakle, imamo konačnu jednadžbu za dvije odvojene varijable.

Prva je:

Y=-809.265771X+9502.12

A jednadžba za drugu varijablu je:

Y=0,4248X+9502,12

Koeficijenti

Koeficijenti koje smo dobili su m1=-809.2655 i m2=04248 . I presretač, C= 9502.12 .

  • Prvo, vrijednost presretača pokazuje da će potražnja biti 9502 kada je cijena nula.
  • I vrijednosti m označava brzinu kojom se potražnja mijenja po jedinici promjene cijene. Vrijednost koeficijenta cijene je -809,265, što pokazuje da će povećanje cijene po jedinici smanjiti potražnju za otprilike 809 jedinica.
  • Za drugu varijablu, Prodano, m vrijednost je 0,424. Ovo označava promjenu po jedinici prodanog artiklarezultirat će povećanjem umnoška od 0424 vremenske jedinice.

Reziduali

Reziduali razlika između izvorne i izračunate ulaz s regresijske linije je razlika. Reziduali označavaju koliko je stvarna vrijednost udaljena od crte. Na primjer, izračunati unos iz regresijske analize za prvi unos je 9497. A prva izvorna vrijednost je 9500. Dakle, ostatak je oko 2,109.

T-statistička vrijednost

T-statička vrijednost je dijeljenje koeficijenta sa standardnom vrijednošću. Što je veća vrijednost, to pokazuje bolju pouzdanost koeficijenta.

Postoji još jedan značaj ove vrijednosti, koji je potreban za izračun P-vrijednosti.

Interval pouzdanosti od 95%

Ovdje je pouzdanost varijable koju smo postavili na 95 na početku. Međutim, može se promijeniti.

  • Ovdje je vrijednost koeficijenta donjih 95% izračunata kao 8496,84 što znači da je gornjih 95% izračunato kao 10507,37,
  • To znači da dok je naš glavni koeficijent je oko 9502,1. postoji velika vjerojatnost da bi vrijednost mogla biti ispod 8496 za 95% slučajeva i 5% šanse da bude iznad 10507,37

Pročitaj više:

Stvari koje treba zapamtiti

Metoda regresijske analize procjenjuje isključivo odnos između varijabli koje se ispituju. Ne utvrđuje uzročnost. Na druge načine, samo aspektkorelacije smatra. Kad neki čin nešto uzrokuje, to postaje uzročnost. Kada promjena jedne varijable stvara promjene, to se može smatrati uzročno-posljedičnom vezom.

Regresijsku analizu uvelike ometaju odstupanja. Sve vrste outliera moraju se ukloniti prije nego što se izvrši analiza. Da biste analizirali i protumačili rezultate regresijske analize u Excelu, trebate uzeti u obzir ove točke.

Zaključak

Ukratko, na pitanje "kako interpretirati rezultate regresijske analize u Excelu" detaljno je odgovoreno analizirajući ga i kasnije interpretirajući. Analiza se provodi pomoću alata Analiza podataka na kartici Podaci .

Za ovaj problem dostupna je radna knjiga za preuzimanje u kojoj možete vježbati regresijsku analizu i tumačiti it.

Slobodno postavite sva pitanja ili povratne informacije putem odjeljka za komentare. Svaki prijedlog za poboljšanje Exceldemy zajednice bit će vrlo zahvalan.

Hugh West vrlo je iskusan Excel trener i analitičar s više od 10 godina iskustva u industriji. Diplomirao je računovodstvo i financije te magistrirao poslovno upravljanje. Hugh ima strast za podučavanjem i razvio je jedinstveni pristup podučavanju koji je lako pratiti i razumjeti. Njegovo stručno poznavanje programa Excel pomoglo je tisućama studenata i profesionalaca diljem svijeta da poboljšaju svoje vještine i postignu uspjeh u karijeri. Putem svog bloga, Hugh dijeli svoje znanje sa svijetom, nudeći besplatne vodiče za Excel i online obuku kako bi pomogao pojedincima i tvrtkama da dostignu svoj puni potencijal.