Sadržaj
Jednostavna regresijska analiza obično se koristi za procjenu odnosa između dviju varijabli, na primjer, odnosa između prinosa usjeva i padalina ili odnosa između okusa kruha i temperature u pećnici. Međutim, češće moramo istraživati odnos između zavisne varijable i dvije ili više neovisnih varijabli. Na primjer, agent za nekretnine možda želi znati odnose li se i kako mjere kao što su veličina kuće, broj spavaćih soba i prosječni prihod u susjedstvu na cijenu za koju se kuća prodaje. Ova vrsta problema može se riješiti primjenom višestruke regresijske analize. A ovaj članak će vam dati sažetak kako koristiti višestruku regresijsku analizu pomoću programa Excel.
Problem
Pretpostavimo da smo uzeli 5 nasumično odabranih prodavača i prikupili podatke kao što je prikazano u donjoj tablici. Utječu li obrazovanje ili motivacija na godišnju prodaju ili ne?
Najviša godina završene škole | Motivacija kao Mjereno Higginsovom ljestvicom motivacije | Godišnja prodaja u dolarima |
12 | 32 | 350.000 $ |
14 | 35 | 399.765 $ |
15 | 45 | 429.000$ |
16 | 50 | 435.000$ |
18 | 65 | 433.000$ |
Jednadžba
Općenito, višestrukoregresijska analiza pretpostavlja da postoji linearni odnos između zavisne varijable (y) i nezavisnih varijabli (x1, x2, x3 … xn). I ova vrsta linearnog odnosa može se opisati pomoću sljedeće formule:
Y = konstanta + β1*x1 + β2*x2+…+ βn*xn
Ovdje su objašnjenja za konstante i koeficijente :
Y | Predviđena vrijednost Y |
Konstanta | Y- presretanje |
β1 | Promjena u Y svaki 1 inkrement promjena u x1 |
β2 | The promjena u Y svaki 1 inkrement promjena u x2 |
… | … |
βn | Promjena u Y svaki 1 inkrement promjena u xn |
Konstanta i β1, β2… βn mogu se izračunati na temelju dostupnih podataka uzorka. Nakon što dobijete vrijednosti konstante, β1, β2… βn, možete ih koristiti za predviđanje.
Što se tiče našeg problema, postoje samo dva faktora koja nas zanimaju. Stoga će jednadžba biti:
Godišnja prodaja = konstanta + β1*(Najviša godina završene škole) + β2*(Motivacija mjerena Higginsovom skalom motivacije)
Model postavljanja
Godišnja prodaja, najviša godina završene škole i Motivacija uneseni su u stupac A, stupac B i stupac C kao što je prikazano na slici 1. Bolje je uvijek staviti zavisnu varijablu (ovdje godišnja prodaja) ispred nezavisnih varijabli .
Slika 1
Preuzmite Analysis ToolPak
Excelnudi nam značajku analize podataka koja može vratiti vrijednosti konstanti i koeficijenata. Ali prije korištenja ove značajke morate preuzeti Analysis ToolPak. Evo kako ga možete instalirati.
Kliknite na karticu Datoteka -> Opcije i zatim kliknite na Dodaci u Dijaloški okvir Excel Options . Pritisnite gumb Idi na dnu dijaloškog okvira Opcije programa Excel da biste otvorili dijaloški okvir Dodaci . U dijaloškom okviru Add-Ins odaberite potvrdni okvir Analysis TookPak i zatim kliknite na Ok .
Sada ako kliknete na Podaci karticu, vidjet ćete da se Analiza podataka pojavljuje u grupi Analiza (desna ploča).
Slika 2 [kliknite na sliku za dobiti puni prikaz]
Višestruka regresijska analiza
Kliknite na Analiza podataka u grupi Analiza na kartici Podaci . U dijaloškom okviru Analiza podataka odaberite Regresija . Također možete napraviti drugu statističku analizu kao što je t-test, ANOVA, i tako dalje.
Slika 3.1
A Regresija dijaloški okvir će se prikazati nakon što odaberete Regresija . Ispunite dijaloški okvir kao što je prikazano na slici 3.2.
Ulazni raspon Y sadrži zavisnu varijablu i podatke dok ulazni raspon X sadrži nezavisne varijable i podatke. Ovdje vas moram podsjetiti da nezavisne varijable trebaju biti u susjednim stupcima. A najveći broj nezavisnih varijabli je 15.
Poštoraspon A1: C1 uključuje oznake varijabli i stoga treba označiti potvrdni okvir Oznake. Zapravo, preporučujem vam da uključite oznake svaki put kada popunjavate Input Y Range i Input X Range. Ove su oznake korisne kada pregledavate sumarna izvješća koja vraća Excel.
Slika 3.2
Odabirom potvrdnog okvira Ostaci možete omogućiti Excelu da navede reziduale za svako opažanje. Pogledajte sliku 1, ima ukupno 5 opažanja i dobit ćete 5 reziduala. Rezidual je nešto što ostane kada oduzmete predviđenu vrijednost od opažene vrijednosti. Standardizirani rezidual je rezidual podijeljen sa svojom standardnom devijacijom.
Također možete odabrati potvrdni okvir Residual Plot koji može omogućiti Excelu vraćanje rezidualnih dijagrama. Broj rezidualnih dijagrama jednak je broju nezavisnih varijabli. Grafikon reziduala je grafikon koji prikazuje reziduale na Y-osi i nezavisne varijable na x-osi. Nasumično raspoređene točke oko x-osi u dijagramu reziduala impliciraju da je model linearne regresije prikladan. Na primjer, slika 3.3 prikazuje tri tipična uzorka rezidualnih dijagrama. Samo onaj na lijevoj ploči pokazuje da dobro pristaje za linearni model. Druga dva uzorka sugeriraju bolju prilagodbu za nelinearni model.
Slika 3.3
Excel će vratiti prilagođeni linijski dijagram ako odaberete potvrdni okvir Line Fit Plots. Uklopljena linijska parcelamože nacrtati odnos između jedne zavisne varijable i jedne nezavisne varijable. Drugim riječima, Excel će vam vratiti isti broj prilagođenih crta kao i nezavisna varijabla. Na primjer, dobit ćete 2 prilagođena crta za naš problem.
Rezultati
Nakon što kliknete na gumb U redu, Excel će vratiti sažetak izvješća kao što je dolje. Ćelije označene zelenom i žutom bojom najvažniji su dio na koji biste trebali obratiti pozornost.
Slika 3.4
Što je veći R-kvadrat (ćelija F5), postoji uski odnos između zavisnih varijabli i nezavisnih varijabli. A koeficijenti (raspon F17: F19) u trećoj tablici vratili su vam vrijednosti konstanti i koeficijenata. Jednadžba bi trebala biti godišnja prodaja = 1589,2 + 19928,3*(Najviša godina završene škole) + 11,9*(Motivacija mjerena Higginsovom skalom motivacije).
Međutim, da biste vidjeli jesu li rezultati pouzdani, također trebate za provjeru p-vrijednosti označenih žutom bojom. Samo ako je p-vrijednost u ćeliji J12 manja od 0,05, cijela regresijska jednadžba je pouzdana. Ali također trebate provjeriti p-vrijednosti u rasponu I17: I19 da biste vidjeli jesu li konstantne i nezavisne varijable korisne za predviđanje zavisne varijable. Za naš problem, bolje je odbaciti motivaciju kada razmatramo nezavisne varijable.
Pročitajte više: Kako izračunati P vrijednost u linearnoj regresiji u Excelu (3Načini)
Uklonite motivaciju iz nezavisnih varijabli
Nakon što sam izbrisao motivaciju kao nezavisnu varijablu, primijenio sam isti pristup i napravio jednostavnu regresijsku analizu. Možete vidjeti da su sada sve vrijednosti manje od 0,05. Konačna jednadžba bi trebala biti:
Godišnja prodaja = 1167,8 + 19993,3*(Najviša godina završene škole)
Slika 3.5 [kliknite na sliku za puni prikaz]
Napomena
Slika 4
Osim alata Add-Ins, također možete koristiti funkciju LINEST za višestruku regresijsku analizu. Funkcija LINEST funkcija je polja koja može vratiti rezultat u jednoj ćeliji ili nizu ćelija. Najprije odaberite raspon A8:B12, a zatim unesite formulu "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" u prvu ćeliju ovog raspona (A8). Nakon što pritisnete CTRL + SHIFT +ENTER, Excel će vratiti rezultate kao u nastavku. Uspoređujući sliku 3.4, možete vidjeti da je 19993,3 koeficijent najviše završene godine škole, dok je 1167,8 konstanta. U svakom slučaju, preporučujem vam da koristite alat Add-Ins. Mnogo je lakše.
Pročitajte više…
Obrnuta analiza što ako u Excelu
Kako koristiti zamjenske znakove u Excelu?
Preuzmite radnu datoteku
Preuzmite radnu datoteku s donje veze.
Višestruka regresijska analiza. xlsx