Tabela e përmbajtjes
Regresioni i thjeshtë përdoret zakonisht për të vlerësuar lidhjen midis dy variablave, për shembull, lidhjen midis rendimentit të të korrave dhe reshjeve ose marrëdhënies midis shijes së bukës dhe temperaturës së furrës. Megjithatë, ne duhet të hetojmë marrëdhënien midis një ndryshoreje të varur dhe dy ose më shumë ndryshoreve të pavarura më shpesh sesa jo. Për shembull, një agjent imobiliar mund të dëshirojë të dijë nëse dhe si lidhen masat si madhësia e shtëpisë, numri i dhomave të gjumit dhe të ardhurat mesatare të lagjes me çmimin për të cilin shitet një shtëpi. Ky lloj problemi mund të zgjidhet duke aplikuar analizën e regresionit të shumëfishtë. Dhe ky artikull do t'ju japë një përmbledhje se si të përdorni analizën e regresionit të shumëfishtë duke përdorur Excel.
Problemi
Supozoni se kemi marrë 5 shitës të zgjedhur rastësisht dhe kemi mbledhur informacionin siç tregohet në tabelën e mëposhtme. Nëse edukimi apo motivimi ka ndikim në shitjet vjetore apo jo?
Përfundoi viti më i lartë i shkollës | Motivimi si Matur nga shkalla e motivimit Higgins | Shitjet vjetore në dollarë |
12 | 32 | $350,000 |
14 | 35 | $399,765 |
15 | 45 | 429,000$ |
16 | 50 | 435000$ |
18 | 65 | 433,000$ |
Ekuacioni
Në përgjithësi, shumëfishAnaliza e regresionit supozon se ekziston një lidhje lineare midis ndryshores së varur (y) dhe variablave të pavarur (x1, x2, x3 ... xn). Dhe kjo lloj marrëdhënie lineare mund të përshkruhet duke përdorur formulën e mëposhtme:
Y = konstante + β1*x1 + β2*x2+…+ βn*xn
Këtu janë shpjegimet për konstantet dhe koeficientët :
Y | Vlera e parashikuar e Y |
Konstante | Y- ndërpres |
β1 | Ndryshimi në Y çdo 1 ndryshim në rritje në x1 |
β2 | ndryshimi në Y çdo 1 ndryshim në rritje në x2 |
… | … |
βn | Ndryshimi në Y çdo 1 ndryshim në rritje në xn |
Konstante dhe β1, β2… βn mund të llogaritet bazuar në të dhënat e disponueshme të mostrës. Pasi të keni marrë vlerat e konstantës, β1, β2… βn, ju mund t'i përdorni ato për të bërë parashikimet.
Sa i përket problemit tonë, ka vetëm dy faktorë për të cilët kemi interes. Prandaj, ekuacioni do të jetë:
Shitjet vjetore = konstante + β1*(Viti më i lartë i shkollës së përfunduar) + β2*(Motivimi i matur nga shkalla e motivimit Higgins)
Modeli i konfigurimit
Shitjet vjetore, viti më i lartë i shkollës së përfunduar dhe Motivimi është futur në kolonën A, kolonën B dhe kolonën C siç tregohet në figurën 1. Është më mirë që gjithmonë të vendosni variablin e varur (shitjet vjetore këtu) përpara variablave të pavarur .
Figura 1
Shkarko Analiza ToolPak
Excelna ofron veçorinë e Analizës së të Dhënave e cila mund të kthejë vlerat e konstantave dhe koeficientëve. Por përpara se të përdorni këtë veçori, duhet të shkarkoni Analysis ToolPak. Ja se si mund ta instaloni atë.
Klikoni në skedën Skedari -> Opsionet dhe më pas klikoni në Shtesa në
Tani nëse klikoni në Skeda Data , do të shihni se Analiza e të dhënave shfaqet në grupin Analiza (paneli djathtas).
Figura 2 [kliko mbi imazhin për të merrni një pamje të plotë]
Analiza e regresionit të shumëfishtë
Klikoni në Analiza e të dhënave në grupin Analiza në skedën Të dhënat . Zgjidhni Regresioni Në kutinë e dialogut të kërkuar Analiza e të dhënave . Ju gjithashtu mund të bëni analiza të tjera statistikore si t-test, ANOVA, e kështu me radhë.
Figura 3.1
A Regresioni kutia e dialogut do të kërkohet pasi të zgjidhni Regresioni . Plotësoni kutinë e dialogut siç tregohet në Figurën 3.2.
Input Y Range përmban variablin e varur dhe të dhënat ndërsa Input X Range përmban variabla dhe të dhëna të pavarura. Këtu më duhet t'ju kujtoj se variablat e pavarur duhet të jenë në kolonat ngjitur. Dhe numri maksimal i variablave të pavarur është 15.
Qëdiapazoni A1: C1 përfshin etiketat e ndryshueshme dhe për këtë arsye kutia e kontrollit Labels duhet të zgjidhet. Në fakt, unë ju rekomandoj të përfshini etiketa çdo herë kur plotësoni Gama e Input Y dhe Gama e Input X. Këto etiketa janë të dobishme kur shqyrtoni raportet përmbledhëse të kthyera nga Excel.
Figura 3.2
Duke zgjedhur kutinë e zgjedhjes Residuals, mund të aktivizoni Excel që të listojë mbetjet për çdo vëzhgim. Shikoni figurën 1, ka 5 vëzhgime gjithsej dhe do të merrni 5 mbetje. Mbetja është diçka që mbetet kur zbritni vlerën e parashikuar nga vlera e vëzhguar. Mbetja e standardizuar është mbetja e pjestuar me devijimin e tij standard.
Mund të zgjidhni gjithashtu kutinë e kontrollit Residual Plot që mund të mundësojë Excel që të kthejë parcelat e mbetura. Numri i parcelave të mbetura është i barabartë me numrin e variablave të pavarur. Një grafik i mbetur është një grafik që tregon mbetjet në boshtin Y dhe variablat e pavarur në boshtin x. Pikat e shpërndara rastësisht rreth boshtit x në një grafik të mbetur nënkuptojnë se modeli regresioni linear është i përshtatshëm. Për shembull, Figura 3.3 tregon tre modele tipike të parcelave të mbetura. Vetëm ai në panelin e majtë tregon se është i përshtatshëm për një model linear. Dy modelet e tjera sugjerojnë një përshtatje më të mirë për një model jolinear.
Figura 3.3
Excel do të kthejë një grafik të linjës së përshtatur nëse zgjidhni kutinë e kontrollit Line Fit Plots. Një parcelë me vijë të pajisurmund të vizatojë lidhjen ndërmjet një ndryshoreje të varur dhe një ndryshoreje të pavarur. Me fjalë të tjera, Excel do t'ju kthejë të njëjtin numër grafikash vijash të përshtatura me atë të ndryshores së pavarur. Për shembull, do të merrni 2 parcela rreshtash të përshtatur për problemin tonë.
Rezultatet
Pasi të klikoni në butonin Ok, Excel do të kthejë një raport përmbledhës si më poshtë. Qelizat e theksuara në të gjelbër dhe të verdhë janë pjesa më e rëndësishme të cilës duhet t'i kushtoni vëmendje.
Figura 3.4
Sa më i lartë R-katror (qeliza F5), ekziston një marrëdhënie e ngushtë. ndërmjet variablave të varur dhe variablave të pavarur. Dhe koeficientët (varg F17: F19) në tabelën e tretë ju kthyen vlerat e konstantave dhe koeficientëve. Ekuacioni duhet të jetë Shitjet vjetore = 1589.2 + 19928.3*(Viti më i lartë i shkollës së përfunduar) + 11.9* (Motivimi i matur nga shkalla e motivimit të Higgins).
Megjithatë, për të parë nëse rezultatet janë të besueshme, duhet gjithashtu për të kontrolluar vlerat p të theksuara me të verdhë. Vetëm nëse vlera p në qelizën J12 është më e vogël se 0.05, i gjithë ekuacioni i regresionit është i besueshëm. Por ju duhet gjithashtu të kontrolloni vlerat p në intervalin I17: I19 për të parë nëse variablat konstante dhe të pavarura janë të dobishme për parashikimin e ndryshores së varur. Për problemin tonë, është më mirë që ne të heqim dorë nga motivimi kur shqyrtojmë variabla të pavarur.
Lexo më shumë: Si të llogarisim vlerën P në regresionin linear në Excel (3Mënyrat)
Hiq Motivimin nga variablat e pavarur
Pasi fshiva Motivimin si variabël të pavarur, aplikova të njëjtën qasje dhe bëra një analizë të thjeshtë regresioni. Ju mund të shihni se të gjitha vlerat janë më pak se 0.05 tani. Ekuacioni përfundimtar duhet të jetë:
Shitjet vjetore = 1167.8 + 19993.3*(Viti më i lartë i shkollës së përfunduar)
Figura 3.5 [kliko mbi imazhin për të parë një pamje të plotë]
Shënim
Figura 4
Përveç veglës së Shtesave, mund të përdorni edhe funksionin LINEST për të bërë analizën e regresionit të shumëfishtë. Funksioni LINEST është një funksion grupi që mund të kthejë rezultatin ose në një qelizë ose në një varg qelizash. Para së gjithash, zgjidhni intervalin A8:B12 dhe më pas futni formulën "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" në qelizën e parë të këtij diapazoni (A8). Pasi të shtypni CTRL + SHIFT + ENTER, Excel do të kthejë rezultatet si më poshtë. Duke krahasuar me figurën 3.4, mund të shihni se 19993.3 është koeficienti i vitit më të lartë të shkollës së përfunduar ndërsa 1167.8 është konstant. Gjithsesi, unë ju rekomandoj të përdorni mjetin Add-Ins. Është shumë më e lehtë.
Lexo më shumë…
Reverse What-If Analiza në Excel
Si të përdorim Wildcards në Excel?
Shkarkoni skedarin e punës
Shkarko skedarin e punës nga lidhja më poshtë.
Multiple-Regression-Analysis. xlsx