Ynhâldsopjefte
Ienfâldige regression -analyze wurdt faak brûkt om de relaasje tusken twa fariabelen te skatten, bygelyks de relaasje tusken gewaaksopbringsten en delslach of de relaasje tusken de smaak fan bôle en oventemperatuer. Wy moatte lykwols de relaasje tusken in ôfhinklike fariabele en twa of mear ûnôfhinklike fariabelen faker as net ûndersykje. In makelder kin bygelyks witte oft en hoe't maatregels lykas de grutte fan it hûs, it oantal sliepkeamers en it gemiddelde ynkommen fan 'e buert har ferbân hâlde mei de priis wêrfoar in hûs ferkocht wurdt. Dit soarte fan probleem kin oplost wurde troch it tapassen fan meardere regression-analyze. En dit artikel sil jo in gearfetting jaan fan hoe't jo gebrûk meitsje fan meardere regression-analyse mei Excel.
Probleem
Stel dat wy namen 5 willekeurich selektearre ferkeapers en sammele de ynformaasje lykas werjûn yn de ûndersteande tabel. Oft ûnderwiis of motivaasje in ynfloed hat op de jierlikse ferkeap of net?
Heechste jier fan skoalle foltôge | Motivaasje as Metten troch Higgins Motivation Scale | Jierlikse ferkeap yn dollars |
12 | 32 | $350.000 |
14 | 35 | $399.765 |
15 | 45 | $429.000 |
16 | 50 | $435.000 |
18 | 65 | $433.000 |
Fergeliking
Algemien, meardereregression analyze giet der fan út dat der in lineêre relaasje is tusken de ôfhinklike fariabele (y) en ûnôfhinklike fariabelen (x1, x2, x3 ... xn). En dit soarte fan lineêre relaasje kin beskreaun wurde mei de folgjende formule:
Y = konstante + β1*x1 + β2*x2+…+ βn*xn
Hjir binne de ferklearrings foar konstanten en koeffizienten :
Y | De foarseine wearde fan Y |
Konstante | De Y- intercept |
β1 | De feroaring yn Y elke feroaring fan 1 ynkommens yn x1 |
β2 | De feroaring yn Y elk 1 ynkommen feroaring yn x2 |
… | … |
βn | De feroaring yn Y elke 1 ynkommensferoaring yn xn |
Konstant en β1, β2 ... βn kin wurde berekkene op basis fan beskikbere samplegegevens. Nei't jo wearden krije fan konstante, β1, β2 ... βn, kinne jo se brûke om de foarsizzingen te meitsjen.
Wat ús probleem oangiet, binne d'r mar twa faktoaren wêryn wy in belang hawwe. Dêrom sil de fergeliking wêze:
Jierlikse ferkeap = konstant + β1*(Heechste jier fan skoalle foltôge) + β2*(Motivaasje as mjitten troch Higgins Motivation Scale)
Model opset
Jierferkeap, heechste jier fan skoalle foltôge en Motivaasje waard ynfierd yn kolom A, kolom B en kolom C lykas werjûn yn figuer 1. It is better om altyd de ôfhinklike fariabele (jierlikse ferkeap hjir) foar de ûnôfhinklike fariabelen te setten .
Figuer 1
Download Analysis ToolPak
Excelbiedt ús Data Analysis-funksje dy't wearden fan konstanten en koeffizienten kin weromjaan. Mar foardat jo dizze funksje brûke, moatte jo Analysis ToolPak downloade. Hjir is hoe't jo it kinne ynstallearje.
Klik op it ljepblêd Triem -> Opsjes en klik dan op Tafoegje-yns yn Excel-opsjes dialoochfinster. Klikje op Gean knop ûnderoan it dialoochfinster Excel-opsjes om it dialoochfinster Add-Ins te iepenjen. Selektearje yn it dialoochfinster Add-Ins Analyse TookPak karfakje en klik dan op Ok .
No as jo op klikke. Data ljepper, jo sille sjen dat Data Analysis ferskynt yn 'e Analyse groep (rjochter paniel).
Figure 2 [klik op de ôfbylding om krije in folsleine werjefte]
Meardere regression-analyze
Klik op Data-analyze yn 'e groep Analyse op it ljepblêd Data . Selektearje Regression Yn it frege dialoochfinster Data Analysis . Jo kinne ek oare statistyske analyze dwaan lykas t-test, ANOVA, ensfh.
Figure 3.1
A Regression dialoochfinster sil wurde frege neidat jo selektearje Regression . Folje it dialoochfinster yn lykas werjûn yn figuer 3.2.
Ynfier Y-berik befettet de ôfhinklike fariabele en gegevens, wylst de ynfier X-berik ûnôfhinklike fariabelen en gegevens befettet. Hjir moat ik jo herinnerje dat ûnôfhinklike fariabelen yn neistlizzende kolommen moatte wêze. En it maksimum oantal ûnôfhinklike fariabelen is 15.
Sûntberik A1: C1 befettet fariabele labels en dêrom Labels karfakje moatte wurde selektearre. Yn feite ried ik jo oan om elke kear labels op te nimmen as jo Ynput Y-berik en ynfier X-berik ynfolje. Dizze labels binne nuttich as jo gearfettingsrapporten besjogge dy't weromjûn binne troch Excel.
Figure 3.2
Troch it karfakje Residuals te selektearjen, kinne jo Excel ynskeakelje om residualen foar elke observaasje te listjen. Sjoch nei figuer 1, d'r binne yn totaal 5 observaasjes en jo sille 5 residuen krije. Residueel is iets dat oerbliuwt as jo de foarseine wearde subtrahearje fan 'e waarnommen wearde. Standertisearre residueel is it residueel dield troch syn standertdeviaasje.
Jo kinne ek it karfakje Residual Plot selektearje dat Excel ynskeakelje kin om residuele plots werom te jaan. It oantal oerbleaune plots is lyk oan it oantal ûnôfhinklike fariabelen. In residuele plot is in grafyk dy't de residualen op 'e Y-as en ûnôfhinklike fariabelen op 'e x-as toant. Willekeurich ferspraat punten om de x-as yn in residueel plot betsjutte dat it lineêre regression -model passend is. Bygelyks, figuer 3.3 lit trije typyske patroanen fan oerbleaune plots. Allinnich de iene yn it linker paniel jout oan dat it in goede fit is foar in lineêr model. De oare twa patroanen suggerearje in bettere fit foar in net-lineêr model.
Figure 3.3
Excel sil in oanpaste lineplot weromjaan as jo it karfakje Line Fit Plots selektearje. In ynrjochte line plotkin de relaasje tusken ien ôfhinklike fariabele en ien ûnôfhinklike fariabele plot. Mei oare wurden, Excel sil jo itselde oantal oanpaste line-plots weromjaan mei dat fan 'e ûnôfhinklike fariabele. Jo krije bygelyks 2 oanpaste line plots foar ús probleem.
Resultaten
Neidat jo op de Ok knop klikke, sil Excel in gearfetting rapport werombringe lykas hjirûnder. Sellen markearre yn grien en giel binne it wichtichste part dêr't jo moatte betelje jo omtinken. tusken ôfhinklike fariabelen en ûnôfhinklike fariabelen. En koeffizienten (berik F17: F19) yn 'e tredde tabel joegen jo de wearden fan konstanten en koeffizienten werom. De fergeliking moat Jierlikse ferkeap = 1589,2 + 19928,3*(Heechste jier fan skoalle foltôge) + 11,9*(Motivaasje as mjitten troch Higgins Motivation Scale).
Om lykwols te sjen oft de resultaten betrouber binne, hawwe jo ek nedich om te kontrolearjen p-wearden markearre yn giel. Allinich as p-wearde yn sel J12 minder is as 0,05, is de hiele regressionfergeliking betrouber. Mar jo moatte ek kontrolearje p-wearden yn berik I17: I19 om te sjen oft konstante en ûnôfhinklike fariabelen binne nuttich foar de foarsizzing fan de ôfhinklike fariabele. Foar ús probleem is it better foar ús om motivaasje te ferwiderjen by it beskôgjen fan ûnôfhinklike fariabelen.
Lês mear: Hoe kinne jo P-wearde yn lineêre regression yn Excel berekkenje (3)Ways)
Motivaasje fuortsmite fan ûnôfhinklike fariabelen
Nei it wiskjen fan Motivaasje as de ûnôfhinklike fariabele, haw ik deselde oanpak tapast en in ienfâldige regression-analyse dien. Jo kinne sjen dat alle wearden no minder binne dan 0,05. De definitive fergeliking moat wêze:
Jierferkeap = 1167,8 + 19993,3*(Hoogste jier fan skoalle foltôge)
Figure 3.5 [klik op 'e ôfbylding om in folsleine werjefte te krijen]
Opmerking
Figuer 4
Njonken Add-Ins-ark kinne jo ek de LINEST-funksje brûke om meardere regression-analyze te dwaan. LINEST-funksje is in arrayfunksje dy't it resultaat kin weromjaan yn ien sel of in berik fan sellen. Selektearje earst berik A8: B12 en fier dan formule "=LINEST (A2: A6, B2: B6, TRUE, TRUE)" yn 'e earste sel fan dit berik (A8). Neidat jo op CTRL + SHIFT + ENTER drukke, sil Excel resultaten weromjaan lykas hjirûnder. Troch te fergelykjen mei figuer 3.4 kinne jo sjen dat 19993.3 de koeffizient is fan Heechste jier fan skoalle foltôge wylst 1167.8 konstant is. Hoe dan ek, ik riede jo oan om Add-Ins-ark te brûken. It is folle makliker.
Lês mear...
Reverse What-If Analysis yn Excel
Hoe brûke jo jokertekens yn Excel?
Wurkbestân downloade
Download it wurkbestân fan de ûndersteande keppeling.
Meardere-Regression-Analysis. xlsx