Daugkartinė regresinė analizė su "Excel

  • Pasidalinti
Hugh West

Paprastoji regresija analizė paprastai naudojama dviejų kintamųjų ryšiui įvertinti, pavyzdžiui, derliaus ir kritulių kiekio ryšiui arba duonos skonio ir krosnies temperatūros ryšiui nustatyti. Tačiau dažniau reikia ištirti priklausomo kintamojo ir dviejų ar daugiau nepriklausomų kintamųjų ryšį. Pavyzdžiui, nekilnojamojo turto agentas gali norėti sužinotiar ir kaip tokie rodikliai, kaip namo dydis, miegamųjų skaičius ir vidutinės pajamos kaimynystėje, yra susiję su kaina, už kurią parduodamas namas. Tokią problemą galima išspręsti taikant daugialypė regresinė analizė. Šiame straipsnyje rasite santrauką, kaip atlikti daugialypę regresinę analizę naudojant "Excel".

Problema

Tarkime, kad paėmėme 5 atsitiktinai atrinktus pardavėjus ir surinkome informaciją, kaip parodyta toliau pateiktoje lentelėje. Ar išsilavinimas, ar motyvacija turi įtakos metiniams pardavimams, ar ne?

Aukščiausi baigtos mokyklos metai Motyvacija, matuojama Higginso motyvacijos skale Metiniai pardavimai doleriais
12 32 $350,000
14 35 $399,765
15 45 $429,000
16 50 $435,000
18 65 $433,000

Lygtis

Apskritai, daugialypė regresinė analizė daroma prielaida, kad tarp priklausomo kintamojo (y) ir nepriklausomų kintamųjų (x1, x2, x3 ... xn) yra tiesinis ryšys. Ir tokį tiesinį ryšį galima aprašyti pagal šią formulę:

Y = konstanta + β1*x1 + β2*x2+...+ βn*xn

Čia pateikiami konstantų ir koeficientų paaiškinimai:

Y Prognozuojama Y
Nuolatinis Y intercepcija
β1 Y pokytis kiekvieną kartą, kai x1 pasikeičia 1 žingsniu
β2 Y pokytis kiekvieną kartą, kai x2 pasikeičia 1 žingsniu
... ...
βn Y pokytis kiekvieną kartą, kai xn pasikeičia 1 žingsniu

Konstantą ir β1, β2... βn galima apskaičiuoti pagal turimus imties duomenis. Gavę konstantos, β1, β2... βn vertes, galite jas naudoti prognozėms atlikti.

Kalbant apie mūsų problemą, mus domina tik du veiksniai. Todėl lygtis bus tokia:

Metiniai pardavimai = konstanta + β1*(aukščiausi baigtos mokyklos metai) + β2*(motyvacija, matuojama Higginso motyvacijos skale)

Nustatyti modelį

Metiniai pardavimai, aukščiausi baigtos mokyklos metai ir motyvacija buvo įrašyti į A, B ir C stulpelius, kaip parodyta 1 pav. 1. Geriau visada įrašyti priklausomą kintamąjį (čia - metiniai pardavimai) prieš nepriklausomus kintamuosius.

1 pav.

Atsisiųsti "Analysis ToolPak

"Excel" mums siūlo duomenų analizės funkciją, kuri gali grąžinti konstantų ir koeficientų vertes. Tačiau prieš naudodamiesi šia funkcija turite atsisiųsti "Analysis ToolPak". Štai kaip ją įdiegti.

Spustelėkite Failas skirtukas -> Parinktys ir spustelėkite Papildomi priedai svetainėje "Excel" parinktys dialogo langą. Spustelėkite Eikite į mygtuką, esantį apačioje "Excel" parinktys dialogo langą, kad atidarytumėte Papildomi priedai dialogo langas. Papildomi priedai dialogo lange pasirinkite Analizė TookPak žymimąjį langelį ir spustelėkite Gerai .

Dabar, jei spustelėsite Duomenys skirtuke matysite Duomenų analizė pasirodo Analizė grupė (dešinysis skydelis).

2 paveikslėlis [spustelėkite paveikslėlį, kad pamatytumėte visą vaizdą]

Daugialypė regresinė analizė

Spustelėkite Duomenų analizė į Analizė grupė Duomenys skirtukas. Pasirinkite Regresija Paragintas Duomenų analizė dialogo langą. Taip pat galite atlikti kitus statistinė analizė pavyzdžiui, t-testas, ANOVA ir pan.

3.1 pav.

A Regresija Pasirinkus Regresija . užpildykite dialogo langą, kaip parodyta 3.2 paveiksle.

Įvesties Y srityje yra priklausomas kintamasis ir duomenys, o įvesties X srityje - nepriklausomi kintamieji ir duomenys. Čia turiu priminti, kad nepriklausomi kintamieji turi būti gretimuose stulpeliuose. O didžiausias nepriklausomų kintamųjų skaičius yra 15.

Kadangi diapazone A1: C1 yra kintamųjų etikečių, todėl reikia pažymėti žymimąjį langelį Labels (etiketės). Tiesą sakant, rekomenduoju įtraukti etiketes kiekvieną kartą, kai pildote Input Y Range (įvesties Y diapazoną) ir Input X Range (įvesties X diapazoną). Šios etiketės yra naudingos, kai peržiūrite "Excel" grąžinamas suvestines ataskaitas.

3.2 pav.

Pažymėję žymimąjį langelį Residuals (likučiai), galite įgalinti "Excel" pateikti kiekvieno stebėjimo likučių sąrašą. Pažvelkite į 1 pav. iš viso yra 5 stebėjimai, todėl gausite 5 likučius. Likutis - tai kažkas, kas lieka, kai iš stebėtosios vertės atimate prognozuojamą vertę. Standartizuotas likutis - tai likutis, padalytas iš jo standartinio nuokrypio.

Taip pat galite pažymėti žymimąjį langelį Residual Plot (liekanų grafikas), kuris gali įgalinti "Excel" grąžinti liekanų grafikus. Liekanų grafikų skaičius lygus nepriklausomų kintamųjų skaičiui. Liekanų grafikas - tai grafikas, kuriame Y ašyje pavaizduotos liekanos, o x ašyje - nepriklausomi kintamieji. Atsitiktinai aplink x ašį išsklaidyti taškai liekanų grafike reiškia, kad tiesinė regresija Pavyzdžiui, 3.3 pav. pateikti trys tipiniai liekanų grafikų modeliai. Tik vienas iš jų kairiajame skydelyje rodo, kad jis gerai tinka tiesiniam modeliui. kiti du modeliai rodo, kad geriau tinka netiesiniam modeliui.

3.3 pav.

Jei pažymėsite žymimąjį langelį Line Fit Plots (tinkami linijos plotai), "Excel" grąžins pritaikytą tiesės grafiką. Pritaikytu tiesės grafiku galima nubraižyti vieno priklausomo ir vieno nepriklausomo kintamojo ryšį. Kitaip tariant, "Excel" jums grąžins tiek pat pritaikytų tiesės grafikų, kiek ir nepriklausomo kintamojo. Pavyzdžiui, mūsų uždaviniui spręsti gausite 2 pritaikytus tiesės grafikus.

Rezultatai

Paspaudus mygtuką Ok, "Excel" grąžins suvestinę ataskaitą, kaip nurodyta toliau. Žalia ir geltona spalva pažymėti langeliai yra svarbiausia dalis, į kurią turėtumėte atkreipti dėmesį.

3.4 pav.

Kuo didesnis R kvadratas (langelis F5), tuo glaudesnis ryšys egzistuoja tarp priklausomų ir nepriklausomų kintamųjų. O koeficientai (langelis F17: F19) trečioje lentelėje jums grąžino konstantų ir koeficientų reikšmes. Lygtis turėtų būti tokia: Metiniai pardavimai = 1589,2 + 19928,3*(Aukščiausi baigtos mokyklos metai) + 11,9*(Motyvacija, matuojama Higginso motyvacijos skale).

Tačiau, norėdami įsitikinti, ar rezultatai patikimi, taip pat turite patikrinti geltonai paryškintas p vertes. Tik jei p vertė langelyje J12 yra mažesnė nei 0,05, visa regresijos lygtis yra patikima. Tačiau taip pat turite patikrinti p vertes intervale I17: I19, kad įsitikintumėte, ar konstanta ir nepriklausomi kintamieji yra naudingi priklausomam kintamajam prognozuoti. Mūsų uždaviniui spręsti geriau atmestimotyvacija, kai svarstomi nepriklausomi kintamieji.

Skaityti daugiau: Kaip apskaičiuoti P reikšmę tiesinės regresijos programoje "Excel" (3 būdai)

Pašalinti motyvaciją iš nepriklausomų kintamųjų

Pašalinęs motyvaciją kaip nepriklausomą kintamąjį, taikiau tą patį metodą ir atlikau paprastą regresinę analizę. Matote, kad dabar visos reikšmės yra mažesnės nei 0,05. Galutinė lygtis turėtų būti tokia:

Metiniai pardavimai = 1167,8 + 19993,3*(aukščiausi baigtos mokyklos metai)

3.5 paveikslėlis [spustelėkite paveikslėlį, kad pamatytumėte visą vaizdą]

Pastaba

4 pav.

Be įrankio "Add-Ins", daugialypės regresijos analizei atlikti taip pat galite naudoti funkciją LINEST. Funkcija LINEST yra masyvo funkcija, kuri gali grąžinti rezultatą vienoje ląstelėje arba ląstelių intervale. Pirmiausia pasirinkite intervalą A8:B12 ir į pirmąją šio intervalo ląstelę (A8) įrašykite formulę "=LINEST (A2:A6, B2:B6, TRUE, TRUE)". Paspaudus CTRL + SHIFT +ENTER, "Excel" grąžins rezultatus kaiptoliau. Palyginę su 3.4 pav. matote, kad 19993,3 yra Aukščiausių baigtos mokyklos metų koeficientas, o 1167,8 yra pastovus. Bet kokiu atveju, rekomenduoju naudoti įrankį Add-Ins. Tai daug paprasčiau.

Skaityti daugiau...

Atvirkštinė "kas būtų, jeigu būtų" analizė programoje "Excel

Kaip naudoti "Excel" uždarosiomis raidėmis?

Atsisiųsti darbinį failą

Atsisiųskite darbinį failą iš toliau pateiktos nuorodos.

Daugialypės regresijos analizė.xlsx

Hugh Westas yra labai patyręs Excel treneris ir analitikas, turintis daugiau nei 10 metų patirtį šioje srityje. Jis yra įgijęs apskaitos ir finansų bakalauro bei verslo administravimo magistro laipsnius. Hugh turi aistrą mokymui ir sukūrė unikalų mokymo metodą, kurį lengva sekti ir suprasti. Jo ekspertinės žinios apie „Excel“ padėjo tūkstančiams studentų ir specialistų visame pasaulyje tobulinti savo įgūdžius ir tobulėti savo karjeroje. Savo tinklaraštyje Hugh dalijasi savo žiniomis su pasauliu, siūlydamas nemokamus „Excel“ vadovėlius ir internetinius mokymus, kad padėtų asmenims ir įmonėms išnaudoti visą savo potencialą.