Meervoudige regressie-analise met Excel

  • Deel Dit
Hugh West

Eenvoudige regressie -analise word algemeen gebruik om die verband tussen twee veranderlikes te skat, byvoorbeeld die verband tussen oesopbrengste en reënval of die verband tussen die smaak van brood en oondtemperatuur. Ons moet egter die verband tussen 'n afhanklike veranderlike en twee of meer onafhanklike veranderlikes meer dikwels as nie ondersoek. Byvoorbeeld, 'n eiendomsagent wil dalk weet of en hoe maatstawwe soos die grootte van die huis, die aantal slaapkamers en die gemiddelde inkomste van die buurt verband hou met die prys waarvoor 'n huis verkoop word. Hierdie soort probleem kan opgelos word deur meervoudige regressie-analise toe te pas. En hierdie artikel sal vir jou 'n opsomming gee van hoe om meervoudige regressie-analise te gebruik met behulp van Excel.

Probleem

Gestel ons het 5 ewekansig geselekteerde verkoopspersone geneem en die inligting ingesamel soos in die onderstaande tabel getoon. Of opvoeding of motivering 'n impak op jaarlikse verkope het of nie?

Hoogste Skooljaar voltooi Motivering as Gemeet deur Higgins motiveringskaal Jaarlikse verkope in dollars
12 32 $350,000
14 35 $399,765
15 45 $429 000
16 50 $435,000
18 65 $433 000

Vergelyking

Algemeen, veelvoudregressie-analise aanvaar dat daar 'n lineêre verband tussen die afhanklike veranderlike (y) en onafhanklike veranderlikes (x1, x2, x3 … xn) is. En hierdie soort lineêre verwantskap kan beskryf word deur die volgende formule te gebruik:

Y = konstante + β1*x1 + β2*x2+…+ βn*xn

Hier is die verduidelikings vir konstantes en koëffisiënte :

Y Die voorspelde waarde van Y
Konstante Die Y- snyp
β1 Die verandering in Y elke 1 inkrement verandering in x1
β2 Die verandering in Y elke 1 inkrement verandering in x2
βn Die verandering in Y elke 1 inkrement verandering in xn

Konstante en β1, β2… βn kan bereken word gebaseer op beskikbare monsterdata. Nadat jy waardes van konstante, β1, β2… βn gekry het, kan jy dit gebruik om die voorspellings te maak.

Wat ons probleem betref, is daar net twee faktore waarin ons belang het. Daarom sal die vergelyking wees:

Jaarlikse verkope = konstant + β1*(Hoogste jaar van skool voltooi) + β2*(Motivering soos gemeet deur Higgins motiveringskaal)

Stel model

Jaarlikse verkope, hoogste jaar van skool voltooi en Motivering is in kolom A, kolom B en kolom C ingevoer soos in Figuur 1 getoon. Dit is beter om altyd die afhanklike veranderlike (Jaarlikse verkope hier) voor die onafhanklike veranderlikes te plaas .

Figuur 1

Laai Analysis ToolPak af

Excelbied ons data-analise-funksie wat waardes van konstantes en koëffisiënte kan terugstuur. Maar voordat u hierdie funksie gebruik, moet u Analysis ToolPak aflaai. Hier is hoe jy dit kan installeer.

Klik op die Lêer -oortjie -> Opsies en klik dan op Byvoegings in Excel-opsies -dialoogkassie. Klik op die Gaan -knoppie onderaan die Excel-opsies -dialoogkassie om die byvoegings -dialoogkassie oop te maak. In die Byvoegings dialoogkassie, kies Analise TookPak merkblokkie en klik dan op Ok .

As jy nou op klik Data -oortjie, jy sal sien Data-analise verskyn in die Analise -groep (regterpaneel).

Figuur 2 [kliek op die prent om kry 'n volledige aansig]

Meervoudige regressie-analise

Klik op Data-analise in die Analise -groep op die Data -oortjie . Kies Regressie in die dialoogvenster Data-analise wat gevra word. Jy kan ook ander statistiese analise doen soos t-toets, ANOVA, ensovoorts.

Figuur 3.1

A Regressie dialoogkassie sal gevra word nadat jy Regressie gekies het. Vul die dialoogkassie soos in Figuur 3.2 getoon.

Invoer Y-reeks bevat die afhanklike veranderlike en data terwyl die Invoer X-reeks onafhanklike veranderlikes en data bevat. Hier moet ek jou daaraan herinner dat onafhanklike veranderlikes in aangrensende kolomme moet wees. En die maksimum aantal onafhanklike veranderlikes is 15.

Sedertreeks A1: C1 sluit veranderlike etikette in en daarom moet Labels-merkblokkie gekies word. Trouens, ek raai jou aan om etikette in te sluit elke keer wanneer jy Invoer Y-reeks en Invoer X-reeks invul. Hierdie byskrifte is nuttig wanneer jy opsommingsverslae hersien wat deur Excel teruggestuur word.

Figuur 3.2

Deur die Residuele-merkblokkie te kies, kan jy Excel in staat stel om residue vir elke waarneming te lys. Kyk na Figuur 1, daar is 5 waarnemings in totaal en jy sal 5 residue kry. Residueel is iets wat oorbly wanneer jy die voorspelde waarde van die waargenome waarde aftrek. Gestandaardiseerde residu is die res gedeel deur sy standaardafwyking.

Jy kan ook die Residual Plot-merkblokkie kies wat Excel in staat kan stel om residuele plotte terug te gee. Die aantal oorblywende plotte is gelyk aan die aantal onafhanklike veranderlikes. 'n Oorblywende plot is 'n grafiek wat die residue op die Y-as en onafhanklike veranderlikes op die x-as toon. Willekeurig verspreide punte rondom die x-as in 'n residuele plot impliseer dat die lineêre regressie -model toepaslik is. Byvoorbeeld, Figuur 3.3 toon drie tipiese patrone van oorblywende plotte. Slegs die een in die linkerpaneel dui aan dat dit goed pas by 'n lineêre model. Die ander twee patrone stel 'n beter passing vir 'n nie-lineêre model voor.

Figuur 3.3

Excel sal 'n gepaste lyngrafiek terugstuur as jy die Line Fit Plots-merkblokkie kies. 'n Ingeboude lyn plotkan die verband tussen een afhanklike veranderlike en een onafhanklike veranderlike plot. Met ander woorde, Excel sal vir jou dieselfde aantal toegeruste lyngrafieke terugstuur as dié van die onafhanklike veranderlike. Byvoorbeeld, jy sal 2 toegeruste lyn plotte vir ons probleem kry.

Resultate

Nadat jy op die Ok-knoppie geklik het, sal Excel 'n opsommende verslag soos hieronder terugstuur. Selle wat in groen en geel uitgelig is, is die belangrikste deel waaraan jy aandag moet gee.

Figuur 3.4

Hoe hoër R-vierkant (sel F5), die noue verhouding bestaan tussen afhanklike veranderlikes en onafhanklike veranderlikes. En koëffisiënte (reeks F17: F19) in die derde tabel het vir jou die waardes van konstantes en koëffisiënte teruggegee. Die vergelyking moet Jaarlikse verkope = 1589,2 + 19928,3*(Hoogste jaar van skool voltooi) + 11,9*(Motivering soos gemeet deur Higgins-motiveringskaal) wees.

Om te sien of die resultate betroubaar is, moet jy egter ook om p-waardes gemerk in geel na te gaan. Slegs as p-waarde in sel J12 minder as 0,05 is, is die hele regressievergelyking betroubaar. Maar jy moet ook p-waardes in reeks I17: I19 nagaan om te sien of konstante en onafhanklike veranderlikes nuttig is vir die voorspelling van die afhanklike veranderlike. Vir ons probleem is dit beter vir ons om motivering weg te gooi wanneer ons onafhanklike veranderlikes oorweeg.

Lees meer: ​​Hoe om P-waarde in lineêre regressie in Excel te bereken (3)Maniere)

Verwyder motivering van onafhanklike veranderlikes

Nadat ek Motivering as die onafhanklike veranderlike geskrap het, het ek dieselfde benadering toegepas en 'n eenvoudige regressie-analise gedoen. Jy kan sien dat al die waardes nou minder as 0,05 is. Die finale vergelyking moet wees:

Jaarlikse verkope = 1167.8 + 19993.3*(Hoogste jaar van skool voltooi)

Figuur 3.5 [klik op die prent om 'n volledige aansig te kry]

Nota

Figuur 4

Behalwe Byvoegings-instrument, kan jy ook LINEST-funksie gebruik om meervoudige regressie-analise te doen. LINEST-funksie is 'n skikkingsfunksie wat die resultaat in óf een sel óf 'n reeks selle kan terugstuur. Kies eerstens reeks A8:B12 en voer dan formule "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" in die eerste sel van hierdie reeks in (A8). Nadat u CTRL + SHIFT + ENTER gedruk het, sal Excel resultate soos hieronder gee. Deur met Figuur 3.4 te vergelyk, kan jy sien dat 19993.3 die koëffisiënt van Hoogste skooljaar voltooi is terwyl 1167.8 konstant is. In elk geval, ek beveel aan dat u byvoegingsinstrument gebruik. Dit is baie makliker.

Lees meer...

Omgekeerde Wat-As-analise in Excel

Hoe om jokertekens in Excel te gebruik?

Laai werklêer af

Laai die werklêer af vanaf die skakel hieronder.

Multiple-Regression-Analyse. xlsx

Hugh West is 'n hoogs ervare Excel-afrigter en ontleder met meer as 10 jaar ondervinding in die bedryf. Hy het 'n Baccalaureusgraad in Rekeningkunde en Finansies en 'n Meestersgraad in Besigheidsadministrasie. Hugh het 'n passie vir onderrig en het 'n unieke onderrigbenadering ontwikkel wat maklik is om te volg en te verstaan. Sy kundige kennis van Excel het duisende studente en professionele persone wêreldwyd gehelp om hul vaardighede te verbeter en uit te blink in hul loopbane. Deur sy blog deel Hugh sy kennis met die wêreld, en bied gratis Excel-tutoriale en aanlyn opleiding aan om individue en besighede te help om hul volle potensiaal te bereik.