INHOUDSOPGAWE
Eenvoudige regressie -analise word algemeen gebruik om die verband tussen twee veranderlikes te skat, byvoorbeeld die verband tussen oesopbrengste en reënval of die verband tussen die smaak van brood en oondtemperatuur. Ons moet egter die verband tussen 'n afhanklike veranderlike en twee of meer onafhanklike veranderlikes meer dikwels as nie ondersoek. Byvoorbeeld, 'n eiendomsagent wil dalk weet of en hoe maatstawwe soos die grootte van die huis, die aantal slaapkamers en die gemiddelde inkomste van die buurt verband hou met die prys waarvoor 'n huis verkoop word. Hierdie soort probleem kan opgelos word deur meervoudige regressie-analise toe te pas. En hierdie artikel sal vir jou 'n opsomming gee van hoe om meervoudige regressie-analise te gebruik met behulp van Excel.
Probleem
Gestel ons het 5 ewekansig geselekteerde verkoopspersone geneem en die inligting ingesamel soos in die onderstaande tabel getoon. Of opvoeding of motivering 'n impak op jaarlikse verkope het of nie?
Hoogste Skooljaar voltooi | Motivering as Gemeet deur Higgins motiveringskaal | Jaarlikse verkope in dollars |
12 | 32 | $350,000 |
14 | 35 | $399,765 |
15 | 45 | $429 000 |
16 | 50 | $435,000 |
18 | 65 | $433 000 |
Vergelyking
Algemeen, veelvoudregressie-analise aanvaar dat daar 'n lineêre verband tussen die afhanklike veranderlike (y) en onafhanklike veranderlikes (x1, x2, x3 … xn) is. En hierdie soort lineêre verwantskap kan beskryf word deur die volgende formule te gebruik:
Y = konstante + β1*x1 + β2*x2+…+ βn*xn
Hier is die verduidelikings vir konstantes en koëffisiënte :
Y | Die voorspelde waarde van Y |
Konstante | Die Y- snyp |
β1 | Die verandering in Y elke 1 inkrement verandering in x1 |
β2 | Die verandering in Y elke 1 inkrement verandering in x2 |
… | … |
βn | Die verandering in Y elke 1 inkrement verandering in xn |
Konstante en β1, β2… βn kan bereken word gebaseer op beskikbare monsterdata. Nadat jy waardes van konstante, β1, β2… βn gekry het, kan jy dit gebruik om die voorspellings te maak.
Wat ons probleem betref, is daar net twee faktore waarin ons belang het. Daarom sal die vergelyking wees:
Jaarlikse verkope = konstant + β1*(Hoogste jaar van skool voltooi) + β2*(Motivering soos gemeet deur Higgins motiveringskaal)
Stel model
Jaarlikse verkope, hoogste jaar van skool voltooi en Motivering is in kolom A, kolom B en kolom C ingevoer soos in Figuur 1 getoon. Dit is beter om altyd die afhanklike veranderlike (Jaarlikse verkope hier) voor die onafhanklike veranderlikes te plaas .
Figuur 1
Laai Analysis ToolPak af
Excelbied ons data-analise-funksie wat waardes van konstantes en koëffisiënte kan terugstuur. Maar voordat u hierdie funksie gebruik, moet u Analysis ToolPak aflaai. Hier is hoe jy dit kan installeer.
Klik op die Lêer -oortjie -> Opsies en klik dan op Byvoegings in Excel-opsies -dialoogkassie. Klik op die Gaan -knoppie onderaan die Excel-opsies -dialoogkassie om die byvoegings -dialoogkassie oop te maak. In die Byvoegings dialoogkassie, kies Analise TookPak merkblokkie en klik dan op Ok .
As jy nou op klik Data -oortjie, jy sal sien Data-analise verskyn in die Analise -groep (regterpaneel).
Figuur 2 [kliek op die prent om kry 'n volledige aansig]
Meervoudige regressie-analise
Klik op Data-analise in die Analise -groep op die Data -oortjie . Kies Regressie in die dialoogvenster Data-analise wat gevra word. Jy kan ook ander statistiese analise doen soos t-toets, ANOVA, ensovoorts.
Figuur 3.1
A Regressie dialoogkassie sal gevra word nadat jy Regressie gekies het. Vul die dialoogkassie soos in Figuur 3.2 getoon.
Invoer Y-reeks bevat die afhanklike veranderlike en data terwyl die Invoer X-reeks onafhanklike veranderlikes en data bevat. Hier moet ek jou daaraan herinner dat onafhanklike veranderlikes in aangrensende kolomme moet wees. En die maksimum aantal onafhanklike veranderlikes is 15.
Sedertreeks A1: C1 sluit veranderlike etikette in en daarom moet Labels-merkblokkie gekies word. Trouens, ek raai jou aan om etikette in te sluit elke keer wanneer jy Invoer Y-reeks en Invoer X-reeks invul. Hierdie byskrifte is nuttig wanneer jy opsommingsverslae hersien wat deur Excel teruggestuur word.
Figuur 3.2
Deur die Residuele-merkblokkie te kies, kan jy Excel in staat stel om residue vir elke waarneming te lys. Kyk na Figuur 1, daar is 5 waarnemings in totaal en jy sal 5 residue kry. Residueel is iets wat oorbly wanneer jy die voorspelde waarde van die waargenome waarde aftrek. Gestandaardiseerde residu is die res gedeel deur sy standaardafwyking.
Jy kan ook die Residual Plot-merkblokkie kies wat Excel in staat kan stel om residuele plotte terug te gee. Die aantal oorblywende plotte is gelyk aan die aantal onafhanklike veranderlikes. 'n Oorblywende plot is 'n grafiek wat die residue op die Y-as en onafhanklike veranderlikes op die x-as toon. Willekeurig verspreide punte rondom die x-as in 'n residuele plot impliseer dat die lineêre regressie -model toepaslik is. Byvoorbeeld, Figuur 3.3 toon drie tipiese patrone van oorblywende plotte. Slegs die een in die linkerpaneel dui aan dat dit goed pas by 'n lineêre model. Die ander twee patrone stel 'n beter passing vir 'n nie-lineêre model voor.
Figuur 3.3
Excel sal 'n gepaste lyngrafiek terugstuur as jy die Line Fit Plots-merkblokkie kies. 'n Ingeboude lyn plotkan die verband tussen een afhanklike veranderlike en een onafhanklike veranderlike plot. Met ander woorde, Excel sal vir jou dieselfde aantal toegeruste lyngrafieke terugstuur as dié van die onafhanklike veranderlike. Byvoorbeeld, jy sal 2 toegeruste lyn plotte vir ons probleem kry.
Resultate
Nadat jy op die Ok-knoppie geklik het, sal Excel 'n opsommende verslag soos hieronder terugstuur. Selle wat in groen en geel uitgelig is, is die belangrikste deel waaraan jy aandag moet gee.
Figuur 3.4
Hoe hoër R-vierkant (sel F5), die noue verhouding bestaan tussen afhanklike veranderlikes en onafhanklike veranderlikes. En koëffisiënte (reeks F17: F19) in die derde tabel het vir jou die waardes van konstantes en koëffisiënte teruggegee. Die vergelyking moet Jaarlikse verkope = 1589,2 + 19928,3*(Hoogste jaar van skool voltooi) + 11,9*(Motivering soos gemeet deur Higgins-motiveringskaal) wees.
Om te sien of die resultate betroubaar is, moet jy egter ook om p-waardes gemerk in geel na te gaan. Slegs as p-waarde in sel J12 minder as 0,05 is, is die hele regressievergelyking betroubaar. Maar jy moet ook p-waardes in reeks I17: I19 nagaan om te sien of konstante en onafhanklike veranderlikes nuttig is vir die voorspelling van die afhanklike veranderlike. Vir ons probleem is dit beter vir ons om motivering weg te gooi wanneer ons onafhanklike veranderlikes oorweeg.
Lees meer: Hoe om P-waarde in lineêre regressie in Excel te bereken (3)Maniere)
Verwyder motivering van onafhanklike veranderlikes
Nadat ek Motivering as die onafhanklike veranderlike geskrap het, het ek dieselfde benadering toegepas en 'n eenvoudige regressie-analise gedoen. Jy kan sien dat al die waardes nou minder as 0,05 is. Die finale vergelyking moet wees:
Jaarlikse verkope = 1167.8 + 19993.3*(Hoogste jaar van skool voltooi)
Figuur 3.5 [klik op die prent om 'n volledige aansig te kry]
Nota
Figuur 4
Behalwe Byvoegings-instrument, kan jy ook LINEST-funksie gebruik om meervoudige regressie-analise te doen. LINEST-funksie is 'n skikkingsfunksie wat die resultaat in óf een sel óf 'n reeks selle kan terugstuur. Kies eerstens reeks A8:B12 en voer dan formule "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" in die eerste sel van hierdie reeks in (A8). Nadat u CTRL + SHIFT + ENTER gedruk het, sal Excel resultate soos hieronder gee. Deur met Figuur 3.4 te vergelyk, kan jy sien dat 19993.3 die koëffisiënt van Hoogste skooljaar voltooi is terwyl 1167.8 konstant is. In elk geval, ek beveel aan dat u byvoegingsinstrument gebruik. Dit is baie makliker.
Lees meer...
Omgekeerde Wat-As-analise in Excel
Hoe om jokertekens in Excel te gebruik?
Laai werklêer af
Laai die werklêer af vanaf die skakel hieronder.
Multiple-Regression-Analyse. xlsx