Hoe kinne jo regressionresultaten ynterpretearje yn Excel (detaillearre analyze)

Ynhâldsopjefte

Regression-analyze is yn hast alle soarten statistyske software lykas SPSS , R, en net te hawwen oer Excel. Regression kin ús it grutte byld jaan oer relaasjes tusken fariabelen. Lineêre regression kin frij fluch dien wurde yn Excel mei it ark Gegevensanalyse . Dit artikel sil sjen litte hoe't jo regression-resultaten ynterpretearje kinne yn Excel.

Download Oefenwurkboek

Download dit praktykwurkboek hjirûnder.

Regressionsresultaten ynterpretearje.xlsx

Sjoch ek: VLOOKUP en werom alle wedstriden yn Excel (7 manieren)

Wat is regression?

Regression-analyze wurdt faak brûkt yn data-analyze om de assosjaasjes tusken meardere fariabelen te bepalen. Regression-analyse lit jo kieze wat der bart mei de ôfhinklike fariabele as ien fan 'e ûnôfhinklike fariabelen feroaret. It lit jo ek wiskundich útfine hokker ûnôfhinklike fariabelen in ynfloed hawwe.

Ienfâldige lineêre regression is te ûnderskieden fan in meardere lineêre regression yn statistiken. Mei in lineêre funksje analyseart ienfâldige lineêre regression de assosjaasje tusken de fariabelen en ien ûnôfhinklike fariabele. Meardere lineêre regression is as twa of mear ferklearjende faktoaren brûkt wurde om de fariabelen te bepalen. It brûken fan net-lineêre regression ynstee fan de ôfhinklike fariabele wurdt beskreaun as in net-lineêre funksje, om't de gegevensrelaasjes net lineêr binne. Dit artikel sil konsintrearje op meardere lineêreregression om te demonstrearjen hoe't jo regressionresultaten kinne ynterpretearje yn Excel.

Stappen om regression te dwaan yn Excel

Foar regressiondoelen sille wy de ûndersteande dataset brûke foar analyze doelen. Hjir sil de ûnôfhinklike fariabele de kolom Priis en Sold kolom wêze. De kolom ûnôfhinklik sil de kolom Demand wêze.

Stappen

Wy moatte nei it ljepblêd Data gean en op de Data-analyze klikke om regression te dwaan .

Der sil in nij finster wêze; selektearje de ôfhinklike fariabele en ûnôfhinklike fariabele gegevensberik.
Kik dan it fakje Labels en Confidence oan.
Klikje dan op it útfierselberik fakje om it adres fan de útfiersel te selektearjen
Troch, tik op de Residual om de residualen te berekkenjen.
Dernei, markearje de Residual plots en Line Fit Plots boxes
Klik hjirnei OK .

Nei it klikken Okee, de primêre útfierparameters fan 'e analyze sille by de oantsjutte sellen wêze.

Dan krije jo ek wat parameters lykas Betekenis wearde ensfh yn de ANOVA ( Analysis of Variance ) tabel.
Hjir, df jout de frijheidsgraad yn ferbân mei de boarne fan fariânsje.
SS jout de som fan kwadraten oan. Jo model sil wjerspegelje de gegevens better as de Residual SS is lytser as de Totaal SS.
MS betsjut fjouwerkant.
F jout de F -test foar de nulhypoteze oan.
Betekenis F jout de P -wearde fan F oan.

Dan krije jo ek de koeffizienten, betsjuttingswearde, ensfh fan de fariabele yn in tabel.

Dan krije jo in lêste tabel ûnder de koeffizientabel dy't de restwearde foar elke yngong befettet.

Folgjende krije jo de Demand vs Priis regression chart, mei in trendline.

Nei dit krije jo de Demand vs Sold regression chart mei in trendline.

Der is in oare diagram mei de ferdieling fan residuen fan elke yngong fan 'e Sold fariabele.

Der is in oare grafyk dy't de ferdieling fan residualen toant fan elke yngong fan de Priis fariabele.

Dêrnei sille wy jo sjen litte hoe't jo kinne n ynterpretearje dizze regressionresultaten yn Excel.

Lês mear: Hoe kin ik logistyske regression yn Excel dwaan (mei rappe stappen)

Hoe ynterpretearje Regression Results in Excel

It folgjende ding dat jo moatte dwaan nei it dwaan fan de regression-analyse en ynterpretearje se. De útkomsten wurde hjirûnder beskreaun en útwurke.

Meardere R-Squared Regression Value Analysis

De R-kwadraat -nûmer jout oan hoe nau de eleminten fan de dataset besibbe binne en hoe goed de regressionline oerienkomt mei de gegevens. Wy sille de meardere lineêre regression-analyse brûke, wêryn wy de ynfloed fan twa of mear fariabelen op 'e haadfaktor sille bepale. Dit ferwiist nei hoe't de ôfhinklike fariabele feroaret as ien fan 'e ûnôfhinklike fariabelen feroaret. It berik fan dizze koeffizient is fan -1 oant 1. Hjir betsjut

1 in nauwe positive relaasje
0 betsjut dat der gjin relaasjes binne tusken fariabelen. Mei oare wurden, de gegevenspunten binne willekeurich.
-1 betsjut omkearde of negative relaasje tusken fariabelen.

Yn de hjirboppe werjûn útfierresultaten is de meardere R-wearde fan de opjûne gegevenssets is o.7578( sawat ), wat oanjout op sterke relaasjes tusken de fariabelen.

R-kwadraat

R-kwadraat wearde ferklearret hoe't de reaksje fan ôfhinklike fariabelen fariearret nei de ûnôfhinklike fariabele. Yn ús gefal is de wearde 0,574 (sawat), wat kin wurde ynterpretearre as in ridlik oke relaasje tusken de fariabelen.

Oanpast R-kwadraat

Dit is gewoan in alternative ferzje fan de R-kwadraat -wearde. Dit skodt gewoan de foarsizzer fariabelen by it foarsizzen fan de antwurd fariabele. It wurdt berekkene as

R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]

Hjir, R^2 : De R^2 -wearde dy't wy krigen hawwede dataset.

n : it oantal waarnimmings.

K : it oantal prediktorfariabelen.

De betsjutting fan dizze wearde ûntstiet by it dwaan fan regression-analyse tusken twa foarsizzer fariabelen. As d'r mear as ien foarsizzer fariabele is yn 'e dataset, dan sil de R-kwadraatwearde opblaasd wurde, wat heul net winsklik is. De oanpaste R-kwadraat wearde past dizze ynflaasje oan en jout in krekt byld fan de fariabelen.

Standertflater

In oare goed-of-fit-metrik dat jout de krektens fan jo regression analyze; hoe leger de wearde, hoe mear wis kinne jo wêze yn jo regression-analyze.

Standertflater is in empiryske metrik dy't de gemiddelde ôfstân fertsjintwurdiget dat de punten ôfwike fan de trendline. Yn tsjinstelling stiet R2 it oanpart fan ôfhinklike fariabele fariaasje foar. Yn dit gefal is de wearde fan Standertflater 288.9 ( sawat ), wat oanjout dat ús gegevenspunten gemiddeld 288.9 falle fan 'e trendline.

Observaasjes

Jou it oantal observaasjes of yngongen oan.

Bepale signifikante fariabele

De Betekeniswearde jout de betrouberens (statistysk goed) fan ús analyse oan. Mei oare wurden, it jout de kâns oan dat ús dataset ferkeard is. Dizze wearde moat ûnder 5% wêze. Mar yn dit gefal is ús betsjuttingswearde 0,00117,wat oerset nei 0,1%, dat is goed ûnder de 5%. Dat ús analyze is ok. Oars moatte wy miskien ferskate fariabelen kieze foar ús analyze.

P-wearde yn regression-analyze

Nau ferbûn mei in signifikante wearde, de P- wearde jout de kâns oan dat de koeffizientwearde ferkeard is. P-wearde jout de assosjaasje fan de nulhypoteze mei de fariabelen.

As jo p-wearde < it Betekenis nûmer, d'r is genôch bewiis om de nulweardehypoteze te fersmiten. Dit betsjut dat der in net-nul korrelaasje is tusken de fariabelen.

Mar as de p-wearde > Betekenis wearde, sil der net genôch bewiis wêze om de nulhypoteze. Dat jout oan dat der gjin korrelaasje tusken de fariabelen wêze koe.

In of case, de P-wearde fan fariabele Priis =0,000948 < 0,00117 (betekeniswearde),

Der is hjir dus gjin nulhypoteze oan de hân, en der is genôch bewiis om in korrelaasje tusken fariabelen te ferklearjen.

Oan de oare kant, foar de fariabele Sold , de (P-wearde) 0,0038515 < 0,0011723 (Betekeniswearde)

Der soe hjir dus in nulhypoteze oan de gong wêze kinne, en der is net genôch bewiis om in net-nul korrelaasje tusken fariabelen te ferklearjen.

Yn de measte gefallen is dizze P -wearde bepaalt oft in fariabele sil wêze yn de dataset of net. Wy moatte bygelyks de Sold fuortsmitefariabele om de robustheid fan 'e dataset te behâlden.

Regression Equation

As wy de lineêre regression-analyse yn Excel bepale, moat de trendline ek lineêr wêze. De algemiene foarm is:

Y=mX+C.

Hjir is Y de ôfhinklike fariabele.

En X is hjir de ûnôfhinklike fariabele, wat betsjut dat wy it effekt sille bepale fan de feroaring fan fariabele x op fariabele Y.

C sil gewoan de wearde wêze fan de Y-as krusing fan de line.

Yn dit gefal is de wearde fan 'e C -ôfskieding lyk oan 9502.109853

En de wearde fan m foar de twa fariabelen is -809.265 en 0.424818.

Dus, wy hawwe de definitive fergeliking foar de twa aparte fariabelen.

De earste is:

Y=-809.265771X+9502.12

En de fergeliking foar de twadde fariabele is:

Y=0.4248X+9502.12

Koëffisjinten

De koeffizienten dy't wy krigen binne m1=-809.2655 en m2=04248 . En interceptor, C= 9502.12 .

Earst jout de ynterceptorwearde oan dat de fraach 9502 sil wêze as de priis nul is.
En de wearden fan m jout de taryf wêrmei't fraach feroaret per ienheid fan priisferoaring. De priiskoëffisjintwearde is -809,265, wat oanjout dat in priisferheging per ienheid de fraach mei rûchwei 809 ienheden sakje sil.
Foar de twadde fariabele, Ferkocht, is de m-wearde 0,424. Dit jout oan dat de feroaring per ienheid ferkocht itemsil resultearje yn in 0424-tiid ienheid ferheging fan it produkt.

Residuals

It Residual ferskil tusken it orizjinele en de berekkene yngong fan de regression line is it ferskil. Residualen jouwe oan hoe fier de werklike wearde fan de line is. Bygelyks, de berekkene yngong fan 'e regression-analyze foar de earste yngong is 9497. En de earste oarspronklike wearde is 9500. Sa is it oerbliuwsel sawat 2.109.

Sjoch ek: Excel IFERROR-funksje om leech werom te jaan ynstee fan 0

T-Statistics Value

T-statyske wearde is de divyzje fan koeffizient troch de standertwearde. Hoe heger de wearde is, de bettere betrouberens fan de koeffizient jout oan.

Der is in oare betsjutting fan dizze wearde, dy't nedich is om de P-wearde te berekkenjen.

It 95% betrouwensynterval

Hjir it fertrouwen fan 'e fariabele dy't wy oan it begjin as 95 ynsteld hawwe. It kin lykwols feroarje.

Hjir wurdt de koeffizientwearde fan 'e legere 95% berekkene as 8496.84 betsjut dat de boppeste 95% wurdt berekkene as 10507.37,
Dit betsjut dat wylst ús haadkoëffisjint giet oer, 9502.1. der is in grutte kâns dat de wearde ûnder 8496 kin wêze foar 95% fan 'e gefallen en in 5% kâns dat it boppe 10507.37 is

Lês Mear:

Dingen om te ûnthâlden

✎ De metoade foar regression-analyze beoardielet allinich de relaasje tusken ûndersochte fariabelen. It befestiget gjin oarsaaklikens. Op oare manieren, allinich it aspektfan korrelaasje beskôget. As ien of oare hanneling wat feroarsaket, is it oarsaak wurden. Wannear't in feroaring fan ien fariabele feroarings makket, kin it beskôge wurde as oarsaaklik.

✎ Regression-analyze belemmert swier troch outliers. Alle soarten útfallers moatte fuortsmiten wurde foardat de analyze dien wurdt. Om de resultaten fan regression-analyze yn Excel te analysearjen en te ynterpretearjen, moatte jo dizze punten beskôgje.

Konklúzje

Om it gear te nimmen, wurdt de fraach "hoe't jo regressionsresultaten yn Excel ynterpretearje" beantwurde troch útwurke it analysearjen en letter ynterpretearje. De analyze wurdt dien fia it ark Data-analyze yn it ljepblêd Data .

Foar dit probleem is in wurkboek beskikber om te downloaden wêr't jo regressy-analyze kinne oefenje en ynterpretearje kinne. it.

Fiel jo frij om fragen of feedback te stellen fia de kommentaardiel. Elke suggestje foar it ferbetterjen fan de Exceldemy -mienskip sil tige wurdearre wêze.

Foarige post COUNTIFS unike wearden yn Excel (3 maklike manieren)

Folgjende post Hoe meitsje in dûbele balkegrafyk yn Excel (mei maklike stappen)

Hugh West

Hugh West is in tige betûfte Excel-trainer en analist mei mear as 10 jier ûnderfining yn 'e yndustry. Hy hat in bachelorstitel yn boekhâlding en finânsjes en in masterstitel yn bedriuwsadministraasje. Hugh hat in passy foar lesjaan en hat in unike lesoanpak ûntwikkele dy't maklik te folgjen en te begripen is. Syn saakkundige kennis fan Excel hat tûzenen studinten en professionals wrâldwiid holpen har feardigens te ferbetterjen en útblinke yn har karriêre. Troch syn blog dielt Hugh syn kennis mei de wrâld, en biedt fergese Excel-tutorials en online training om partikulieren en bedriuwen te helpen har folsleine potensjeel te berikken.

#EXEL.WIKI