Ynhâldsopjefte
Yn statistyske kânsberekkeningen is de z-skoare fan primêr belang. Gegevensdistribúsjes en outliers yn in dataset kinne wurde bepaald mei dizze term. It is mooglik om se manuell te bepalen út in dataset. As jo in gruttere dataset hawwe, binne d'r ferskate ark ta jo beskikking. Excel is ien fan har. As jo op syk binne nei wat spesjale trúkjes om outliers te finen mei z-score yn Excel, binne jo op it goede plak kommen. Dit artikel sil elke stap fan 'e metoade besprekke om outliers te finen mei de z-score. Litte wy de folsleine hantlieding folgje om dit alles te learen.
Oefenwurkboek downloade
Download dit oefenwurkboek om te oefenjen wylst jo dit artikel lêze. It befettet alle datasets yn ferskate spreadsheets foar in dúdlik begryp. Besykje dysels wylst jo troch it stap-foar-stap proses gean.
Fyn Outliers mei Z Score.xlsx
Wat is Z Score?
Yn statistiken stiet de z-score foar de standertdeviaasje fan 'e befolking foar in bepaald gegevenspunt. Dizze maatregel fertelt ús hoe fier in spesifike wearde is fan it gemiddelde fan in set yn relaasje ta syn standertdeviaasje. (Standarddeviaasje is de RMS-wearde fan alle ferskillende punten en gemiddelde). De wiskundige formule foar de z-skoare is
Wêr,
Z = z-score
X =observearre wearde
x̅ = gemiddelde wearde
σ = standertdeviaasje
WatIs Outlier?
Outliers binne wearden dy't signifikant ferskille fan oare wearden yn in dataset. In oare manier om dit te sizzen is dat in outlier in wearde is dy't folle heger of leger is as de gemiddelde en mediaan fan 'e dataset. Yn in Excel-grafyk kinne jo de gegevenspunten dy't fier fuort bliuwe fan 'e oare gegevenspunten as útfallers beskôgje. Besjoch bygelyks in senario wêryn jo totale punten hawwe skoard troch 5 ferskillende spilers yn it NBA-seizoen. De skoare punten binne 1600, 1400, 300 en 1500. No, as jo in grafyk yn Excel tekenje, sille jo sjen dat punt 300 fier fuort fan 'e oaren leit. Dus, yn dizze 3000 is de outlier.
In outlier wurdt beskôge as in z-scorewearde binnen it berik fan 3 oant -3 om't dizze wearden frij fier fuort binne fan 'e wearde fan' e gemiddelde.
Stap-foar-stap proseduere om Outliers te finen mei Z-score yn Excel
Yn 'e folgjende paragraaf sille wy ien effektive en lestige metoade brûke om outliers te finen mei help fan de z-score yn Excel. Wy sille de z-skoare fan 'e stekproef bepale troch it berekkenjen fan de gemiddelde en standertdeviaasjes fan alle nûmers. En dan sille wy útrinners fan elke observaasje fine. Dizze seksje jout wiidweidige details oer dizze metoade. Jo moatte dit alles leare en tapasse om jo tinkfeardigens en Excel-kennis te ferbetterjen. Wy brûke hjir de Microsoft Office 365 ferzje, mar jo kinne elke oare ferzje brûke neffensnei jo foarkar.
Stap 1: Berekkenje Mean of Dataset
Yn it begjin sille wy it gemiddelde fan de dataset fine. Dit sil nuttich wêze foar it bepalen fan de standertdeviaasje en z-skoare. Har, wy brûke de AVERAGE-funksje om it gemiddelde fan 'e observaasje te bepalen. Dizze funksje nimt in searje arguminten as in berik fan wearden yn en jout har gemiddelde werom. Litte wy troch de stappen rinne om it gemiddelde fan de dataset te berekkenjen.
- Selektearje earst it berik fan de sellen en typ de folgjende formule yn sel H4 .
=AVERAGE(C5:C20)
- Druk dan op Enter .
- As gefolch hawwe jo sil de gemiddelde wearde fan alle gegevens hawwe.
Lês mear: Hoe kinne jo útfallers fine mei standertdeviaasje yn Excel ( mei Quick Steps)
Stap 2: Skatte standertdeviaasje
No sille wy de standertdeviaasje skatte. Wy sille de STDEV.P-funksje brûke om de standertdeviaasjes foar de dataset te bepalen. Dizze funksje sil de standertdeviaasje werombringe fan in searje nûmers as berik fan wearden dy't it nimt as arguminten. Litte wy troch de stappen rinne om de standertdeviaasje te skatten.
- Selektearje earst it berik fan de sellen en typ de folgjende formule yn sel H5 .
=STDEV.P(C5:C20)
- Druk dan op Enter .
- As gefolch hawwe jo de standertdeviaasjewearde foar alle gegevens.
Lês mear: How to Calculate Outliers in Excel (5 Easy Ways)
Stap 3: Evaluearje Z-score
No sille wy de z-score evaluearje. Om de z-skoare fan 'e wearden te bepalen, moatte wy earst it ferskil fan' e wearde fan 'e gemiddelde hawwe en dan diel it troch de standertdeviaasje neffens de formule. Litte wy troch de stappen rinne om de z-skoare te skatten.
- Allerearst, om de z-skoare te evaluearjen, moatte jo de folgjende formule yn sel D5 typen.
=(C5-$H$4)/$H$5
- Druk dan op Enter .
- As gefolch hawwe jo sil de z-score hawwe foar de earste wearde yn 'e dataset.
- Sleep dêrnei it Folle Handle -ikoan om yn te foljen de rest fan de sellen yn de kolom mei de formule.
- As gefolch krije jo de z-score foar alle yngongen fan de dataset.
- Yn ús dataset is de gemiddelde wearde 113.875 en de standertdeviaasje is 100.21 . No, as wy de spesifike wearde fan $79 beskôgje, is de z-skoare foar dizze wearde -0.347 wat betsjut dat $79 0.347 standert is ôfwikingen ûnder de gemiddelde of gemiddelde wearde.
- Yn in oar gefal, as de wearde $500 is, krije wy de z-score 3.85 . Dat betsjut dat $500 3.85 standertdeviaasjes boppe de gemiddelde wearde is.
Lês mear: Hoe kinstFyn Outliers yn Regression Analysis yn Excel (3 Easy Ways)
Stap 4: Find Outliers from Dataset
No sille wy outliers fine yn ús dataset. In outlier wurdt beskôge as in z-skoarewearde binnen it berik fan 3 oant -3 , lykas hjirboppe neamd. Litte wy de stappen trochrinne om de outliers yn 'e dataset út te finen. Hjir sille wy de OF-funksje brûke om út te finen oft de wearden yn 'e dataset útfallers befetsje of net. As ien fan 'e wearden binnen it berik foldocht oan de betingst, dan sil it resultaat TRUE wêze.
- Allearst, om útfallers te finen, moatte jo de folgjende formule yn 'e sel ynfiere. E5 .
=OR((D53))
- Druk dan op Enter .
- Dêrtroch sille jo útfine oft de earste wearde outliers befettet of net yn 'e dataset.
- Folgjende, sleep it ikoan Fillhandtak om de rest fan de sellen yn de kolom yn te foljen mei de formule.
- As gefolch kinne jo witte oft de wearden yn 'e dataset útsûnderings befetsje of net lykas hjirûnder werjûn.
Ut de boppesteande dataset kinne wy sjen dat mar ien id's z-score boppe de wearde fan 3 is. Dêrom krije wy mar ien outlier .
No sille wy outliers sjen litte mei in Scatter -diagram. Wy moatte it folgjende proses folgje:
- Selektearje earst it berik fan de sellen C5:D20 .
- Gean dan nei de Ynfoegje tab. Selektearje Insert Scatter (X, Y) of Bubble Chart, en selektearje úteinlik Scatter .
- As gefolch krije jo it folgjende diagram.
- Om de diagramstyl te feroarjen, selektearje Chart Design en dan, selektearje jo winske Styl 9 opsje út de Chart Styles groep.
- As gefolch krije jo it folgjende Scatter -diagram.
Lês Mear: Hoe to Find Outliers in Excel (5 Useful Ways)
Konklúzje
Dat is de ein fan de sesje fan hjoed. Ik leau sterk dat jo fan no ôf miskien útlizzers kinne fine mei z-score yn Excel. As jo fragen of oanbefellings hawwe, diel se dan asjebleaft yn 'e kommentaar seksje hjirûnder.
Ferjit net ús webside Exceldemy.com te kontrolearjen foar ferskate Excel-relatearre problemen en oplossingen. Bliuw nije metoaden leare en bliuw groeie!