Hoe outliers te finen mei Z-score yn Excel (mei rappe stappen)

  • Diel Dit
Hugh West

Yn statistyske kânsberekkeningen is de z-skoare fan primêr belang. Gegevensdistribúsjes en outliers yn in dataset kinne wurde bepaald mei dizze term. It is mooglik om se manuell te bepalen út in dataset. As jo ​​​​in gruttere dataset hawwe, binne d'r ferskate ark ta jo beskikking. Excel is ien fan har. As jo ​​​​op syk binne nei wat spesjale trúkjes om outliers te finen mei z-score yn Excel, binne jo op it goede plak kommen. Dit artikel sil elke stap fan 'e metoade besprekke om outliers te finen mei de z-score. Litte wy de folsleine hantlieding folgje om dit alles te learen.

Oefenwurkboek downloade

Download dit oefenwurkboek om te oefenjen wylst jo dit artikel lêze. It befettet alle datasets yn ferskate spreadsheets foar in dúdlik begryp. Besykje dysels wylst jo troch it stap-foar-stap proses gean.

Fyn Outliers mei Z Score.xlsx

Wat is Z Score?

Yn statistiken stiet de z-score foar de standertdeviaasje fan 'e befolking foar in bepaald gegevenspunt. Dizze maatregel fertelt ús hoe fier in spesifike wearde is fan it gemiddelde fan in set yn relaasje ta syn standertdeviaasje. (Standarddeviaasje is de RMS-wearde fan alle ferskillende punten en gemiddelde). De wiskundige formule foar de z-skoare is

Wêr,

Z = z-score

X =observearre wearde

= gemiddelde wearde

σ = standertdeviaasje

WatIs Outlier?

Outliers binne wearden dy't signifikant ferskille fan oare wearden yn in dataset. In oare manier om dit te sizzen is dat in outlier in wearde is dy't folle heger of leger is as de gemiddelde en mediaan fan 'e dataset. Yn in Excel-grafyk kinne jo de gegevenspunten dy't fier fuort bliuwe fan 'e oare gegevenspunten as útfallers beskôgje. Besjoch bygelyks in senario wêryn jo totale punten hawwe skoard troch 5 ferskillende spilers yn it NBA-seizoen. De skoare punten binne 1600, 1400, 300 en 1500. No, as jo in grafyk yn Excel tekenje, sille jo sjen dat punt 300 fier fuort fan 'e oaren leit. Dus, yn dizze 3000 is de outlier.

In outlier wurdt beskôge as in z-scorewearde binnen it berik fan 3 oant -3 om't dizze wearden frij fier fuort binne fan 'e wearde fan' e gemiddelde.

Stap-foar-stap proseduere om Outliers te finen mei Z-score yn Excel

Yn 'e folgjende paragraaf sille wy ien effektive en lestige metoade brûke om outliers te finen mei help fan de z-score yn Excel. Wy sille de z-skoare fan 'e stekproef bepale troch it berekkenjen fan de gemiddelde en standertdeviaasjes fan alle nûmers. En dan sille wy útrinners fan elke observaasje fine. Dizze seksje jout wiidweidige details oer dizze metoade. Jo moatte dit alles leare en tapasse om jo tinkfeardigens en Excel-kennis te ferbetterjen. Wy brûke hjir de Microsoft Office 365 ferzje, mar jo kinne elke oare ferzje brûke neffensnei jo foarkar.

Stap 1: Berekkenje Mean of Dataset

Yn it begjin sille wy it gemiddelde fan de dataset fine. Dit sil nuttich wêze foar it bepalen fan de standertdeviaasje en z-skoare. Har, wy brûke de AVERAGE-funksje om it gemiddelde fan 'e observaasje te bepalen. Dizze funksje nimt in searje arguminten as in berik fan wearden yn en jout har gemiddelde werom. Litte wy troch de stappen rinne om it gemiddelde fan de dataset te berekkenjen.

  • Selektearje earst it berik fan de sellen en typ de folgjende formule yn sel H4 .

=AVERAGE(C5:C20)

  • Druk dan op Enter .
  • As gefolch hawwe jo sil de gemiddelde wearde fan alle gegevens hawwe.

Lês mear: Hoe kinne jo útfallers fine mei standertdeviaasje yn Excel ( mei Quick Steps)

Stap 2: Skatte standertdeviaasje

No sille wy de standertdeviaasje skatte. Wy sille de STDEV.P-funksje brûke om de standertdeviaasjes foar de dataset te bepalen. Dizze funksje sil de standertdeviaasje werombringe fan in searje nûmers as berik fan wearden dy't it nimt as arguminten. Litte wy troch de stappen rinne om de standertdeviaasje te skatten.

  • Selektearje earst it berik fan de sellen en typ de folgjende formule yn sel H5 .

=STDEV.P(C5:C20)

  • Druk dan op Enter .
  • As gefolch hawwe jo de standertdeviaasjewearde foar alle gegevens.

Lês mear: How to Calculate Outliers in Excel (5 Easy Ways)

Stap 3: Evaluearje Z-score

No sille wy de z-score evaluearje. Om de z-skoare fan 'e wearden te bepalen, moatte wy earst it ferskil fan' e wearde fan 'e gemiddelde hawwe en dan diel it troch de standertdeviaasje neffens de formule. Litte wy troch de stappen rinne om de z-skoare te skatten.

  • Allerearst, om de z-skoare te evaluearjen, moatte jo de folgjende formule yn sel D5 typen.

=(C5-$H$4)/$H$5

  • Druk dan op Enter .
  • As gefolch hawwe jo sil de z-score hawwe foar de earste wearde yn 'e dataset.

  • Sleep dêrnei it Folle Handle -ikoan om yn te foljen de rest fan de sellen yn de kolom mei de formule.
  • As gefolch krije jo de z-score foar alle yngongen fan de dataset.

  • Yn ús dataset is de gemiddelde wearde 113.875 en de standertdeviaasje is 100.21 . No, as wy de spesifike wearde fan $79 beskôgje, is de z-skoare foar dizze wearde -0.347 wat betsjut dat $79 0.347 standert is ôfwikingen ûnder de gemiddelde of gemiddelde wearde.
  • Yn in oar gefal, as de wearde $500 is, krije wy de z-score 3.85 . Dat betsjut dat $500 3.85 standertdeviaasjes boppe de gemiddelde wearde is.

Lês mear: Hoe kinstFyn Outliers yn Regression Analysis yn Excel (3 Easy Ways)

Stap 4: Find Outliers from Dataset

No sille wy outliers fine yn ús dataset. In outlier wurdt beskôge as in z-skoarewearde binnen it berik fan 3 oant -3 , lykas hjirboppe neamd. Litte wy de stappen trochrinne om de outliers yn 'e dataset út te finen. Hjir sille wy de OF-funksje brûke om út te finen oft de wearden yn 'e dataset útfallers befetsje of net. As ien fan 'e wearden binnen it berik foldocht oan de betingst, dan sil it resultaat TRUE wêze.

  • Allearst, om útfallers te finen, moatte jo de folgjende formule yn 'e sel ynfiere. E5 .

=OR((D53))

  • Druk dan op Enter .
  • Dêrtroch sille jo útfine oft de earste wearde outliers befettet of net yn 'e dataset.

  • Folgjende, sleep it ikoan Fillhandtak om de rest fan de sellen yn de kolom yn te foljen mei de formule.
  • As gefolch kinne jo witte oft de wearden yn 'e dataset útsûnderings befetsje of net lykas hjirûnder werjûn.

Ut de boppesteande dataset kinne wy ​​sjen dat mar ien id's z-score boppe de wearde fan 3 is. Dêrom krije wy mar ien outlier .

No sille wy outliers sjen litte mei in Scatter -diagram. Wy moatte it folgjende proses folgje:

  • Selektearje earst it berik fan de sellen C5:D20 .
  • Gean dan nei de Ynfoegje tab. Selektearje Insert Scatter (X, Y) of Bubble Chart, en selektearje úteinlik Scatter .

  • As gefolch krije jo it folgjende diagram.

  • Om de diagramstyl te feroarjen, selektearje Chart Design en dan, selektearje jo winske Styl 9 opsje út de Chart Styles groep.

  • As gefolch krije jo it folgjende Scatter -diagram.

Lês Mear: Hoe to Find Outliers in Excel (5 Useful Ways)

Konklúzje

Dat is de ein fan de sesje fan hjoed. Ik leau sterk dat jo fan no ôf miskien útlizzers kinne fine mei z-score yn Excel. As jo ​​fragen of oanbefellings hawwe, diel se dan asjebleaft yn 'e kommentaar seksje hjirûnder.

Ferjit net ús webside Exceldemy.com te kontrolearjen foar ferskate Excel-relatearre problemen en oplossingen. Bliuw nije metoaden leare en bliuw groeie!

Hugh West is in tige betûfte Excel-trainer en analist mei mear as 10 jier ûnderfining yn 'e yndustry. Hy hat in bachelorstitel yn boekhâlding en finânsjes en in masterstitel yn bedriuwsadministraasje. Hugh hat in passy foar lesjaan en hat in unike lesoanpak ûntwikkele dy't maklik te folgjen en te begripen is. Syn saakkundige kennis fan Excel hat tûzenen studinten en professionals wrâldwiid holpen har feardigens te ferbetterjen en útblinke yn har karriêre. Troch syn blog dielt Hugh syn kennis mei de wrâld, en biedt fergese Excel-tutorials en online training om partikulieren en bedriuwen te helpen har folsleine potensjeel te berikken.