Hvordan finne outliers ved å bruke Z Score i Excel (med raske trinn)

  • Dele Denne
Hugh West

I statistiske sannsynlighetsberegninger er z-skåren av primær betydning. Datadistribusjoner og uteliggere i et datasett kan bestemmes med denne termen. Det er mulig å bestemme dem manuelt fra et datasett. Hvis du har et større datasett, er det flere verktøy til disposisjon. Excel er en av dem. Hvis du leter etter noen spesielle triks for å finne uteliggere ved å bruke z-score i Excel, har du kommet til rett sted. Denne artikkelen vil diskutere hvert trinn i metoden for å finne uteliggere ved å bruke z-poengsummen. La oss følge den komplette veiledningen for å lære alt dette.

Last ned øvelsesarbeidsbok

Last ned denne øvelsesarbeidsboken for å trene mens du leser denne artikkelen. Den inneholder alle datasettene i forskjellige regneark for en klar forståelse. Prøv selv mens du går gjennom trinn-for-trinn-prosessen.

Finn outliers ved å bruke Z Score.xlsx

Hva er Z Score?

I statistikk representerer z-poengsummen standardavviket fra populasjonen for et bestemt datapunkt. Dette målet forteller oss hvor langt en spesifikk verdi er fra gjennomsnittet av et sett i forhold til standardavviket. (Standardavvik er RMS-verdien for alle de forskjellige punktene og gjennomsnittet). Den matematiske formelen for z-poengsummen er

Hvor,

Z = z-poengsum

X =observert verdi

= middelverdi

σ = standardavvik

HvaEr Outlier?

Outliers er verdier som er vesentlig forskjellige fra andre verdier i et datasett. En annen måte å si dette på er at en uteligger er en verdi som er mye høyere eller lavere enn gjennomsnittet og medianen til datasettet. I en Excel-graf kan du vurdere datapunktene som forblir langt unna de andre datapunktene som uteliggere. Tenk for eksempel på et scenario der du har totalt poeng scoret av 5 forskjellige spillere i NBA-sesongen. Poengsummen er 1600, 1400, 300 og 1500. Nå, hvis du plotter en graf i Excel, vil du se at punkt 300 ligger langt unna de andre. Så i denne er 3000 uteliggeren.

En uteligger anses å være en z-scoreverdi innenfor området 3 til -3 fordi disse verdiene er ganske fjernt fra verdien av gjennomsnittet.

Trinn-for-trinn prosedyre for å finne uteliggere ved å bruke Z-score i Excel

I den følgende delen vil vi bruke én effektiv og vanskelig metode for å finne uteliggere ved å bruke z-poengsummen i Excel. Vi skal bestemme z-poengsummen til prøven ved å beregne gjennomsnittet og standardavviket for alle tall. Og så vil vi finne uteliggere for hver observasjon. Denne delen gir omfattende detaljer om denne metoden. Du bør lære og bruke alle disse for å forbedre din tenkeevne og Excel-kunnskap. Vi bruker Microsoft Office 365 -versjonen her, men du kan bruke hvilken som helst annen versjon iht.til din preferanse.

Trinn 1: Beregn gjennomsnitt av datasett

I begynnelsen skal vi finne gjennomsnittet av datasettet. Dette vil være nyttig for å bestemme standardavviket og z-score. Her bruker vi AVERAGE-funksjonen for å bestemme gjennomsnittet av observasjonen. Denne funksjonen tar inn en rekke argumenter eller en rekke verdier og returnerer deres gjennomsnitt. La oss gå gjennom trinnene for å beregne gjennomsnittet av datasettet.

  • Først av alt, velg celleområdet og skriv inn følgende formel i celle H4 .

=AVERAGE(C5:C20)

  • Trykk deretter Enter .
  • Som en konsekvens kan du vil ha middelverdien av alle dataene.

Les mer: Hvordan finne uteliggere med standardavvik i Excel ( med Quick Steps)

Trinn 2: Estimer standardavvik

Nå skal vi estimere standardavviket. Vi vil bruke STDEV.P-funksjonen for å bestemme standardavvikene for datasettet. Denne funksjonen vil returnere standardavviket fra en serie med tall eller verdiområde den tar som argumenter. La oss gå gjennom trinnene for å estimere standardavviket.

  • Først av alt, velg celleområdet og skriv inn følgende formel i celle H5 .

=STDEV.P(C5:C20)

  • Trykk deretter Enter .
  • Som en konsekvens vil du ha standardavviketverdi for alle dataene.

Les mer: How to Calculate Outliers in Excel (5 Easy Ways)

Trinn 3: Evaluer Z-poengsum

Nå skal vi evaluere z-poengsummen. For å bestemme z-poengsummen til verdiene, trenger vi først og fremst forskjellen mellom verdien fra gjennomsnittet og deretter dele den med standardavviket i henhold til formelen. La oss gå gjennom trinnene for å beregne z-poengsummen.

  • Først av alt, for å evaluere z-poengsummen, må du skrive inn følgende formel i celle D5 .

=(C5-$H$4)/$H$5

  • Trykk deretter Enter .
  • Som et resultat kan du vil ha z-poengsum for den første verdien i datasettet.

  • Deretter drar du Fyllhåndtak -ikonet for å fylle ut resten av cellene i kolonnen med formelen.
  • Som en konsekvens vil du få z-poengsum for alle oppføringene i datasettet.

  • I vårt datasett er gjennomsnittsverdien 113.875 og standardavviket er 100.21 . Nå, hvis vi vurderer den spesifikke verdien av $79 , er z-poengsummen for denne verdien -0,347 som betyr at $79 er 0,347 standard avvik under middelverdien eller gjennomsnittsverdien.
  • I et annet tilfelle, når verdien er $500 , får vi z-skåren 3,85 . Det betyr at $500 er 3,85 standardavvik over gjennomsnittsverdien.

Les mer: HvordanFinn outliers i regresjonsanalyse i Excel (3 enkle måter)

Trinn 4: Finn outliers fra datasett

Nå skal vi finne ut outliers i datasettet vårt. En uteligger anses å være en z-scoreverdi innenfor området 3 til -3 , som nevnt ovenfor. La oss gå gjennom trinnene for å finne ut avvikene i datasettet. Her vil vi bruke ELLER-funksjonen for å finne ut om verdiene i datasettet inneholder uteliggere eller ikke. Hvis noen av verdiene innenfor området tilfredsstiller betingelsen, vil resultatet være TRUE.

  • Først av alt, for å finne uteliggere, må du skrive inn følgende formel i cellen E5 .

=OR((D53))

  • Deretter trykker du Enter .
  • Som et resultat vil du finne ut om den første verdien inneholder uteliggere eller ikke i datasettet.

  • Deretter drar du ikonet Fyllhåndtak for å fylle ut resten av cellene i kolonnen med formelen.
  • Som en konsekvens vil du kunne vite om verdiene i datasettet inneholder uteliggere eller ikke som vist nedenfor.

Fra datasettet ovenfor kan vi se at bare én id-s z-poengsum er over verdien av 3. Det er derfor vi bare får én uteligger .

Nå skal vi vise uteliggere ved å bruke et Scatter -diagram. Vi må følge følgende prosess:

  • Først, velg området for cellene C5:D20 .
  • Gå deretter til Sett inn -fanen. Velg Insert Scatter (X, Y) eller Bubble Chart, og til slutt velg Scatter .

  • Som en konsekvens vil du få følgende diagram.

  • For å endre diagramstilen, velg Diagram Design og velg deretter ønsket Style 9 -alternativ fra Diagramstiler -gruppen.

  • Som en konsekvens vil du få følgende Scatter -diagram.

Les mer: Hvordan finne outliers i Excel (5 nyttige måter)

Konklusjon

Det er slutten på dagens økt. Jeg har stor tro på at du fra nå av kan finne uteliggere ved å bruke z-score i Excel. Hvis du har spørsmål eller anbefalinger, vennligst del dem i kommentarfeltet nedenfor.

Ikke glem å sjekke nettstedet vårt Exceldemy.com for ulike Excel-relaterte problemer og løsninger. Fortsett å lære nye metoder og fortsett å vokse!

Hugh West er en svært erfaren Excel-trener og analytiker med over 10 års erfaring i bransjen. Han har en bachelorgrad i regnskap og finans og en mastergrad i bedriftsøkonomi. Hugh har en lidenskap for undervisning og har utviklet en unik undervisningstilnærming som er enkel å følge og forstå. Hans ekspertkunnskap om Excel har hjulpet tusenvis av studenter og fagfolk over hele verden med å forbedre sine ferdigheter og utmerke seg i karrieren. Gjennom bloggen sin deler Hugh sin kunnskap med verden, og tilbyr gratis Excel-opplæringer og nettbasert opplæring for å hjelpe enkeltpersoner og bedrifter å nå sitt fulle potensial.