Hur du hittar outliers med hjälp av Z-poäng i Excel (med snabba steg)

  • Dela Detta
Hugh West

I statistiska sannolikhetsberäkningar är z-poängen av största vikt. Datafördelningar och outliers i ett dataset kan bestämmas med denna term. Det är möjligt att bestämma dem manuellt från ett dataset. Om du har ett större dataset finns det flera verktyg till ditt förfogande. Excel är ett av dem. Om du letar efter några speciella knep för att hitta outliers med hjälp av z-poäng i Excel,har du kommit till rätt ställe. Den här artikeln kommer att diskutera varje steg i metoden för att hitta outliers med hjälp av z-poängen. Låt oss följa den kompletta guiden för att lära oss allt detta.

Ladda ner övningsboken

Ladda ner den här arbetsboken för att träna medan du läser den här artikeln. Den innehåller alla dataset i olika kalkylblad för en tydlig förståelse. Pröva dig fram medan du går igenom steg-för-steg-processen.

Hitta utflyktingar med hjälp av Z-poäng.xlsx

Vad är Z-poäng?

Inom statistiken representerar z-värdet standardavvikelsen från populationen för en viss datapunkt. Detta mått talar om hur långt ett visst värde är från medelvärdet i en uppsättning i förhållande till dess standardavvikelse (standardavvikelsen är RMS-värdet av alla olika punkter och medelvärdet). Den matematiska formeln för z-värdet är

Var,

Z = z-poäng

X = observerat värde

= medelvärde

σ = standardavvikelse

Vad är en outlier?

Utstickare är värden som skiljer sig avsevärt från andra värden i en datamängd. Ett annat sätt att säga detta är att en utstickare är ett värde som är mycket högre eller lägre än medelvärdet och medianen för datamängden. I ett Excel-diagram kan du betrakta de datapunkter som ligger långt ifrån de andra datapunkterna som utstickare. Tänk till exempel på ett scenario där du har totalt antal poäng som 5olika spelare under en NBA-säsong. Poängen är 1600, 1400, 300 och 1500. Om du gör en graf i Excel ser du att punkt 300 ligger långt ifrån de andra. Så i detta fall är 3000 den avvikande punkten.

En outlier anses vara ett z-poängvärde inom intervallet 3 till -3 eftersom dessa värden ligger ganska långt ifrån medelvärdet.

Steg-för-steg-förfarande för att hitta utfallare med hjälp av Z-poäng i Excel

I följande avsnitt kommer vi att använda en effektiv och knepig metod för att hitta outliers med hjälp av z-poängen i Excel. Vi kommer att bestämma z-poängen för urvalet genom att beräkna medelvärdet och standardavvikelserna för alla siffror. Sedan kommer vi att hitta outliers för varje observation. I det här avsnittet får du omfattande information om den här metoden. Du bör lära dig och tillämpa alla dessa för att förbättra dintankeförmåga och Excel-kunskaper. Vi använder oss av Microsoft Office 365 versionen här, men du kan använda vilken annan version som helst.

Steg 1: Beräkna medelvärdet för datamängden

Till att börja med ska vi hitta medelvärdet för datasetet. Detta kommer att vara till hjälp för att bestämma standardavvikelsen och z-värdet. Här använder vi funktionen AVERAGE för att bestämma observationens medelvärde. Funktionen tar emot en serie argument eller ett intervall av värden och returnerar deras medelvärde. Låt oss gå igenom stegen för att beräkna medelvärdet för datasetet.

  • Först och främst väljer du ett intervall av cellerna och skriver följande formel i cellen H4 .

=GENOMSNITT(C5:C20)

  • Tryck sedan på Gå in på .
  • Som en följd av detta får du medelvärdet för alla data.

Läs mer: Hur man hittar outliers med standardavvikelse i Excel (med snabba steg)

Steg 2: Skatta standardavvikelsen

Nu ska vi uppskatta standardavvikelsen med hjälp av funktionen STDEV.P för att bestämma standardavvikelserna för datasetet. Den här funktionen returnerar standardavvikelsen från en serie tal eller ett intervall av värden som den tar som argument. Låt oss gå igenom stegen för att uppskatta standardavvikelsen.

  • Först och främst väljer du ett intervall av cellerna och skriver följande formel i cellen H5 .

=STDEV.P(C5:C20)

  • Tryck sedan på Gå in på .
  • Som en följd av detta får du värdet för standardavvikelsen för alla data.

Läs mer: Hur man beräknar outliers i Excel (5 enkla sätt)

Steg 3: Utvärdera Z-poängen

Nu ska vi utvärdera z-poängen. För att bestämma z-poängen för värdena behöver vi först och främst skillnaden mellan värdet och medelvärdet och sedan dividera det med standardavvikelsen enligt formeln. Låt oss gå igenom stegen för att uppskatta z-poängen.

  • För att utvärdera z-poängen måste du först och främst skriva följande formel i cellen D5 .

=(C5-$H$4)/$H$5

  • Tryck sedan på Gå in på .
  • Som ett resultat får du z-poängen för det första värdet i datasetet.

  • Därefter drar du den Handtag för fyllning ikonen för att fylla ut resten av cellerna i kolumnen med formeln.
  • Som en följd av detta får du z-poängen för alla poster i datasetet.

  • I vårt dataset är medelvärdet 113.875 och standardavvikelsen är 100.21 Om vi nu tar hänsyn till det specifika värdet av $79 , z-värdet för detta värde är -0.347 vilket innebär att $79 är 0.347 standardavvikelser under medelvärdet eller genomsnittsvärdet.
  • I ett annat fall, när värdet är $500 får vi z-poängen som är 3.85 . Det innebär att $500 är 3.85 standardavvikelser över medelvärdet.

Läs mer: Hur man hittar outliers i regressionsanalys i Excel (3 enkla sätt)

Steg 4: Hitta outliers från datamängden

Nu ska vi leta efter outliers i vårt dataset. En outlier anses vara ett z-värde inom intervallet 3 till -3 , som nämnts ovan. Låt oss gå igenom stegen för att hitta outliers i datasetet. Här kommer vi att använda OR-funktionen för att ta reda på om värdena i datasetet innehåller outliers eller inte. Om något av värdena inom intervallet uppfyller villkoret blir resultatet SANT.

  • För att hitta outliers måste du först och främst skriva följande formel i cell E5 .

=OR((D53))

  • Tryck sedan på Gå in på .
  • På så sätt får du reda på om det första värdet innehåller outliers eller inte i datasetet.

  • Därefter drar du den Handtag för fyllning ikonen för att fylla ut resten av cellerna i kolumnen med formeln.
  • Som en följd av detta kan du veta om värdena i datasetet innehåller outliers eller inte, vilket visas nedan.

I datasetet ovan kan vi se att endast en id:s z-poäng ligger över värdet 3. Det är därför vi bara får en outlier.

Nu ska vi visa utfall med hjälp av en Spridning Vi måste följa följande process:

  • Först väljer du cellernas intervall C5:D20 .
  • Gå sedan till Infoga flik. Välj Infoga ett spridningsdiagram (X, Y) eller ett bubbeldiagram, och slutligen väljer du Spridning .

  • Som en följd av detta får du följande diagram.

  • Om du vill ändra diagramstilen väljer du Diagram Design och välj sedan den önskade Stil 9 från alternativet Stilar för diagram grupp.

  • Som en följd av detta får du följande Spridning diagram.

Läs mer: Hur man hittar outliers i Excel (5 användbara sätt)

Slutsats

Det var slutet på dagens session. Jag tror att du från och med nu kan hitta outliers med hjälp av z-poäng i Excel. Om du har några frågor eller rekommendationer kan du dela dem med oss i kommentarsfältet nedan.

Glöm inte att besöka vår webbplats Exceldemy.com för olika Excel-relaterade problem och lösningar. Fortsätt att lära dig nya metoder och fortsätt att växa!

Hugh West är en mycket erfaren Excel-tränare och analytiker med över 10 års erfarenhet i branschen. Han har en kandidatexamen i redovisning och ekonomi och en magisterexamen i företagsekonomi. Hugh har en passion för undervisning och har utvecklat ett unikt undervisningssätt som är lätt att följa och förstå. Hans expertkunskap om Excel har hjälpt tusentals studenter och yrkesverksamma över hela världen att förbättra sina färdigheter och utmärka sig i sina karriärer. Genom sin blogg delar Hugh med sig av sin kunskap med världen, och erbjuder gratis Excel-handledning och onlineutbildning för att hjälpa individer och företag att nå sin fulla potential.