Innehållsförteckning
I statistiska sannolikhetsberäkningar är z-poängen av största vikt. Datafördelningar och outliers i ett dataset kan bestämmas med denna term. Det är möjligt att bestämma dem manuellt från ett dataset. Om du har ett större dataset finns det flera verktyg till ditt förfogande. Excel är ett av dem. Om du letar efter några speciella knep för att hitta outliers med hjälp av z-poäng i Excel,har du kommit till rätt ställe. Den här artikeln kommer att diskutera varje steg i metoden för att hitta outliers med hjälp av z-poängen. Låt oss följa den kompletta guiden för att lära oss allt detta.
Ladda ner övningsboken
Ladda ner den här arbetsboken för att träna medan du läser den här artikeln. Den innehåller alla dataset i olika kalkylblad för en tydlig förståelse. Pröva dig fram medan du går igenom steg-för-steg-processen.
Hitta utflyktingar med hjälp av Z-poäng.xlsxVad är Z-poäng?
Inom statistiken representerar z-värdet standardavvikelsen från populationen för en viss datapunkt. Detta mått talar om hur långt ett visst värde är från medelvärdet i en uppsättning i förhållande till dess standardavvikelse (standardavvikelsen är RMS-värdet av alla olika punkter och medelvärdet). Den matematiska formeln för z-värdet är
Var,
Z = z-poäng
X = observerat värde
x̅ = medelvärde
σ = standardavvikelse
Vad är en outlier?
Utstickare är värden som skiljer sig avsevärt från andra värden i en datamängd. Ett annat sätt att säga detta är att en utstickare är ett värde som är mycket högre eller lägre än medelvärdet och medianen för datamängden. I ett Excel-diagram kan du betrakta de datapunkter som ligger långt ifrån de andra datapunkterna som utstickare. Tänk till exempel på ett scenario där du har totalt antal poäng som 5olika spelare under en NBA-säsong. Poängen är 1600, 1400, 300 och 1500. Om du gör en graf i Excel ser du att punkt 300 ligger långt ifrån de andra. Så i detta fall är 3000 den avvikande punkten.
En outlier anses vara ett z-poängvärde inom intervallet 3 till -3 eftersom dessa värden ligger ganska långt ifrån medelvärdet.
Steg-för-steg-förfarande för att hitta utfallare med hjälp av Z-poäng i Excel
I följande avsnitt kommer vi att använda en effektiv och knepig metod för att hitta outliers med hjälp av z-poängen i Excel. Vi kommer att bestämma z-poängen för urvalet genom att beräkna medelvärdet och standardavvikelserna för alla siffror. Sedan kommer vi att hitta outliers för varje observation. I det här avsnittet får du omfattande information om den här metoden. Du bör lära dig och tillämpa alla dessa för att förbättra dintankeförmåga och Excel-kunskaper. Vi använder oss av Microsoft Office 365 versionen här, men du kan använda vilken annan version som helst.
Steg 1: Beräkna medelvärdet för datamängden
Till att börja med ska vi hitta medelvärdet för datasetet. Detta kommer att vara till hjälp för att bestämma standardavvikelsen och z-värdet. Här använder vi funktionen AVERAGE för att bestämma observationens medelvärde. Funktionen tar emot en serie argument eller ett intervall av värden och returnerar deras medelvärde. Låt oss gå igenom stegen för att beräkna medelvärdet för datasetet.
- Först och främst väljer du ett intervall av cellerna och skriver följande formel i cellen H4 .
=GENOMSNITT(C5:C20)
- Tryck sedan på Gå in på .
- Som en följd av detta får du medelvärdet för alla data.
Läs mer: Hur man hittar outliers med standardavvikelse i Excel (med snabba steg)
Steg 2: Skatta standardavvikelsen
Nu ska vi uppskatta standardavvikelsen med hjälp av funktionen STDEV.P för att bestämma standardavvikelserna för datasetet. Den här funktionen returnerar standardavvikelsen från en serie tal eller ett intervall av värden som den tar som argument. Låt oss gå igenom stegen för att uppskatta standardavvikelsen.
- Först och främst väljer du ett intervall av cellerna och skriver följande formel i cellen H5 .
=STDEV.P(C5:C20)
- Tryck sedan på Gå in på .
- Som en följd av detta får du värdet för standardavvikelsen för alla data.
Läs mer: Hur man beräknar outliers i Excel (5 enkla sätt)
Steg 3: Utvärdera Z-poängen
Nu ska vi utvärdera z-poängen. För att bestämma z-poängen för värdena behöver vi först och främst skillnaden mellan värdet och medelvärdet och sedan dividera det med standardavvikelsen enligt formeln. Låt oss gå igenom stegen för att uppskatta z-poängen.
- För att utvärdera z-poängen måste du först och främst skriva följande formel i cellen D5 .
=(C5-$H$4)/$H$5
- Tryck sedan på Gå in på .
- Som ett resultat får du z-poängen för det första värdet i datasetet.
- Därefter drar du den Handtag för fyllning ikonen för att fylla ut resten av cellerna i kolumnen med formeln.
- Som en följd av detta får du z-poängen för alla poster i datasetet.
- I vårt dataset är medelvärdet 113.875 och standardavvikelsen är 100.21 Om vi nu tar hänsyn till det specifika värdet av $79 , z-värdet för detta värde är -0.347 vilket innebär att $79 är 0.347 standardavvikelser under medelvärdet eller genomsnittsvärdet.
- I ett annat fall, när värdet är $500 får vi z-poängen som är 3.85 . Det innebär att $500 är 3.85 standardavvikelser över medelvärdet.
Läs mer: Hur man hittar outliers i regressionsanalys i Excel (3 enkla sätt)
Steg 4: Hitta outliers från datamängden
Nu ska vi leta efter outliers i vårt dataset. En outlier anses vara ett z-värde inom intervallet 3 till -3 , som nämnts ovan. Låt oss gå igenom stegen för att hitta outliers i datasetet. Här kommer vi att använda OR-funktionen för att ta reda på om värdena i datasetet innehåller outliers eller inte. Om något av värdena inom intervallet uppfyller villkoret blir resultatet SANT.
- För att hitta outliers måste du först och främst skriva följande formel i cell E5 .
=OR((D53))
- Tryck sedan på Gå in på .
- På så sätt får du reda på om det första värdet innehåller outliers eller inte i datasetet.
- Därefter drar du den Handtag för fyllning ikonen för att fylla ut resten av cellerna i kolumnen med formeln.
- Som en följd av detta kan du veta om värdena i datasetet innehåller outliers eller inte, vilket visas nedan.
I datasetet ovan kan vi se att endast en id:s z-poäng ligger över värdet 3. Det är därför vi bara får en outlier.
Nu ska vi visa utfall med hjälp av en Spridning Vi måste följa följande process:
- Först väljer du cellernas intervall C5:D20 .
- Gå sedan till Infoga flik. Välj Infoga ett spridningsdiagram (X, Y) eller ett bubbeldiagram, och slutligen väljer du Spridning .
- Som en följd av detta får du följande diagram.
- Om du vill ändra diagramstilen väljer du Diagram Design och välj sedan den önskade Stil 9 från alternativet Stilar för diagram grupp.
- Som en följd av detta får du följande Spridning diagram.
Läs mer: Hur man hittar outliers i Excel (5 användbara sätt)
Slutsats
Det var slutet på dagens session. Jag tror att du från och med nu kan hitta outliers med hjälp av z-poäng i Excel. Om du har några frågor eller rekommendationer kan du dela dem med oss i kommentarsfältet nedan.
Glöm inte att besöka vår webbplats Exceldemy.com för olika Excel-relaterade problem och lösningar. Fortsätt att lära dig nya metoder och fortsätt att växa!