Innholdsfortegnelse
Outliers må kanskje identifiseres for å gjøre statistiske beregninger på data fra et datasett. Du kan oppdage uteliggere fra enorme datasett ved å bruke Microsoft Excel på mange måter. I dette innlegget viser vi deg hvordan du beregner uteliggere i Microsoft Excel ved å bruke fem forskjellige måter.
Last ned øvelsesarbeidsbok
Du kan laste ned den gratis Excel-arbeidsboken herfra og øve på egenhånd .
Finn Outliers.xlsx
5 nyttige tilnærminger for å beregne uteliggere i Excel
Outliers er dataverdier som er vesentlig forskjellig fra resten av dataverdiene i datasettet. Outliers er med andre ord ekstraordinære verdier. De er enten eksepsjonelt høye eller overdrevent lave i forhold til andre verdier i et datasett. Å finne uteliggere er viktig i statistiske beregninger siden de har innvirkning på funnene i dataanalysen vår.
Du har for eksempel et datasett som viser den daglige inntekten til tolv personer. Nå må du beregne uteliggere ved hjelp av Microsoft Excel. Her vil jeg vise deg fem enkle måter å gjøre det på.
1. Bruk Sorter & Filter for å beregne uteliggere i Excel
Du kan beregne uteliggere fra et lite datasett ved å bruke Sorter & Filter kommando i Excel. Hvis du ønsker å beregne uteliggere ved å bruke sorterings- og filterfunksjonen, kan du gjøre det ved å følgetrinnene nedenfor.
Trinn 1:
- Først velger du kolonneoverskriften i Excel-datasettet du vil sortere. For eksempel, i det gitte datasettet, i filkolonneoverskriften kalt Daglig inntekt (Celle C40 er valgt).
Trinn 2:
- Trykk deretter på Hjem fanen på båndet og gå til Redigering -gruppen.
Trinn 3:
- Etter det, i Redigeringsgruppen klikker du på Sorter & Filter -kommandoen og klikk på Egendefinert Sorter .
Trinn 4:
- Deretter åpnes en ny dialogboks kalt Sorter . I den åpne dialogboksen velger du Daglig Inntekt i Sorter etter rullegardinmenyen og Minst til Størst i rullegardinmenyen Bestilling. Klikk deretter OK .
Trinn 5:
- Til slutt vil Daglig inntekt -kolonnen sorteres på den oppgitte måten, med de laveste verdiene øverst og de største verdiene nederst. Etter å ha kjørt prosedyren, se etter eventuelle uregelmessigheter i dataområdet for å fastslå uteliggere.
For eksempel er de to første verdiene i kolonnen betydelig lavere og de to siste verdiene i kolonnen er vesentlig høyere enn resten av verdiene i datasettet, som vist iovenfor resultat.
Les mer: Hvordan finne uteliggere i regresjonsanalyse i Excel (3 enkle måter)
2. Bruk QUARTILE-funksjonen på Beregn avvik i Excel
KVARTIL-funksjonen -tilnærmingen er en mer vitenskapelig måte å beregne avvik i Excel. Du kan bruke denne funksjonen til å dele datasettene dine i fire like deler. Følgende verdier vil bli returnert av KVARTIL-funksjonen :
- minimum verdien.
- 6> 1. kvartil (Q1 - laveste 25 % av et gitt datasett).
- 2. kvartil (Q2-neste) laveste 25 % av datasettet).
- 3. kvartilen (Q3- nest høyeste 25 % av datasettet).
- maksimal verdi.
Syntaksen til KVARTIL-funksjonen i Excel er:
=KVARTIL( array,quart)
Syntaksen inneholder følgende argumenter:
- a rray : celleområdet til en gitt datasett som du skal beregne kvartilverdien for.
- quart: Dette spesifiserer hvilken verdi som skal returneres.
For å beregne uteliggere for datasettet ovenfor ved å bruke KVARTIL-funksjonen, følger du trinnene nedenfor.
Trinn 1:
- Først skriver du inn følgende formel for å bestemme 1. kvartil ( Q1 ) er gitt nedenfor.
=QUARTILE($C$5:$C$16,1)
Trinn 2:
- Herigjen, formelen for å beregne tredje kvartil ( Q3 ) er gitt nedenfor.
=QUARTILE($C$5:$C$16,3)
Trinn 3:
- For det tredje må du bestemme IQR, som er Inter-kvartilområdet (det representerer 50 % av de gitte dataene fra et datasettområde som faller inn i den første og tredje kvartilen) ved å subtrahere Q1 (i celle G4 ) fra Q3 (i celle G5 ). Skriv inn følgende formel for å beregne subtraksjonen.
=G5-G4
Trinn 4:
- Etter å ha funnet IQR, neste må du bestemme øvre og nedre Fordi øvre og nedre grense vil inneholde mesteparten av dataene innenfor datasettet. Skriv ned følgende formel for å beregne den øvre grensen.
=G5+(1.5*G6)
Trinn 5:
- For å beregne den nedre grensen, skriv ned følgende formel.
=G4-(1.5*G6)
Trinn 6:
- Til slutt, etter å ha fullført det forrige trinnet, kan du bestemme uteliggere for hver data verdi. I excel-regnearket skriver du inn følgende formel med ELLER-funksjonen i celle D5 .
=OR(C5$G$7)
- Denne formelen vil bidra til å identifisere dataene som ikke faller innenfor den ovennevnte rekkeviddegrensen. Etter å ha behandletformelen vil vise en TRUE-utsagn hvis de spesifikke dataene er en uteligger og USANT hvis den ikke er det. Dobbeltklikk på Autofyll verktøyet i celle C5 for å kopiere formelen til resten av cellene i kolonne C . Dermed kan du observere en sann verdi ved siden av alle avvikene i datasettet ditt.
3. Kombiner AVERAGE og STDEV.P funksjoner for å beregne outliers fra gjennomsnitt og standardavvik
A standardavvik (eller σ ) er en beregning for å bestemme hvor fordelt dataene er angående middelverdien av hele datasettet. Data er gruppert rundt gjennomsnittet når standardavviket er lavt, mens data er mer spredt når standardavviket er høyt. For å beregne uteliggere ved å bruke Gjennomsnitt og Standardavvik kan du følge følgende trinn.
Trinn 1:
- Bruk først det samme datasettet som vises i begynnelsen av denne artikkelen, og beregn deretter gjennomsnittet og standardavviket. For å beregne gjennomsnittet, skriv inn følgende formel med GJENNOMSNITT-funksjonen i celle G5 .
=AVERAGE(C5:C16)
Trinn 2:
- For å beregne standardavviket, sett inn følgende formel med STDEV-en .P-funksjon i celle G6 .
=STDEV.P(C5:C16)
Trinn 3:
- Deretter skal du beregneøvre grense for videre avansement i prosessen. I celle G7 beregner du den nedre grensen ved å bruke følgende formel.
=G5-(1.25*G6)
Trinn 4:
- Og i celle G8 beregn den øvre grensen fra følgende formel
=G5+(1.5*G6)
Trinn 5:
- Etter det , for å beregne om det finnes uteliggere eller ikke, skriv inn følgende formel i celle D5 .
=OR(C5$G$8)
- Dermed vil formelen returnere en TRUE verdi hvis de spesifikke dataene i den ønskede cellen er en uteligger og USANN.
- Dobbeltklikk på Autofyll -verktøyet i celle D5 for å kopiere formelen til resten av cellene i kolonne D . Dermed kan du finne ut alle gjenværende uteliggere i datasettet ditt.
Les mer: How to Find Outliers with Standard Deviation in Excel (with Quick Steps)
4. Sett inn Z-score for å beregne uteliggere i Excel
Z-score er en av de mest brukte beregningene for identifisere uteliggere. Denne metoden viser hvor langt en spesifikk data er fra gjennomsnittet av et datasett med hensyn til standardavviket. For å beregne uteliggere ved å bruke Z-score i Excel kan du se trinnene beskrevet nedenfor.
Trinn 1:
- Ta først det ønskede datasettet.
Trinn2:
- For det andre, i celle H5, skriv inn følgende formel for å beregne gjennomsnittet for de gitte dataene.
=AVERAGE(C5:C16)
Trinn 3:
- For det tredje, beregne standardavviket til det gitte datasettet i celle H6 ved å bruke følgende formel.
=STDEV.P(C5:C16)
Trinn 4:
- Etter det , må du bestemme Z -score for hver dataverdi. For å gjøre dette bruker du formelen gitt nedenfor.
=(C5-$H$5)/$H$6
Trinn 5:
- Etter å ha beregnet alle Z-verdiene, vil du se at området Z-verdier er mellom -1,44 og 13 . Så vi vurderer verdier for Z-score som er mindre enn -1,2 eller mer enn +1,8 for yttergrensene.
- Skriv deretter inn følgende formel i celle E 5 .
=OR((D51.8))
- Til slutt vil formelen returnere en TRUE verdi hvis de spesifikke dataene er en uteligger og vil returnere FALSE
- Dobbeltklikk på celle E5 for å bruke Autofyll verktøyfyllhåndtak for å kopiere formelen til resten av cellene i kolonne E . Dermed kan du finne alle de gjenværende uteliggere i datasettet ditt.
Les mer: Hvordan finne uteliggere med Z Score i Excel (med QuickTrinn)
5. Slå sammen LARGE og SMALL-funksjoner for å finne utliggere i Excel
STOR-funksjonen og SMALL-funksjonen i Excel har motsatte operasjoner. Vi vil bruke den til å finne henholdsvis de største og minste dataene eller verdiene i et datasett. Denne funksjonen vil trekke alle dataene i et datasett, og finne de minste og største tallene. De er i stand til å finne den nest minste eller største, den tredje største eller minste, og så videre.
Trinn 1:
- Bruk først følgende formel i celle E5 med STOR-funksjonen .
=LARGE($C$5:$C$16,1)
-
- Dermed, fra 12 verdier, kan du se den 1. største verdien som er 780 .
Trinn 2:
- Deretter, i celle G5 , skriv ned følgende formel for å finne den minste verdien.
=SMALL($C$5:$C$16,1)
- Til slutt, fra 12 verdier, kan du se 1. minste verdi 110 .
- Når du har funnet ut alle nødvendige verdier, kan du enkelt peke ut eventuelle uteliggere i datasettet.
Konklusjon
Det er slutten på denne artikkelen. Jeg håper du finner denne artikkelen nyttig. Etter å ha lest denne artikkelen, vil du kunne beregne uteliggere i Excel ved å bruke en av metodene. Del gjerne ytterligere spørsmål eller anbefalinger medoss i kommentarfeltet nedenfor.