Hvordan man beregner outliers i Excel (5 nemme måder)

  • Del Dette
Hugh West

Det kan være nødvendigt at identificere outliers for at kunne foretage statistiske beregninger på data fra et datasæt. Du kan finde outliers fra store datasæt ved hjælp af Microsoft Excel på mange forskellige måder. I dette indlæg viser vi dig, hvordan du beregner outliers i Microsoft Excel på fem forskellige måder.

Download arbejdsbog til øvelser

Du kan downloade den gratis Excel-arbejdsbog her og øve dig på egen hånd.

Find outliers.xlsx

5 praktiske metoder til at beregne outliers i Excel

Outliers er dataværdier, der er signifikant forskellige fra resten af dataværdierne i datasættet. Outliers er med andre ord ekstraordinære værdier. De er enten usædvanligt høj eller overdrevent lav i forhold til andre værdier i et datasæt. Finde outliers er afgørende i statistiske beregninger, da de har en indvirkning på resultaterne af vores dataanalyse.

Du har f.eks. et datasæt, der viser 12 personers daglige indkomst. Nu skal du beregne outliers ved hjælp af Microsoft Excel. Her vil jeg vise dig fem nemme metoder til at gøre det.

1. Brug Sortér & Filter til at beregne outliers i Excel

Du kan beregne outliers fra et lille datasæt ved at bruge Sortere & Filtrere Hvis du ønsker at beregne outliers ved hjælp af sorterings og filterfunktionen, kan du gøre det ved at følge nedenstående trin.

Trin 1:

  • Først skal du vælge den kolonneoverskrift i dit datasæt i Excel, som du vil sortere. I det givne datasæt skal du f.eks. i filens kolonneoverskrift med navnet Daglig indkomst (celle C40 er valgt).

Trin 2:

  • Derefter skal du trykke på Hjem på fanen på båndet og gå til fanen Redigering af gruppe.

Trin 3:

  • Herefter, i den Redigeringsgruppe klik på den Sortere & Filtrere kommandoen og klik på den Tilpasset Sortere .

Trin 4:

  • Derefter vises en ny dialogboks med navnet Sortere åbnes. I den dialogboks, der vises, skal du vælge Dagligt Indkomst i den Sorter efter drop-down og Fra den mindste til den største i rullemenuen Bestil. Klik derefter på OK .

Trin 5:

  • Endelig er det Daglig indkomst kolonnen vil blive sorteret på den angivne måde, med de laveste værdier øverst og de største værdier nederst. Når du har kørt proceduren, skal du se efter uregelmæssigheder i dataområdet for at bestemme outliers.

F.eks. er de to første værdier i kolonnen betydeligt lavere og de to sidste værdier i kolonnen betydeligt højere end resten af værdierne i datasættet, som det fremgår af ovenstående resultat.

Læs mere: Sådan finder du outliers i regressionsanalyse i Excel (3 nemme måder)

2. Anvend QUARTILE-funktionen til at beregne outliers i Excel

Funktionen QUARTILE er en mere videnskabelig måde at beregne outliers i Excel på. Du kan bruge denne funktion til at opdele dine datasæt i fire lige store dele. Følgende værdier vil blive returneret af funktionen QUARTILE :

  • minimum værdi.
  • 1. kvartil (Q1 - de laveste 25 % af et givet datasæt).
  • 2. kvartil (Q2-næste 25 % af datasættet med de laveste 25 %).
  • 3. kvartil (Q3 - næsthøjeste 25 % af datasættet).
  • maksimum værdi.

Syntaksen for funktionen QUARTILE i Excel er:

=QUARTILE(array,quart)

Syntaksen indeholder følgende argumenter:

  • a rray : det celleområde i et givet datasæt, som du vil beregne kvartilværdien for.
  • quart: Dette angiver, hvilken værdi der skal returneres.

Til beregning af outliers for ovenstående datasæt ved hjælp af funktionen QUARTILE, Følg nedenstående trin.

Trin 1:

  • For det første indtastes følgende formel til bestemmelse af 1. kvartil ( Q1 ) er angivet nedenfor.
= KVARTIL($C$5:$C$16,1)

Trin 2:

  • Også her skal formlen til beregning af 3. kvartil ( Q3 ) er angivet nedenfor.
= KVARTIL($C$5:$C$16,3)

Trin 3:

  • For det tredje skal du bestemme den IQR, som er den Inter-kvartilområde (det repræsenterer 50% af de givne data fra en række datasæt, der falder i første og tredje kvartil) ved at trække Q1 (i celle G4 ) fra Q3 (i celle G5 ). Indtast følgende formel for at beregne subtraktionen.

    =G5-G4

Trin 4:

  • Efter at have fundet IQR, derefter skal du bestemme den øverste og lavere Fordi den øverste og lavere grænsen vil indeholde de fleste af dataene i datasættet. Skriv følgende formel til beregning af den øvre grænse.

    =G5+(1,5*G6)

Trin 5:

  • For at beregne den nedre grænse skal du derefter skrive følgende formel ned.
=G4-(1,5*G6)

Trin 6:

  • Endelig kan du efter at have afsluttet det foregående trin bestemme outliers for hver dataværdi. Skriv følgende formel i excel-regnearket med OR-funktionen i celle D5 .
=OR(C5$G$7)

  • Denne formel vil hjælpe med at identificere de data, der ikke falder inden for ovennævnte intervalgrænse. Efter behandlingen vil formlen vise en TRUE-erklæring om de specifikke data er en outlier og FALSK hvis det ikke er tilfældet. Dobbeltklik på på den AutoFill værktøj i celle C5 til kopiering formlen til resten af cellerne i kolonne C Du kan således se en sand værdi ved siden af alle outliers i dit datasæt.

3. Kombinér funktionerne AVERAGE og STDEV.P for at beregne outliers ud fra middelværdi og standardafvigelse

A standardafvigelse (eller σ ) er en måleenhed til at bestemme, hvor fordelt dataene er i forhold til middelværdien for hele datasættet. Data er grupperet omkring middelværdien, når standardafvigelsen er lav, mens data er mere spredt, når standardafvigelsen er høj. For at beregne outliers ved hjælp af Gennemsnitlig og Standardafvigelse kan du følge følgende trin.

Trin 1:

  • Brug først det samme datasæt som vist i starten af denne artikel, og beregn derefter middelværdien og standardafvigelsen. For at beregne middelværdien skal du skrive følgende formel med funktionen AVERAGE i celle G5 .
=GENNEMSNIT(C5:C16)

Trin 2:

  • For at beregne standardafvigelsen indsættes følgende formel med funktionen STDEV.P i celle G6 .
=STDEV.P(C5:C16)

Trin 3:

  • Derefter beregner du den øvre grænse for yderligere fremskridt i processen. I celle G7 , beregnes den nedre grænse ved hjælp af følgende formel.
=G5-(1,25*G6)

Trin 4:

  • Og i celle G8 beregne den øvre grænse ud fra følgende formel
=G5+(1,5*G6)

Trin 5:

  • For at beregne, om der findes outliers eller ej, skal du derefter skrive følgende formel i celle D5 .
=OR(C5$G$8)

  • Formlen vil således returnere en TRUE værdi, hvis de specifikke data i den ønskede celle er en outlier og FALSK.
  • Dobbeltklik på på den AutoFill værktøj i celle D5 for at kopiere formlen til resten af cellerne i kolonne D På den måde kan du finde alle de resterende outliers i dit datasæt.

Læs mere: Sådan finder du outliers med standardafvigelse i Excel (med hurtige trin)

4. Indsæt Z-score til beregning af outliers i Excel

Z-score er en af de mest anvendte målinger til at identificere outliers. Denne metode viser, hvor langt en specifik data er fra gennemsnittet af et datasæt i forhold til dets standardafvigelse. For at beregne outliers ved hjælp af Z-score i Excel kan du se de trin, der er beskrevet nedenfor.

Trin 1:

  • For det første skal du tage det ønskede datasæt.

Trin 2:

  • For det andet, i celle H5, følgende formel til beregning af den gennemsnit for de givne data.
=GENNEMSNIT(C5:C16)

Trin 3:

  • For det tredje skal du beregne den standardafvigelse af det givne datasæt i celle H6 ved hjælp af følgende formel.
=STDEV.P(C5:C16)

Trin 4:

  • Derefter skal du bestemme, hvilken Z -score for hver dataværdi. Dette gøres ved hjælp af nedenstående formel.
=(C5-$H$5)/$H$6

Trin 5:

  • Efter beregning af alle de Z-værdier, vil du se, at intervallet af Z-værdier er mellem -1.44 og 13 Vi overvejer derfor værdier af Z-score mindre end -1,2 eller mere end +1.8 for grænseværdierne for udbrydere.
  • Skriv derefter følgende formel i celle E 5 .
=OR((D51.8))

  • Endelig returnerer formlen en TRUE værdi, hvis de specifikke data er en outlier og returnerer FALSK
  • Dobbeltklik på på celle E5 til at bruge den AutoFill værktøjet fill handle for at kopiere formlen til resten af cellerne i kolonne E På den måde kan du finde alle de resterende outliers i dit datasæt.

Læs mere: Sådan finder du outliers ved hjælp af Z Score i Excel (med hurtige trin)

5. Sammenlægning af LARGE- og SMALL-funktioner for at finde outliers i Excel

Funktionen LARGE og funktionen SMALL i Excel har modsatte operationer. Vi vil bruge den til at finde henholdsvis de største og mindste data eller værdier i et datasæt. Denne funktion trækker alle data i et datasæt og finder de mindste og største tal. De er i stand til at finde det næstmindste eller største, det tredjestørste eller mindste og så videre.

Trin 1:

  • Først skal du bruge følgende formel i celle E5 med funktionen LARGE .
=LARGE($C$5:$C$16,1)

    • Således fra 12 værdier, kan du se den 1. største værdi, som er 780 .

Trin 2:

  • Herefter, i celle G5 , skriv følgende formel for at finde den mindste værdi.
=SMALL($C$5:$C$16,1)

  • Endelig, fra 12 værdier, kan du se den 1. mindste værdi 110 .
  • Når du har fundet alle de nødvendige værdier, kan du nemt udpege eventuelle outliers i datasættet.

Konklusion

Det er slutningen af denne artikel. Jeg håber, at du finder denne artikel nyttig. Når du har læst denne artikel, vil du være i stand til at beregne outliers i Excel ved hjælp af en af metoderne. Del gerne yderligere spørgsmål eller anbefalinger med os i kommentarfeltet nedenfor.

Hugh West er en meget erfaren Excel-træner og analytiker med over 10 års erfaring i branchen. Han har en bachelorgrad i regnskab og finans og en kandidatgrad i Business Administration. Hugh har en passion for undervisning og har udviklet en unik undervisningstilgang, der er nem at følge og forstå. Hans ekspertviden om Excel har hjulpet tusindvis af studerende og fagfolk verden over med at forbedre deres færdigheder og udmærke sig i deres karriere. Gennem sin blog deler Hugh sin viden med verden og tilbyder gratis Excel-tutorials og onlinetræning for at hjælpe enkeltpersoner og virksomheder med at nå deres fulde potentiale.