Hoe om uitskieters in Excel te verwyder (3 maniere)

  • Deel Dit
Hugh West

Om uitskieters te vind en dit te verwyder is 'n baie algemene taak om data in statistieke, data-ontginning, masjienleer ens te ontleed. Daar is soveel maniere waarop jy uitskieters in jou datastel kan vind, maar die proses om dit te verwyder is nie so maklik om vind. In hierdie artikel sal ons jou wys hoe om uitskieters in Excel te verwyder .

Laai Werkboek af

Jy kan die gratis oefen Excel-werkboek aflaai vanaf hier.

Verwyder uitskieters.xlsx

Wat is uitskieters in Excel?

'n uitskieter is 'n waarde wat ver van die gemiddelde of mediaanwaarde van 'n datastel val. Met ander woorde, uitskieters is waardes wat aansienlik hoër of laer is as die res van die waardes in 'n datastel.

Dink aan 'n krieketwedstryd waar al die kolwers sowat 50 aangeteken het, maar net een kolwer 'n honderdtal (100) ) en 'n ander kolwer het uitgekom op 0. Dat 100 en 0 tellings die uitskieters in hierdie wedstryd is.

Uitskieters is problematies aangesien hulle die resultaat van die data-analise kan skeeftrek en misleidende resultate kan voorkom. Dit is dus beter om uitskieters te vind en dit te verwyder om 'n gladde datastel te hê.

3 Maniere om uitskieters in Excel te verwyder

In hierdie afdeling sal jy leer hoe om vee uitskieters uit uit jou datastel op 3 verskillende maniere. Die verwydering van uitskieters is 'n moeilike proses, so lees die hele artikel noukeurig.

1. Gebruik Excel-funksie om gemiddelde te bereken sonderUitskieters

Excel TRIMMEAN-funksie kan gebruik word om die gemiddelde van 'n gegewe datastel te bereken terwyl uitskieters uitgesluit word. Die datapunte om uit te sluit word as 'n persentasie verskaf. Die persentasiewaarde kan as 'n desimale formaat of persentasieformaat ingevoer word.

Sintaksis om gemiddelde sonder uitskieters te bereken is,

=TRIMMEAN(skikking, persent)

Hier,

  • skikking = Reeks data om die gemiddelde resultaat te snoei en te bereken
  • persent = Die aantal datapunte om uit te sluit

Kom ons kyk hoe om hierdie funksie te implementeer om resultate met verwyderde uitskieters te bereken.

Beskou die prent hierbo. Ons het data van Sel B5 tot B14 . Hier is die meeste van die getalle tussen 20 tot 27, maar twee waardes – 0 en 100 – is ver van daardie waardes af. Dit is dus die uitskieters in ons datastel.

Vir ons datastel is die formule om gemiddelde (gemiddelde) sonder die uitskieterwaardes met Excel TRIMMEAN -funksie te bereken,

=TRIMMEAN(B5:B14,0.2)

Hier,

  • B5:B14 = Reeks data om te snoei en die gemiddelde resultaat te bereken
  • 0.2 (of 20%) = Die aantal datapunte om uit te sluit

As enige getal in die datastel 20% van die res van die datastel val , dan sal daardie getal uitskieters genoem word.

As jy die formule volgens jou datastel skryf en Enter druk, sal jy die berekende gemiddelde sonder uitskieters kry vir jou datastel. In ons geval hou Sel E6 die berekende gemiddelde wat 23.50 is.

Om te kontroleer of die antwoord korrek is of nie, voer ons die AVERAGE-funksie uit. in Sel E5 wat die gemiddelde ( 28.80 ) van al die waardes in reeks B5:B14 gee. En in Sel E7 , loop ons nog 'n GEMIDDELDE -funksie deur al die selle handmatig in te voer, behalwe dié wat uitskieterwaardes bevat, en het 'n opbrengs van 23.50 as gevolg daarvan gekry.

Ons kan dus sê dat die TRIMMEAN -funksie uitskieters suksesvol van 'n gegewe datastel kan verwyder terwyl die gemiddelde in Excel bereken word.

Lees Meer: Hoe om formule in Excel uit te vee (7+ metodes)

2. Verwyder uitskieters van datastel en lyngrafiek in Excel

Let op die volgende prentjie. Ons het 'n paar data waarop ons 'n lyngrafiek geskep het. Van die lyngrafiek kan ons maklik sien dat in datapunte 4 en 8 ons uitskieters het .

Nou sal ons sien hoe ons kan glad maak die lyngrafiek uit deur die afgeleë waardes uit die datastel te verwyder.

In 'n ander sel (in ons geval is dit Sel H6 ), skryf die volgende formule,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Hier,

  • C6 = Sel wat die eerste data in die datastel hou
  • C5 = Sel bokant die eerste datasel
  • C7 = Sel onder die eerste datasel
  • $E$6 = Verskil tussen datapunte .

Kyk naons data, blyk dit dat wanneer 'n datapunt 10 eenhede van ander verskil, as 'n uitskieter aangewys word. Ons plaas dus 10 in Sel E6 en maak dit 'n Absolute Selverwysing sodat hierdie sel reggestel sal word terwyl die hele datastel geskandeer en bereken word.

Nadat jy Enter gedruk het, kan jy sien dat die eerste data steeds in die resultaatsel H6 verskyn. Al wat jy hier moes doen is om net die formule te konstrueer sodat ons die Vulhandvatsel kan sleep om die formule op die res van die selle toe te pas.

Sleep nou die ry af met Vulhandvatsel en jy sal sien die selle wat die uitskieters gehou het, is nou gevul met #N/A .

En kyk nou na die lyngrafiek, hierdie is nou 'n afgeplatte grafiek sonder enige buitengewone waardes daarin.

Formule-ontleding

=IF(

Omdat ons waardes gaan vergelyk op grond waarvan ons die resultaat sal onttrek, begin ons die formule met die IF -voorwaarde.

=IF(EN(

Ons gaan die huidige datapunt en die sel hierbo en die sel hieronder vergelyk En as beide vergelykings waar is, sal ons eers die datapunt as gevolg daarvan wys, aangesien ons dus met "Beide" vergelykings moet handel, moet ons die AND-funksie gebruik.

=IF(AND(ABS(

Wanneer ons datapunte aftrek, kan sommige data negatiewe waardes gee. En ons doen nienegatiewe waardes wil hanteer aangesien negatiewe waardes altyd die voorwaarde sal weerspreek van "verwydering van data wanneer die verskil 10 is". Om dus seker te maak dat ons altyd positiewe resultate het, moet ons die vergelykings in 'n absolute waardefunksie toevou.

=IF(AND(ABS(C6-C5)> ;$E$6

Hier het ons ons eerste vergelyking begin. Ons trek eenvoudig die huidige waarde af met die waarde hierbo en kyk of die resultaat groter is as die verskilvlak wat in Sel E6<2 gestoor is> en het die sel 'n Absolute Reference gemaak om die selwaarde gesluit te hou.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

Volgende, die tweede deel van die vergelyking wat deur 'n komma geskei word. Dit sal die huidige datapunt met die volgende datapunt vergelyk.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Nou sit ons 'n komma en bepaal om NA-funksie daarin te plaas as beide die EN -funksies waar is.

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

En as die AND -funksie nie waar is nie, dan is ons wil die werklike datapunt terugstuur as die IF Valse waarde. So ons tik e in 'n komma en gee die selverwysingsnommer C6 daarin.

Lees meer: Hoe om datavalidering in Excel te verwyder (5 maniere)

Soortgelyke lesings

  • Hoe om 'n kopskrif in Excel te verwyder (4 metodes)
  • Verwyder stippellyne inExcel (5 vinnige maniere)
  • Hoe om rooster uit Excel te verwyder (6 maklike metodes)
  • Verwyder grense in Excel (4 vinnige maniere)
  • Hoe om verenigbaarheidsmodus in Excel te verwyder (2 maklike maniere)

3. Verwyder uitskieters handmatig in Excel

'n Ander maklike manier om uitskieters in Excel uit te skakel, is om net die waardes van jou datastel te sorteer en die boonste en onderste waardes handmatig daaruit te skrap.

Om te sorteer die data,

  • Kies die datastel.
  • Gaan na Sorteer & Filter in die Redigeer -groep en kies óf Sorteer Kleinste na Grootste óf Sorteer Grootste na Kleinste .

  • In ons geval het ons Sorteer kleinste na grootste gekies. Dit het die nommers in ons datastel in stygende volgorde gesorteer, en die kleinstes bo en die grootstes onder geplaas.

Vee nou net daardie data handmatig uit om die afgeleë waardes van die datastel vry te maak.

Ons beveel nie aan om hierdie proses te volg terwyl jy met 'n groot datastel werk nie. Wanneer jou datastel klein is en makliker is om te sien, kan jy eers hierdie prosedure toepas, anders moet jy dit nie implementeer nie.

Lees meer: Hoe om sorteer in Excel te verwyder ( 3 maklike metodes)

Gevolgtrekking

Hierdie artikel het jou gewys hoe om uitskieters in Excel te verwyder. Ek hoop hierdie artikel was baie voordelig vir jou. Vra gerus as jy enige vrae het rakende dieonderwerp.

Hugh West is 'n hoogs ervare Excel-afrigter en ontleder met meer as 10 jaar ondervinding in die bedryf. Hy het 'n Baccalaureusgraad in Rekeningkunde en Finansies en 'n Meestersgraad in Besigheidsadministrasie. Hugh het 'n passie vir onderrig en het 'n unieke onderrigbenadering ontwikkel wat maklik is om te volg en te verstaan. Sy kundige kennis van Excel het duisende studente en professionele persone wêreldwyd gehelp om hul vaardighede te verbeter en uit te blink in hul loopbane. Deur sy blog deel Hugh sy kennis met die wêreld, en bied gratis Excel-tutoriale en aanlyn opleiding aan om individue en besighede te help om hul volle potensiaal te bereik.