Hoe Outliers yn Excel ferwiderje (3 manieren)

  • Diel Dit
Hugh West

Utliers fine en se fuortsmite is in heul gewoane taak om gegevens te analysearjen yn statistyk, data mining, masine learen ensfh. D'r binne safolle manieren wêrop jo outliers kinne fine yn jo dataset, mar it proses om se te ferwiderjen is net sa maklik om fine. Yn dit artikel sille wy jo sjen litte hoe't jo outliers fuortsmite yn Excel .

Download Workbook

Jo kinne it fergese Excel-wurkboek downloade fanút hjir.

Ferwiderje Outliers.xlsx

Wat binne Outliers yn Excel?

In outlier is in wearde dy't fier ôffalt fan 'e gemiddelde of mediaanwearde fan in dataset. Mei oare wurden, outliers binne wearden dy't oanmerklik heger of leger binne as de rest fan de wearden yn in dataset.

Tink oan in cricketwedstriid wêrby't alle slagers om de 50 skoarden, mar mar ien batman in ieu skoarde (100) ) en in oare batsman kaam út op 0. Dat 100 en 0 skoares binne de outliers yn dizze wedstriid.

Outliers binne problematysk as se kinne skew it resultaat fan de gegevens analyze en foarkomme misliedend resultaten. Dus it is better om útliers te finen en se te ferwiderjen om in glêde dataset te hawwen.

3 Manieren om Outliers yn Excel te ferwiderjen

Yn dizze seksje sille jo leare hoe't jo outliers wiskje fan jo dataset op 3 ferskillende manieren. It fuortsmiten fan outliers is in lestich proses, dus lês it hiele artikel goed troch.

1. Excel-funksje brûke om gemiddelde te berekkenjen sûnderOutliers

Excel TRIMMEAN-funksje kin brûkt wurde om it gemiddelde fan in opjûne dataset te berekkenjen, wylst outliers útsluten. De gegevenspunten om út te sluten wurde as persintaazje levere. De persintaazjewearde kin ynfierd wurde as in desimaal formaat of persintaazje formaat.

Syntaksis foar it berekkenjen fan gemiddelde sûnder útfallers is,

=TRIMMEAN(array, persint)

Hjir,

  • array = Berik fan gegevens om it gemiddelde resultaat te trimmen en te berekkenjen
  • persint = De oantal gegevenspunten om út te sluten

Lit ús sjen hoe't jo dizze funksje ymplementearje om resultaten te berekkenjen mei fuorthelle útfallers.

Besjoch de boppesteande ôfbylding. Wy hawwe gegevens fan Sel B5 oant B14 . Hjir binne de measte nûmers tusken 20 en 27, mar twa wearden - 0 en 100 - binne in fier wei fan dy wearden ôf. Dit binne dus de outliers yn ús dataset.

Foar ús dataset is de formule om gemiddelde (gemiddelde) te berekkenjen sûnder de outlier-wearden mei Excel TRIMMEAN -funksje,

=TRIMMEAN(B5:B14,0.2)

Hjir,

  • B5:B14 = Berik fan gegevens om it gemiddelde resultaat te trimmen en te berekkenjen
  • 0.2 (of 20%) = It oantal gegevenspunten om út te sluten

As in nûmer yn 'e dataset 20% fan 'e rest fan 'e dataset falt , dan wurdt dat getal outliers neamd.

As jo ​​de formule skriuwe neffens jo dataset en op Enter drukke, krije jo it berekkene gemiddelde sûnder útsûnderings foar jo dataset. Yn ús gefal hâldt Sel E6 it berekkene gemiddelde dat 23,50 is.

Om te kontrolearjen oft it antwurd goed is of net, rinne wy ​​de funksje AVERAGE yn Sel E5 dy't it gemiddelde ( 28.80 ) werombringt fan alle wearden yn berik B5:B14 . En yn Sel E7 , rinne wy ​​in oare AVERAGE -funksje troch alle sellen mei de hân yn te fieren, útsein dejingen dy't wearden foar útlizzende wearden hâlde, en krigen in weromkomming fan 23.50 as resultaat.

Sa kinne wy ​​​​sizze dat de funksje TRIMMEAN mei súkses útfallers fan in opjûne dataset fuortsmite kin by it berekkenjen fan it gemiddelde yn Excel.

Lês mear: Hoe formulearje yn Excel wiskje (7+ metoaden)

2. Ferwiderje Outliers fan Dataset en Line Chart yn Excel

Let op de folgjende ôfbylding. Wy hawwe wat gegevens basearre op dêr't wy makke in line grafyk. Ut de linegrafyk kinne wy ​​maklik sjen dat yn gegevenspunten 4 en 8 wy ús outliers hawwe .

No sille wy sjen hoe't wy kinne glêdje út it linediagram troch it fuortheljen fan de bûtenste wearden út de dataset.

Yn in oare sel (yn ús gefal is it Sel H6 ), skriuw de folgjende formule,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Hjir,

  • C6 = Sel dy't de earste gegevens yn 'e dataset befettet
  • C5 = Sel boppe de earste gegevenssel
  • C7 = Sel ûnder de earste gegevenssel
  • $E$6 = Ferskil tusken gegevenspunten .

Sjoch neiús gegevens, it liket derop dat as in gegevenspunt ferskillen 10 ienheden fan oaren, wurdt oanwiisd as in outlier . Sa sette wy 10 yn Sel E6 en meitsje der in Absolute Cell Reference sadat dizze sel fêst wurdt by it scannen en berekkenjen troch de hiele dataset.

Nei it drukken op Enter kinne jo sjen dat de earste gegevens noch ferskine yn 'e resultaatsel H6 . Alles wat jo hjir hoege te dwaan is gewoan de formule te konstruearjen sadat wy de Fill Handle kinne slepe om de formule op de rest fan de sellen ta te passen.

Sleep no de rige nei ûnderen mei Fill Handle en jo sille sjen dat de sellen dy't de outliers holden binne no fol mei #N/A .

En sjoch no nei it linediagram, dit is no in ôfplatte grafyk sûnder bûtenwearden deryn.

Formule-ôfdieling

=IF(

Om't wy wearden sille fergelykje op basis wêrfan wy it resultaat sille ekstrahearje, begjinne wy ​​de formule mei de betingst IF .

=IF(EN(

Wy sille it aktuele gegevenspunt fergelykje mei de sel boppe en de sel hjirûnder En as beide fergelikingen wier binne, allinich dan sille wy it gegevenspunt as resultaat sjen litte. Dus, om't wy moatte omgean mei "Beide" fergelikingen, moatte wy de EN-funksje brûke.

=IF(AND(ABS(

As wy gegevenspunten subtrahearje, kinne guon gegevens negative wearden jaan. En wy dogge n'twolle omgean mei negative wearden as negative wearden sille altyd tsjinsprekke de betingst fan "ferwiderje gegevens as it ferskil is 10". Dus om derfoar te soargjen dat wy altyd positive resultaten hawwe, moatte wy de fergelikingen yn in Absolute weardefunksje ynpakke.

=IF(AND(ABS(C6-C5)> ;$E$6

Hjir hawwe wy ús earste fergeliking begûn. Wy lûke gewoan de aktuele wearde ôf mei de wearde hjirboppe en sjogge oft it resultaat grutter is as it ferskilnivo opslein yn Sel E6 en makke de sel in Absolute Reference om de selwearde beskoattele te hâlden.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

Dêrnei, it twadde diel fan 'e fergeliking dat wurdt skieden troch in komma. It sil it hjoeddeistige gegevenspunt fergelykje mei it folgjende gegevenspunt.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

No sette wy in komma en bepale om NA-funksje dêr yn te setten as sawol de EN -funksjes wier binne.

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

En as de funksje EN net wier is, dan wolle it feitlike gegevenspunt weromjaan as de IF False wearde. Sa typearje wy e yn in komma en jou it selferwizingsnûmer C6 dêryn troch.

Lês mear: Hoe kinne jo gegevensvalidaasje fuortsmite yn Excel (5 manieren)

Gelykbere lêzingen

  • Hoe kinne jo in koptekst fuortsmite yn Excel (4 metoaden)
  • Dotted Lines fuortsmite ynExcel (5 rappe manieren)
  • Hoe kin ik Grid fuortsmite fan Excel (6 maklike metoaden)
  • Rânen fuortsmite yn Excel (4 rappe manieren)
  • Hoe kinne jo de kompatibiliteitsmodus fuortsmite yn Excel (2 maklike manieren)

3. Outliers mei de hân fuortsmite yn Excel

In oare maklike manier om outliers yn Excel te eliminearjen is gewoan de wearden fan jo dataset te sortearjen en de boppeste en ûnderste wearden derút te wiskjen.

Om te sortearjen de gegevens,

  • Selektearje de dataset.
  • Gean nei Sortearje & Filter yn 'e groep Bewurkje en kies Sortearje Lytste nei Grutste of Sortearje Grutste nei Lytste .

  • Yn ús gefal hawwe wy Sortearje lytste nei grutste selektearre. It sortearre de nûmers yn ús dataset yn oprinnende folchoarder, pleatst de lytste boppe en de grutste ûnderoan. om bûtensteande wearden fan de dataset frij te meitsjen.

    Wy riede net oan om dit proses te folgjen by it wurkjen mei in grutte dataset. As jo ​​dataset lyts is en makliker te besjen is, allinich dan kinne jo dizze proseduere tapasse, oars implementearje dit net.

    Lês Mear: How to Remove Sort in Excel ( 3 maklike metoaden)

    Konklúzje

    Dit artikel liet jo sjen hoe't jo outliers ferwiderje yn Excel. Ik hoopje dat dit artikel tige foardielich foar jo west hat. Fiel jo frij om te freegjen as jo fragen hawwe oangeande deûnderwerp.

Hugh West is in tige betûfte Excel-trainer en analist mei mear as 10 jier ûnderfining yn 'e yndustry. Hy hat in bachelorstitel yn boekhâlding en finânsjes en in masterstitel yn bedriuwsadministraasje. Hugh hat in passy foar lesjaan en hat in unike lesoanpak ûntwikkele dy't maklik te folgjen en te begripen is. Syn saakkundige kennis fan Excel hat tûzenen studinten en professionals wrâldwiid holpen har feardigens te ferbetterjen en útblinke yn har karriêre. Troch syn blog dielt Hugh syn kennis mei de wrâld, en biedt fergese Excel-tutorials en online training om partikulieren en bedriuwen te helpen har folsleine potensjeel te berikken.