Hoe outliers te berekkenjen yn Excel (5 maklike manieren)

  • Diel Dit
Hugh West

Outliers moatte mooglik identifisearre wurde om statistyske berekkeningen te dwaan op gegevens út in dataset. Jo kinne outliers ûntdekke fan enoarme datasets mei Microsoft Excel op ferskate manieren. Yn dit berjocht sille wy jo sjen litte hoe't jo útlizzers yn Microsoft Excel kinne berekkenje mei fiif ûnderskate manieren.

Oefenwurkboek downloade

Jo kinne it fergese Excel-wurkboek hjirwei downloade en op jo eigen oefenje .

Fyn Outliers.xlsx

5 handige oanpak foar it berekkenjen fan Outliers yn Excel

Outliers binne gegevenswearden dy't signifikant ferskille fan 'e rest fan' e gegevenswearden yn 'e dataset. Outliers, mei oare wurden, binne bûtengewoane wearden. Se binne of útsûnderlik heech of te leech yn ferliking mei oare wearden yn in dataset. It finen fan outliers is essensjeel yn statistyske berekkeningen, om't se in ynfloed hawwe op de befinings fan ús gegevensanalyse.

Jo hawwe bygelyks in gegevensset dy't it deistige ynkommen fan tolve minsken sjen lit. No moatte jo de outliers berekkenje mei Microsoft Excel. Hjir sil ik jo fiif maklike oanpak sjen litte om dit te dwaan.

1. Brûk Sort & Filter te berekkenjen Outliers yn Excel

Jo meie berekkenje outliers út in lytse gegevens set troch te brûken de Sort & amp; Filter kommando yn Excel. As jo ​​​​outliers wolle berekkenje mei de sortearje en filterfunksje, kinne jo dit dwaan troch destappen hjirûnder.

Stap 1:

  • Selektearje earst de kolomkop yn jo dataset fan excel dy't jo sortearje wolle. Bygelyks, yn 'e opjûne gegevensset, yn' e triemkolomkop mei de namme Deistich ynkommen (sel C40 is keazen).

Stap 2:

  • Druk dan op de Thús ljepper op it lint en gean nei de Bewurkje groep.

Stap 3:

  • Dêrnei, yn de Bewurkingsgroep klikje op de Sortearje & Filter kommando en klikje op Oanpaste Sortearje .

Stap 4:

  • Dan sil in nij dialoochfinster mei de namme Sortearje iepenje. Selektearje yn it pop-up dialoochfinster Deistich Ynkommen yn it Sortearje op drop-down en Lytst nei Grutste yn it drop-down folchoarder. Klikje dêrnei op OK .

Stap 5:

  • Uteinlik soe de kolom Deistich ynkommen sortearre wurde op 'e oanjûne manier, mei de leechste wearden boppe en de grutste wearden ûnderoan. Nei it útfieren fan de proseduere, sykje nei eventuele ûnregelmjittichheden yn it gegevensberik om útliers te bepalen.

Bygelyks, de earste twa wearden yn 'e kolom binne signifikant leger en de lêste twa wearden yn 'e kolom binne substansjeel heger as de rest fan' e wearden yn 'e dataset, lykas werjûn yn' eboppesteande resultaat.

Lês Mear: How to Find Outliers in Regression Analysis in Excel (3 Easy Ways)

2. Tapasse QUARTILE Function to Outliers berekkenje yn Excel

De QUARTILE-funksje -oanpak is in mear wittenskiplike manier om útliers yn Excel te berekkenjen. Jo kinne dizze funksje brûke om jo gegevenssets te dielen yn fjouwer gelikense dielen. De folgjende wearden wurde weromjûn troch de funksje QUARTILE :

  • De minimale wearde.
  • De minimale wearde. 6> 1e kwartyl (Q1- leechste 25% fan in opjûne dataset).
  • It 2e kwartyl (Q2-folgjende leechste 25% fan de dataset).
  • It 3e kwartyl (Q3- twadde heechste 25% fan de dataset).
  • De maksimum wearde.

De syntaksis fan de funksje QUARTILE yn Excel is:

=QUARTILE( array,quart)

De syntaksis befettet de folgjende arguminten:

  • a rray : it selberik fan in opjûne gegevensset dêr't jo de kwartylwearde foar berekkenje.
  • quart: Dit spesifisearret hokker wearde weromjûn wurde moat.

Folgje de stappen hjirûnder foar it berekkenjen fan de outliers foar de boppesteande dataset mei de QUARTILE-funksje .

Stap 1:

  • Typ earst de folgjende formule foar it bepalen fan it 1e kwartyl ( Q1 ) wurdt hjirûnder jûn.
=QUARTILE($C$5:$C$16,1)

Stap 2:

  • Hjirwer, de formule foar it berekkenjen fan it 3e kwartyl ( Q3 ) wurdt hjirûnder jûn.
=QUARTILE($C$5:$C$16,3)

Stap 3:

  • Tredds moatte jo de IQR bepale, wat is it Inter-Quartile Range (it fertsjintwurdiget 50% fan de opjûne gegevens út in berik fan datasets dy't yn it earste en tredde kwartyl falle) troch Q1 te subtrahearjen (yn sel G4 ) fan Q3 (yn sel G5 ). Typ de folgjende formule om de subtraksje te berekkenjen.

    =G5-G4

Stap 4:

  • Nei it finen fan IQR, nei moatte jo de boppeste en legere Om't de boppeste en legere limyt it measte fan 'e gegevens befetsje soe de dataset. Skriuw de folgjende formule op om de boppegrins te berekkenjen.

    =G5+(1.5*G6)

Stap 5:

  • Dan, om de legere limyt te berekkenjen, skriuw de folgjende formule op.
=G4-(1.5*G6)

Stap 6:

  • Ut it lêst, nei it foltôgjen fan de foarige stap, kinne jo outliers foar elke gegevens bepale wearde. Typ yn it Excel-wurkblêd de folgjende formule mei de OF-funksje yn sel D5 .
=OR(C5$G$7)

  • Dizze formule sil helpe om de gegevens te identifisearjen dy't net binnen de boppeneamde beriklimyt falle. Nei it ferwurkjen fan deformule sil in TRUE Statement toane as de spesifike gegevens in outlier binne en FALSE as dat net is. Dûbelklik op it Autofolje ark yn sel C5 om de formule te kopiearjen nei de rest fan de sellen yn kolom C . Sa kinne jo in Wiere wearde njonken alle útsûnderings yn jo dataset waarnimme.

3. Kombinearje AVERAGE en STDEV.P-funksjes om Outliers te berekkenjen fan gemiddelde en standertdeviaasje

A standertdeviaasje (of σ ) is in metrik foar it bepalen fan hoe ferdield de gegevens binne oangeande de gemiddelde wearde fan de hiele dataset. Gegevens wurde groepearre om it gemiddelde as de standertdeviaasje leech is, wylst gegevens mear ferspraat binne as de standertdeviaasje heech is. Om outliers te berekkenjen mei de Gemiddelde en Standertôfwiking kinne jo de folgjende stappen folgje.

Stap 1:

  • Brûk earst deselde dataset werjûn oan it begjin fan dit artikel en berekkenje dan de gemiddelde en standertdeviaasje. Om it gemiddelde te berekkenjen, typ de folgjende formule mei de AVERAGE-funksje yn sel G5 .
=AVERAGE(C5:C16)

Stap 2:

  • Om de standertdeviaasje te berekkenjen, foegje de folgjende formule yn mei de STDEV .P-funksje yn sel G6 .
=STDEV.P(C5:C16)

Stap 3:

  • Dêrnei sille jo deboppegrins foar fierdere foarútgong yn it proses. Berekkenje yn sel G7 de legere limyt mei de folgjende formule.
=G5-(1.25*G6)

Stap 4:

  • En yn sel G8 berekkenje de boppegrins út de folgjende formule
=G5+(1.5*G6)

Stap 5:

  • Dêrnei , om te berekkenjen oft der útsûnderings binne of net, typ de folgjende formule yn sel D5 .
=OR(C5$G$8)

  • Sa sil de formule in TRUE wearde weromjaan as de spesifike gegevens yn 'e winske sel in útslach binne en FALSE.
  • Dûbelklik op it AutoFill ark yn sel D5 om de formule te kopiearjen nei de rest fan 'e sellen yn kolom D . Sa kinne jo alle oerbleaune outliers yn jo dataset fine.

Read More: How to Find Outliers with Standard Deviation in Excel (with Quick Steps)

4. Foegje Z-Score yn om Outliers te berekkenjen yn Excel

De Z-score is ien fan 'e meast brûkte metriken foar identifisearjen fan outliers. Dizze metoade lit sjen hoe fier in spesifike gegevens is fan it gemiddelde fan in dataset mei respekt foar syn standertdeviaasje. Om outliers te berekkenjen mei Z-score yn Excel kinne jo de stappen hjirûnder beskreaun sjen.

Stap 1:

  • Nim earst de winske gegevensset.

Stap2:

  • Twadens, typ yn sel H5, de folgjende formule foar it berekkenjen fan it gemiddelde foar de opjûne gegevens.
=AVERAGE(C5:C16)

Stap 3:

  • Tredde, berekkenje de standertdeviaasje fan de opjûne dataset yn sel H6 troch de folgjende formule te brûken.
=STDEV.P(C5:C16)

Stap 4:

  • Dêrnei , moatte jo de Z -score foar elke gegevenswearde bepale. Om dit te dwaan brûke jo de hjirûnder jûne formule.
=(C5-$H$5)/$H$6

Stap 5:

  • Nei it berekkenjen fan alle Z-wearden, sille jo sjen dat it berik fan Z-wearden is tusken -1.44 en 13 . Dus, wy beskôgje wearden fan Z-score minder dan -1.2 of mear as +1.8 foar de útfallende grinzen.
  • Typ dan de folgjende formule yn sel E 5 .
=OR((D51.8))

  • Uteinlik sil de formule in TRUE wearde weromjaan as de spesifike gegevens in outlier binne en sil FALSE
  • Dûbelklik op sel E5 om de AutoFill te brûken arkfolje om de formule te kopiearjen nei de rest fan 'e sellen yn kolom E . Sa kinne jo alle oerbleaune outliers fine yn jo dataset.

Read More: How to Find Outliers Using Z Score in Excel (with QuickStappen)

5. Kombinearje LARGE en SMALL funksjes om outliers te finen yn Excel

De LARGE funksje en de SMALL funksje yn Excel hawwe tsjinoerstelde operaasjes. Wy sille it brûke om respektivelik de grutste en lytste gegevens as wearden te finen yn in dataset. Dizze funksje sil lûke alle gegevens binnen in dataset, fine de lytste en grutste nûmers. Se kinne de op ien nei lytste of grutste fine, de tredde-grutste of lytste, ensfh.

Stap 1:

  • Gebrûk earst de folgjende formule yn sel E5 mei de LARGE-funksje .
=LARGE($C$5:$C$16,1)

    • Sa kinne jo fan 12 wearden de 1e grutste wearde sjen dy't <6 is> 780 .

Stap 2:

  • Dernei, yn sel G5 , skriuw de folgjende formule op om de lytste wearde te finen.
=SMALL($C$5:$C$16,1)

  • Ut lêst, fan 12 wearden, kinne jo de 1e sjen kleinste wearde 110 .
  • As jo ​​alle fereaske wearden útfûn hawwe, dan kinne jo maklik útsûnderings yn 'e dataset oanwize.

Konklúzje

Dat is it ein fan dit artikel. Ik hoopje dat jo dit artikel nuttich fine. Nei it lêzen fan dit artikel kinne jo útlieren yn Excel berekkenje mei ien fan 'e metoaden. Diel asjebleaft fierdere fragen of oanbefellings meiús yn 'e kommentaar seksje hjirûnder.

Hugh West is in tige betûfte Excel-trainer en analist mei mear as 10 jier ûnderfining yn 'e yndustry. Hy hat in bachelorstitel yn boekhâlding en finânsjes en in masterstitel yn bedriuwsadministraasje. Hugh hat in passy foar lesjaan en hat in unike lesoanpak ûntwikkele dy't maklik te folgjen en te begripen is. Syn saakkundige kennis fan Excel hat tûzenen studinten en professionals wrâldwiid holpen har feardigens te ferbetterjen en útblinke yn har karriêre. Troch syn blog dielt Hugh syn kennis mei de wrâld, en biedt fergese Excel-tutorials en online training om partikulieren en bedriuwen te helpen har folsleine potensjeel te berikken.