Kuidas arvutada Excelis väljaarvamisi (5 lihtsat viisi)

  • Jaga Seda
Hugh West

Andmekogumi andmetega statistiliste arvutuste tegemiseks võib olla vaja tuvastada kõrvalekaldeid. Suurtest andmekogumitest saab Microsoft Exceliga avastada kõrvalekaldeid mitmel viisil. Selles postituses näitame teile, kuidas Microsoft Excelis kõrvalekaldeid arvutada, kasutades viit erinevat viisi.

Lae alla praktiline töövihik

Võite tasuta Exceli töövihiku siit alla laadida ja ise harjutada.

Find Outliers.xlsx

5 praktilist lähenemist Exceli kõrvalekallete arvutamiseks

Outliers on andmeväärtused, mis erinevad oluliselt ülejäänud andmestiku väärtustest. Teisisõnu, väljavoolud on erakordsed väärtused. Nad on kas erakordselt kõrge või liigselt madal võrreldes teiste väärtustega andmekogumis. Kõrvalekaldumiste leidmine on statistilistes arvutustes väga oluline, sest need mõjutavad meie andmeanalüüsi tulemusi.

Näiteks on teil andmekogum, mis näitab kaheteistkümne inimese päevast sissetulekut. Nüüd peate Microsoft Exceli abil välja arvutama kõrvalekaldeid. Siinkohal näitan teile viis lihtsat lähenemisviisi, kuidas seda teha.

1. Kasutage sorteerimist ja; filtrit, et arvutada Excelis väljaarvamisi

Väikesest andmekogumist võib arvutada kõrvalekaldeid, kasutades Sort & Filter käsk Excelis. Kui soovite arvutada kõrvalekaldeid, kasutades sorteerimis- ja filtreerimisfunktsiooni, saate seda teha, järgides alljärgnevaid samme.

1. samm:

  • Kõigepealt valige oma Exceli andmestikus see veeru päis, mida soovite sorteerida. Näiteks antud andmestikus on faili veeru päis nimega Igapäevane sissetulek (Cell C40 on valitud).

2. samm:

  • Seejärel vajutage Kodu vahekaart lindil ja mine menüüsse Redigeerimine rühm.

3. samm:

  • Pärast seda on Redigeerimisgrupp kliki Sort & Filter käsku ja klõpsake Kohandatud Sorteeri .

4. samm:

  • Seejärel avaneb uus dialoogiaken nimega Sorteeri avaneb. Avanenud dialoogiaknas valige Igapäevane Sissetulek aastal Sorteerimine rippmenüü ja Väikseimast suurimani rippmenüüst Order. Pärast seda klõpsake nuppu OK .

5. samm:

  • Lõpuks on Igapäevane sissetulek veerg sorteeritaks nimetatud viisil, kusjuures väikseimad väärtused oleksid üleval ja suurimad väärtused allapoole. Pärast protseduuri käivitamist otsige välja kõik ebakorrapärasused andmete vahemikus, et teha kindlaks kõrvalekaldeid.

Näiteks on kaks esimest väärtust veerus oluliselt madalamad ja kaks viimast väärtust veerus oluliselt kõrgemad kui ülejäänud väärtused andmekogumis, nagu on näidatud ülaltoodud tulemuses.

Loe edasi: Kuidas leida Exceli regressioonianalüüsis väljaulatuvaid väärtusi (3 lihtsat viisi)

2. Rakendage funktsiooni QUARTILE, et arvutada Excelis väljaarvamisi

Funktsioon QUARTILE lähenemine on teaduslikum viis Exceli kõrvalekallete arvutamiseks. Selle funktsiooni abil saate jagada oma andmekogumid neljaks võrdseks osaks. Järgmised väärtused tagastab funktsioon QUARTILE :

  • The minimaalne väärtus.
  • The 1. kvartiil (Q1- antud andmestiku madalaim 25%).
  • The 2. kvartiil (Q2 - andmekogumi kõige madalam 25%).
  • The Kolmas kvartiil (Q3 - andmekogumi suuruselt teine 25%).
  • The maksimaalne väärtus.

Süntaks funktsioon QUARTILE Excelis on:

=QUARTILE(array,quart)

Süntaks sisaldab järgmisi argumente:

  • a rray : antud andmekogumi lahtri vahemik, mille jaoks arvutate kvartiili väärtuse.
  • neljandik: See määrab, milline väärtus tagastatakse.

Ülaltoodud andmekogumi kõrvalekalde arvutamiseks, kasutades funktsioon QUARTILE, järgige alljärgnevaid samme.

1. samm:

  • Esmalt kirjutage järgmine valem, et määrata kindlaks 1. kvartiil ( Q1 ) on esitatud allpool.
=KVARTIAAL($C$5:$C$16,1)

2. samm:

  • Ka siin on valem, millega arvutatakse Kolmas kvartiil ( Q3 ) on esitatud allpool.
=KVARTAL($C$5:$C$16,3)

3. samm:

  • Kolmandaks tuleb kindlaks määrata IQR, mis on Kvartalidevaheline vahemik (see kujutab endast 50% antud andmete vahemikust, mis kuuluvad esimesse ja kolmandasse kvartiili), lahutades sellest Q1 (lahtris G4 ) alates Q3 (lahtris G5 ). Sisestage järgmine valem, et arvutada lahutamist.

    =G5-G4

4. samm:

  • Pärast leidmist IQR, Järgmisena tuleb kindlaks määrata ülemine ja alumine Kuna ülemine ja alumine piir sisaldaks enamikku andmekogumis olevatest andmetest. Kirjutage üles järgmine valem ülemise piiri arvutamiseks.

    =G5+(1,5*G6)

5. samm:

  • Seejärel kirjutage alumise piiri arvutamiseks üles järgmine valem.
=G4-(1,5*G6)

6. samm:

  • Lõpuks, pärast eelmise sammu lõpetamist, saate määrata iga andmeväärtuse jaoks kõrvalekalded. Excel'i töölehel kirjutage järgmine valem koos järgmisega VÕI-funktsioon lahtris D5 .
=OR(C5$G$7)

  • See valem aitab tuvastada andmed, mis ei kuulu eespool nimetatud vahemiku piiresse. Pärast töötlemist näitab valem valemit TÕENE avaldus kui konkreetsed andmed on kõrvalekalded ja VALE kui see ei ole. Topeltklõpsake kohta AutoFill tööriist lahtris C5 kopeerimiseks valemit ülejäänud lahtritesse veerg C Seega võite tähistada kõigi oma andmekogumis esinevate kõrvalekaldumiste kõrval väärtust True.

3. Kombineeri AVERAGE ja STDEV.P funktsioonid, et arvutada keskväärtusest ja standardhälbest kõrvalekaldeid.

A standardhälve (või σ ) on mõõdupuu, millega määratakse, kuidas andmed on jaotunud kogu andmestiku keskväärtuse suhtes. Andmed on grupeerunud keskväärtuse ümber, kui standardhälve on madal, samas kui andmed on rohkem hajutatud, kui standardhälve on kõrge. Väljalangevuste arvutamiseks kasutades Keskmine ja Standardhälve saate järgida järgmisi samme.

1. samm:

  • Kõigepealt kasutage sama andmestikku, mis on näidatud käesoleva artikli alguses, ja seejärel arvutage keskmine ja standardhälve. Keskmise arvutamiseks sisestage järgmine valem koos järgmisega funktsioon AVERAGE lahtris G5 .
=KESKMINE(C5:C16)

2. samm:

  • Standardhälbe arvutamiseks sisestage järgmine valem koos järgmisega funktsioon STDEV.P lahtris G6 .
=STDEV.P(C5:C16)

3. samm:

  • Järgnevalt arvutatakse protsessi edasise edenemise ülempiir. Lahtrisse G7 , arvutatakse alumine piirväärtus järgmise valemi abil.
=G5-(1,25*G6)

4. samm:

  • Ja rakus G8 arvutada ülemine piirarv järgmise valemi alusel
=G5+(1,5*G6)

5. samm:

  • Pärast seda, et arvutada, kas esineb kõrvalekaldeid või mitte, sisestage lahtrisse järgmine valem D5 .
=OR(C5$G$8)

  • Seega annab valem tagasi TÕELINE väärtus, kui konkreetsed andmed soovitud lahtris on kõrvalekaldeid ja VALE.
  • Topeltklõpsake kohta AutoFill tööriist lahtris D5 et kopeerida valem ülejäänud lahtritesse veerg D Nii saate teada kõik ülejäänud kõrvalekalded oma andmestikus.

Loe edasi: Kuidas leida Exceli standardhälbeid (kiirete sammudega)

4. Z-skoori sisestamine, et arvutada Excelis väljaarvamisi

The Z-skoor on üks kõige sagedamini kasutatavaid mõõdikuid kõrvalekallete tuvastamiseks. See meetod näitab, kui kaugel on konkreetsed andmed andmekogumi keskmisest võrreldes selle standardhälbega. Kõrvalekallete arvutamiseks kasutades Z-skoor Excelis näete allpool kirjeldatud samme.

1. samm:

  • Kõigepealt võtke soovitud andmekogum.

2. samm:

  • Teiseks, raku H5, sisestage järgmine valem, et arvutada keskmine antud andmete puhul.
=KESKMINE(C5:C16)

3. samm:

  • Kolmandaks arvutage standardhälve antud andmekogumi kohta lahtris H6 kasutades järgmist valemit.
=STDEV.P(C5:C16)

4. samm:

  • Pärast seda tuleb kindlaks määrata Z -tulemus iga andmeväärtuse kohta. Selleks kasutate allpool esitatud valemit.
=(C5-$H$5)/$H$6

5. samm:

  • Pärast kõigi arvutuste tegemist Z-väärtused, näete, et vahemik Z-väärtused on vahemikus -1.44 ja 13 Niisiis, me kaalume väärtusi Z-skoor vähem kui -1,2 või rohkem kui +1.8 kõrvalekalde piirväärtused.
  • Seejärel sisestage lahtrisse järgmine valem E 5 .
=OR((D51.8))

  • Lõpuks annab valem tagasi TÕELINE väärtus, kui konkreetsed andmed on kõrvalekaldeid ja tagastab VALE
  • Topeltklõpsake raku kohta E5 kasutada AutoFill tööriista täitekäepide, et kopeerida valem ülejäänud lahtritesse sisse veerg E Seega saate leida kõik ülejäänud kõrvalekalded oma andmestikust.

Loe edasi: Kuidas leida Z-skoori abil Excelis väljaulatuvaid väärtusi (kiirete sammudega)

5. LARGE ja SMALL funktsioonide ühendamine, et leida Excelis väljaulatuvaid väärtusi

Funktsioon LARGE ja funktsioon SMALL Excelis on vastupidised operatsioonid. Kasutame seda vastavalt suurima ja väikseima andmete või väärtuste leidmiseks andmekogumis. See funktsioon tõmbab välja kõik andmed andmekogumis, leides väikseima ja suurima arvu. Nad suudavad leida suuruselt teiseks väikseima või suurima, suuruselt kolmandaks suurima või väikseima ja nii edasi.

1. samm:

  • Esiteks, kasutage järgmist valemit lahtris E5 koos funktsioon LARGE .
=LARGE($C$5:$C$16,1)

    • Seega, alates 12 väärtused, näete 1. suurimat väärtust, mis on 780 .

2. samm:

  • Pärast seda, raku G5 , kirjutage üles järgmine valem, et leida väikseim väärtus.
=SMALL($C$5:$C$16,1)

  • Lõpuks, alates 12 väärtused, näete 1. väikseim väärtus 110 .
  • Kui olete kõik vajalikud väärtused välja selgitanud, saate hõlpsasti välja tuua kõik andmekogumis esinevad kõrvalekalded.

Kokkuvõte

Sellega on see artikkel lõppenud. Loodan, et see artikkel on teile kasulik. Pärast selle artikli lugemist saate Excelis arvutada kõrvalekaldeid, kasutades mõnda meetodit. Palun jagage meiega täiendavaid küsimusi või soovitusi allpool olevates kommentaarides.

Hugh West on suurte kogemustega Exceli koolitaja ja analüütik, kellel on selles valdkonnas üle 10-aastane kogemus. Tal on raamatupidamise ja rahanduse bakalaureusekraad ning ärijuhtimise magistrikraad. Hugh’l on kirg õpetamise vastu ning ta on välja töötanud ainulaadse õpetamisviisi, mida on lihtne järgida ja mõista. Tema Exceli ekspertteadmised on aidanud tuhandetel õpilastel ja spetsialistidel üle maailma oma oskusi parandada ja karjääris silma paista. Oma ajaveebi kaudu jagab Hugh oma teadmisi maailmaga, pakkudes tasuta Exceli õpetusi ja veebikoolitusi, mis aitavad üksikisikutel ja ettevõtetel oma potentsiaali täielikult ära kasutada.