Sisukord
Kõrvalekaldumiste leidmine ja nende eemaldamine on väga levinud ülesanne andmete analüüsimisel statistikas, andmekaevanduses, masinõppes jne. On nii palju viise, kuidas leida kõrvalekaldumisi oma andmestikust, kuid nende eemaldamise protsess ei ole nii lihtne. Selles artiklis näitame teile, kuidas eemaldage Excelis kõrvalekaldeid .
Lae alla töövihik
Tasuta Exceli harjutusvihiku saate alla laadida siit.
Eemaldage väljavoolud.xlsxMis on Exceli väljumisnäitajad?
An väljapoole jääv on väärtus, mis erineb oluliselt andmekogumi keskmisest või mediaanväärtusest. Teisisõnu, kõrvalekalded on väärtused, mis on oluliselt suuremad või väiksemad kui ülejäänud väärtused andmekogumis.
Mõelge kriketimängule, kus kõik löögimängijad said umbes 50 punkti, kuid ainult üks löögimängija saavutas sajandi (100) ja teine löögimängija jäi välja 0. Need 100 ja 0 punkti on selles mängus väljajääjad.
Kõrvalekalded on problemaatilised, sest need võivad moonutada andmeanalüüsi tulemust ja põhjustada eksitavaid tulemusi. Seega on parem leida kõrvalekalded ja need eemaldada, et saada sujuv andmestik.
3 viisi, kuidas Excelis kõrvalekaldeid eemaldada
Selles jaotises saate teada, kuidas kustutada kõrvalekaldeid oma andmestikust 3 erineval viisil. Kõrvalekaldumiste eemaldamine on keeruline protsess, seega lugege kogu artikkel hoolikalt läbi.
1. Exceli funktsiooni kasutamine keskmiste arvutamiseks ilma kõrvalekaldeid arvestamata
Excel TRIMMEAN funktsioon saab kasutada antud andmekogumi keskmise arvutamiseks, jättes välja kõrvalekalded. Välja jäetavad andmepunktid esitatakse protsentides. Protsendiväärtuse saab sisestada kümnend- või protsentides.
Süntaks keskväärtuse arvutamiseks ilma kõrvalekaldeid arvestamata on,
=TRIMMEAN(massiivi, protsent)Siin,
- massiivi = Andmete vahemik, mida trimmida ja arvutada keskmine tulemus
- protsent = Välja jäetavate andmepunktide arv
Vaatame, kuidas rakendada seda funktsiooni, et arvutada tulemusi eemaldatud kõrvalekalletega.
Vaadakem ülaltoodud pilti. Meil on andmed Lahter B5 kuni B14 . siin on enamik numbreid vahemikus 20-27, kuid kaks väärtust - 0 ja 100 - on neist väärtustest kaugel. Seega on need väärtused väljapoole jääjad meie andmekogumis.
Meie andmekogumi jaoks on valem keskmise (keskmise) arvutamiseks ilma kõrvalekaldeid arvestamata Exceliga järgmine valem TRIMMEAN funktsioon on,
=TRIMMEAN(B5:B14,0.2)
Siin,
- B5:B14 = Andmete vahemik, mida trimmida ja arvutada keskmine tulemus
- 0.2 (või 20%) = Välja jäetavate andmepunktide arv.
Kui mõni arv andmekogumis langeb 20% võrra kõrvale ülejäänud andmekogumist, siis nimetatakse seda arvu kõrvalekaldumiseks.
Kui kirjutate valemi vastavalt oma andmekogumile ja vajutate Sisesta , saate te arvutatud keskmine ilma kõrvalekaldumisteta meie puhul, Ruut E6 sisaldab arvutatud keskmist, mis on 23.50 .
Et kontrollida, kas vastus on õige või mitte, käivitame programmi AVERAGE funktsioon aadressil Ruut E5 mis tagastab keskmise ( 28.80 ) kõik väärtused vahemikus B5:B14 . Ja... Raku E7 , käivitame veel ühe AVERAGE funktsioon, sisestades käsitsi kõik lahtrid, välja arvatud need, mis sisaldavad kõrvalekaldeid, ja sain tulemuseks 23.50 tulemuseks.
Seega võime öelda, et TRIMMEAN funktsiooniga saab Excelis keskmist arvutades edukalt eemaldada antud andmestikust kõrvalekaldeid.
Loe edasi: Kuidas kustutada valemit Excelis (7+ meetodid)
2. Kõrvalekaldumiste eemaldamine Exceli andmestikust ja joondiagrammist
Pange tähele järgmist pilti. Meil on mõned andmed, mille põhjal me lõime joongraafiku. Joongraafikult näeme hõlpsasti, et aastal andmepunktid 4 ja 8 on meie kõrvalekalded. .
Nüüd vaatame, kuidas saame siluda joondiagrammi, eemaldades andmestikust kõrvalised väärtused.
Teises lahtris (meie puhul on see Lahter H6 ), kirjutage järgmine valem,
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Siin,
- C6 = lahter, mis sisaldab andmekogumi esimesi andmeid.
- C5 = esimese andmeraku kohal olev lahter
- C7 = esimese andmeraku all olev lahter
- $E$6 = Andmepunktide vaheline erinevus.
Meie andmeid vaadates tundub, et kui andmepunkt on erinevad 10 ühikut teistelt, on määratud kui väljapoole jääv Nii et me paneme 10 aadressil Ruut E6 ja teha sellest Absoluutne lahtri viide et see lahter oleks kogu andmekogumi skaneerimisel ja arvutamisel fikseeritud.
Pärast vajutamist Sisesta , näete, et esimesed andmed ilmuvad endiselt tulemuse lahtrisse. H6 . Kõik, mida sa pidid siin tegema, on lihtsalt konstrueerida valem, nii et me saame lohistada Täitmise käepide et rakendada valemit ülejäänud lahtritele.
Nüüd lohistage rida alla koos Täitmise käepide ja te näete, et lahtrid, mis sisaldasid kõrvalekaldeid, on nüüd täidetud #N/A .
Ja vaadake nüüd joongraafikut, see on nüüd lamedam graafik ilma kõrvaliste väärtusteta.
Valemi jaotus
=IF(
Kuna me kavatseme võrrelda väärtusi, mille põhjal me ekstraheerime tulemuse, siis algatame valemi koos valemiga IF tingimus.
=IF(AND(
Me võrdleme praegust andmepunkti ja lahtrit eespool ja lahtrit allpool. Ja kui mõlemad võrdlused on tõesed, siis ainult siis näitame tulemuseks andmepunkti. Seega, kuna me peame tegelema "mõlema" võrdlusega, siis peaksime kasutama funktsiooni AND funktsioon .
=IF(AND(ABS(
Kui me lahutame andmepunkte, võivad mõned andmed visata negatiivseid väärtusi. Ja me ei taha negatiivsete väärtustega tegeleda, sest negatiivsed väärtused on alati vastuolus tingimusega "andmete eemaldamine, kui vahe on 10". Seega, et tagada, et meil oleks alati positiivsed tulemused, peame võrdlused mähkimisega mähendama Absoluutväärtuse funktsioon .
=IF(AND(ABS(C6-C5)>$E$6
Siin alustasime oma esimest võrdlust. Me lihtsalt lahutame praeguse väärtuse ülalpool olevast väärtusest ja vaatame, kas tulemus on suurem kui erinevuse tase, mis on salvestatud aadressil Ruut E6 ja tegi raku Absoluutne viide et hoida lahtri väärtus lukus.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)
Järgneb teine osa võrdlusest, mis on eraldatud komaga. See võrdleb praegust andmepunkti järgmise andmepunktiga.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
Nüüd paneme koma ja otsustame panna NA funktsioon seal, kui nii JA funktsioonid on tõesed.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Ja kui JA funktsioon ei ole tõsi, siis tahame tagastada tegeliku andmepunkti kui IF Vale väärtus. Seega kirjutame koma ja anname edasi lahtri viitenumbri C6 seal sees.
Loe edasi: Kuidas eemaldada andmete valideerimine Excelis (5 võimalust)
Sarnased lugemised
- Kuidas eemaldada Exceli päis (4 meetodit)
- Eemaldage punktiirid Excelis (5 kiiret viisi)
- Kuidas eemaldada Exceli ruudustik (6 lihtsat meetodit)
- Eemaldage Exceli piire (4 kiiret viisi)
- Kuidas eemaldada Exceli ühilduvusrežiim (2 lihtsat viisi)
3. Kõrvalekaldumiste käsitsi eemaldamine Excelis
Teine lihtne viis Exceli kõrvalekaldumiste kõrvaldamiseks on lihtsalt sorteerida oma andmestiku väärtused ja kustutada sellest käsitsi ülemised ja alumised väärtused.
Andmete sorteerimiseks,
- Valige andmekogum.
- Mine edasi Sort & Filter aastal Redigeerimine rühma ja valige kas Sorteeri väikseimast suurimani või Sorteeri Suurimast Väikseimani .
- Meie puhul valisime Sorteeri väikseimast suurimani See sorteeris meie andmekogumi numbrid kasvavas järjekorras, paigutades kõige väiksemad ülesse ja kõige suuremad alla.
Nüüd lihtsalt kustutage need andmed käsitsi, et muuta andmekogumi kõrvalised väärtused vabaks.
Me ei soovita seda protsessi järgida, kui töötate suure andmestikuga. Kui teie andmestik on väike ja kergemini vaadeldav, võite seda protseduuri rakendada ainult siis, muidu ärge rakendage seda.
Loe edasi: Kuidas eemaldada sorteerimine Excelis (3 lihtsat meetodit)
Kokkuvõte
See artikkel näitas teile, kuidas eemaldada kõrvalekaldeid Excelis. Loodan, et see artikkel oli teile väga kasulik. Küsige julgelt, kui teil on teemaga seoses küsimusi.