Edukien taula
Estatistika, datu-meatzaritza, ikaskuntza automatikoa eta abarretako datuak aztertzeko oso lan ohikoa da kanpo-egoerak aurkitzea eta horiek kentzea. Hainbeste modu daude zure datu-multzoan abereak aurki ditzakezula baina horiek kentzeko prozesua ez da hain erraza. aurkitu. Artikulu honetan, erakutsiko dizugu nola Excel-en kanpokoak nola ezabatu .
Deskargatu lan-koadernoa
Doako praktika Excel lan-liburua deskarga dezakezu hemendik. hemen.
Kendu Outliers.xlsx
Zer dira Outliers Excel-en?
A Outlier bat datu-multzo baten batez besteko edo medianetik oso urrun dagoen balioa da. Beste era batera esanda, outliers datu-multzo bateko gainerako balioak baino nabarmen handiagoak edo baxuagoak diren balioak dira.
Pentsa kilker-partida batean, non bateatzaile guztiek 50eko gola lortu zuten baina bateatzaile bakarrak mende bat lortu zuen (100). ) eta beste bateatzaile batek 0-ra atera zuen. 100 eta 0 puntuak direla partida honetan kanpoan daudenak.
Atzerrikoak problematikoak dira, datuen analisiaren emaitza okertu eta emaitza engainagarriak sor ditzakete eta. Beraz, hobe da outliers aurkitzea eta kentzea datu-multzo leun bat izateko.
Excel-en outliers kentzeko 3 modu
Atal honetan, nola ikasiko duzu. ezabatu outliers zure datu multzotik 3 modu ezberdinetan. Ezustekoak kentzea prozesu zaila da, beraz, irakurri arretaz artikulu osoa.
1. Excel funtzioa erabiltzea Batez bestekoa kalkulatzeko gabeOutliers
Excel TRIMMEAN funtzioa datu-multzo jakin baten batez bestekoa kalkulatzeko erabil daiteke, kanpoan daudenak baztertuz. Baztertu beharreko datu-puntuak ehuneko gisa ematen dira. Ehunekoaren balioa formatu hamartar edo ehuneko formatu gisa sar daiteke.
Batezbestekoa atzerrikorik gabeko kalkulatzeko sintaxia hau da:
=TRIMMEAN(matrizea, ehunekoa)Hemen,
- matrizea = moztu eta batez besteko emaitza kalkulatzeko datuen tartea
- ehunekoa = Baztertu beharreko datu-puntu kopurua
Ikus dezagun nola inplementatu funtzio hau kendutako kanpo-egoerekin emaitzak kalkulatzeko.
Kontuan izan goiko irudia. B5 zelulatik B14 bitarteko datuak ditugu. Hemen zenbaki gehienak 20 eta 27 artean daude, baina bi balio - 0 eta 100 - balio horietatik oso urrun daude. Beraz, hauek dira gure datu-multzoko outliers .
Gure datu-multzorako, Excel TRIMMEAN funtzioarekin batez besteko baliorik gabe batez bestekoa kalkulatzeko formula hau da:
=TRIMMEAN(B5:B14,0.2)
Hemen,
- B5:B14 = moztu eta batez besteko emaitza kalkulatzeko datuen barrutia
- 0,2 (edo %20) = Baztertu beharreko datu-puntu kopurua
Datu-multzoko edozein zenbaki gainontzeko datu-multzotik %20ko urrun geratzen bada , orduan zenbaki horri abereak deituko zaizkio.
Formula zure datu-multzoaren arabera idazten baduzu eta Sartu sakatzen baduzu, kalkulatutako batez bestekoa izango duzu kanpo-kalterik gabe. zure datu multzorako. Gure kasuan, E6 gelaxkak k 23,50 den batezbesteko kalkulatua dauka.
Erantzuna zuzena den ala ez egiaztatzeko, AVERAGE funtzioa exekutatzen dugu. E5 gelaxka n, B5:B14 barrutiko balio guztien batez bestekoa ( 28,80 ) itzultzen duena. Eta E7 gelaxka -n, beste BATEZBESTEKOA funtzio bat exekutatzen dugu gelaxka guztiak eskuz sartuz kanpoko balioak dituztenak izan ezik, eta ondorioz 23,50 itzulera lortu dugu.
Beraz, esan genezake TRIMMEAN funtzioak datu-multzo jakin bateko abereak behar bezala ken ditzakeela Excel-en batez bestekoa kalkulatzean.
Irakurri gehiago: Nola garbitu Formula Excel-en (7+ metodoak)
2. Kendu Outliers Excel-eko datu-multzotik eta lerro-diagramatik
Ohartu hurrengo irudia. Datu batzuk ditugu eta horietan oinarritutako lerro grafiko bat sortu dugu. Lerro-grafikotik, erraz ikus dezakegu 4 eta 8 datu-puntuetan gure outlierak ditugula .
Orain ikusiko dugu nola leuntzen ditugun atera lerro-diagrama datu-multzotik kanpoko balioak kenduz.
Beste gelaxka batean (gure kasuan H6 gelaxka da), idatzi hurrengo formula,
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Hemen,
- C6 = Datu multzoko lehen datuak dituen gelaxka
- C5 = Lehen datu-gelaxkaren gaineko gelaxka
- C7 = Lehen datu-gelaxkaren azpiko gelaxka
- $E$6 = Datu-puntuen arteko aldea .
Begiragure datuak, badirudi datu-puntu bat besteetatik 10 unitate desberdina denean, atzerriko gisa izendatzen dela. Beraz, 10 jarri dugu E6 gelaxka n eta Zelula-erreferentzia absolutua bihurtuko dugu , gelaxka hau datu-multzo osoa eskaneatzen eta kalkulatzean konponduko da.
Sartu sakatu ondoren, lehen datuak oraindik ere H6 emaitza gelaxkan agertzen ari direla ikus dezakezu. Hemen egin behar duzun guztia formula eraikitzea da, Bete heldulekua arrastatu ahal izateko formula gainerako gelaxketan aplikatzeko.
Orain arrastatu errenkada behera Bete heldulekua -rekin eta kanpoan zeuden gelaxkak #N/A -rekin beteta ikusiko dituzu.
Eta begiratu lerro-diagrama orain, grafiko berdindua da orain bertan kanpo-baliorik gabe.
Formularen banaketa
=IF(
Emaitza aterako dugun balioak alderatuko ditugunez, formula honekin hasiko dugu. IF baldintza.
=IF(ETA(
Uneko datu-puntua eta goiko gelaxka eta beheko gelaxka alderatuko ditugu). . Eta bi konparazioak egiazkoak badira, orduan bakarrik erakutsiko dugu datu-puntua emaitza gisa. Beraz, "Biak" konparazioei aurre egin behar diegunez, ETA funtzioa erabili beharko genuke.
=IF(ETA(ABS(
Datu puntuak kentzen ditugunean, datu batzuek balio negatiboak bota ditzakete. Eta egiten dugu). ezbalio negatiboei aurre egin nahi die balio negatiboak beti kontraesanean egongo direlako "diferentzia 10 denean datuak kentzea". Beraz, beti emaitza positiboak ditugula ziurtatzeko, konparaketak Balio absolutuaren funtzioa batean bildu behar ditugu.
=IF(AND(ABS(C6-C5)>) ;$E$6
Hemen gure lehenengo konparazioari ekin genion. Oraingo balioa goiko balioarekin kentzen dugu eta emaitza E6 gelaxkan<2-n gordetako diferentzia-maila baino handiagoa den ikusten dugu> eta gelaxka Erreferentzia absolutua bihurtu zuen gelaxka-balioa blokeatuta mantentzeko.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
Ondoren, komaz bereizten den konparazioaren bigarren zatia. Uneko datu-puntua hurrengo datu-puntuarekin alderatuko du.
=IF(ETA(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
Orain jartzen dugu koma bat eta zehaztu NA funtzioa bertan jartzea ETA funtzio biak egia badira.
=IF(AND(ABS(C6-C5)) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Eta ETA funtzioa egia ez bada, orduan dugu benetako datu-puntua IF faltsu balio gisa itzuli nahi dugu. Beraz, idazten dugu e koma batean eta pasatu gelaxka-erreferentzia-zenbakia C6 bertan.
Irakurri gehiago: Nola kendu Excel-en datuen baliozkotzea (5 modu)
Antzeko irakurketak
- Nola kendu goiburu bat Excel-en (4 metodo)
- Kendu puntu-lerroak barrutikExcel (5 modu azkar)
- Nola kendu sareta Excel-etik (6 metodo erraz)
- Kendu ertzak Excel-en (4 modu azkar)
- Nola kendu Bateragarritasun modua Excel-en (2 modu errazak)
3. Kendu outliers eskuz Excel-en
Excel-en outliers ezabatzeko beste modu erraz bat zure datu-multzoaren balioak ordenatzea eta eskuz ezabatu goiko eta beheko balioak.
Ordenatzeko. datuak,
- Hautatu datu multzoa.
- Joan Ordenatu & Iragazi Editatzen taldean eta aukeratu Ordenatu txikienetik handienera edo Ordenatu handienetik txikienetik .
- Gure kasuan, Ordenatu txikienetik handienera hautatu dugu. Gure datu-multzoko zenbakiak goranzko ordenan ordenatu ditu, txikienak goiko aldean eta handienak behean jarriz.
Orain eskuz ezabatu datu horiek. datu-multzoaren kanpoko balioak doakoak izan daitezen.
Ez dugu gomendatzen prozesu hau jarraitzea datu multzo handi batekin lan egiten duzun bitartean. Zure datu-multzoa txikia eta ikusteko errazagoa denean, orduan bakarrik aplikatu dezakezu prozedura hau, bestela ez inplementatu.
Irakurri gehiago: Nola kendu Excel-en ordena ( 3 metodo errazak)
Ondorioa
Artikulu honek Excel-en outliers nola kendu erakutsi dizu. Artikulu hau zuretzat oso onuragarria izan dela espero dut. Galdetu lasai galderarik baduzugaia.