Kiel Forigi Outliers en Excel (3 Manieroj)

  • Kundividu Ĉi Tion
Hugh West

Trovi eksteraĵojn kaj forigi ilin estas tre ofta tasko por analizi datumojn en statistiko, datumminado, maŝinlernado ktp. Estas tiom da manieroj, ke vi povas trovi eksteraĵojn en via datumaro, sed la procezo por forigi ilin ne estas tiel facila. trovi. En ĉi tiu artikolo, ni montros al vi kiel forigi eksteraĵojn en Excel .

Elŝutu Laborlibron

Vi povas elŝuti la senpagan ekzercan Excel-libron de ĉi tie.

Forigi Outliers.xlsx

Kio estas Outliers en Excel?

An outlier estas valoro kiu malproksimiĝas de la averaĝa aŭ mediana valoro de datumaro. Alivorte, outliers estas valoroj kiuj estas signife pli altaj aŭ pli malaltaj ol la resto de la valoroj en datumaro.

Pensu pri kriketmatĉo kie ĉiuj batantoj gajnis ĉirkaŭ 50 sed nur unu batulo gajnis jarcenton (100). ) kaj alia batulo eliris je 0. Ke 100 kaj 0 poentaro estas la eksteruloj en ĉi tiu matĉo.

Outliers estas problemaj ĉar ili povas misformigi la rezulton de la datuma analizo kaj okazi misgvidaj rezultoj. Do estas pli bone trovi outliers kaj forigi ilin por havi glatan datumaron.

3 Manieroj Forigi Outliers en Excel

En ĉi tiu sekcio, vi lernos kiel forigu eksteraĵojn de via datumaro en 3 malsamaj manieroj. Forigi eksteraĵojn estas malfacila procezo, do legu la tutan artikolon atente.

1. Uzante Excel-Funkcion por Kalkuli Mezon senOutliers

Excel TRIMMEAN-funkcio povas esti uzata por kalkuli la mezumon de donita datumaro dum ekskludo de outliers. La datenpunktoj por ekskludi estas liveritaj kiel procento. La elcenta valoro povas esti enigita kiel dekuma formato aŭ elcenta formato.

Sintakso por kalkuli mezvaloron sen valoroj estas,

=TRIMMEAN(tabelo, procento)

Jen,

  • tabelo = Gamo de datumoj por tondi kaj kalkuli la averaĝan rezulton
  • procento = La nombro da datumpunktoj por ekskludi

Ni vidu kiel efektivigi ĉi tiun funkcion por kalkuli rezultojn kun forigitaj eksteraĵoj.

Konsideru la supran bildon. Ni havas datumojn de Ĉelo B5 ĝis B14 . Ĉi tie la plej multaj el la nombroj estas inter 20 ĝis 27, sed du valoroj – 0 kaj 100 – estas malproksime de tiuj valoroj. Do ĉi tiuj estas la outliers en nia datumaro.

Por nia datumaro, la formulo por kalkuli meznombron (mezumon) sen la outlier valoroj kun Excel TRIMMEAN funkcio estas,

=TRIMMEAN(B5:B14,0.2)

Jen,

  • B5:B14 = Gamo de datumoj por tondi kaj kalkuli la averaĝan rezulton
  • 0.2 (aŭ 20%) = La nombro da datumpunktoj por ekskludi

Se iu nombro en la datumaro malpliiĝas je 20% de la resto de la datumaro , tiam tiu nombro estos nomata valoraĵoj.

Se vi skribas la formulon laŭ via datumaro kaj premas Enigu , vi ricevos la kalkulitan meznombre sen valoraĵoj. por via datumaro. En nia kazo, Ĉelo E6 tenas la kalkulitan meznombre kiu estas 23,50 .

Por kontroli ĉu la respondo estas ĝusta aŭ ne, ni rulas la funkcion MEZONO. en Ĉelo E5 kiu liveras la mezumon ( 28,80 ) de ĉiuj valoroj en intervalo B5:B14 . Kaj en Ĉelo E7 , ni rulas alian MEZONO -funkcion permane enigante ĉiujn ĉelojn krom tiuj, kiuj tenas valorojn eksterordinarajn, kaj ricevis revenon de 23.50 kiel rezulto.

Do ni povas diri, ke la funkcio TRIMMEAN povas sukcese forigi eksteraĵojn de donita datumaro dum kalkulado de la mezumo en Excel.

Legu Pli: Kiel Klarigi Formulon en Excel (7+ Metodoj)

2. Forigu Outliers de Datumaro kaj Linia Diagramo en Excel

Rimarku la sekvan bildon. Ni havas iujn datumojn surbaze de kiuj ni kreis liniografeon. El la linia grafiko, ni povas facile vidi, ke en datumpunktoj 4 kaj 8 ni havas niajn eksteraĵojn .

Nun ni vidos kiel ni povas glatigi el la linio-diagramo forigante la eksterajn valorojn de la datumaro.

En alia ĉelo (en nia kazo ĝi estas Ĉelo H6 ), skribu la jenan formulon,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Jen,

  • C6 = Ĉelo kiu enhavas la unuajn datumojn en la datumaro
  • C5 = Ĉelo super la unua datumĉelo
  • C7 = Ĉelo sub la unua datumĉelo
  • $E$6 = Diferenco inter datumpunktoj .

Rigardasniaj datumoj, ŝajnas ke kiam datumpunkto estas diferencas 10 unuojn de aliaj, estas indikita kiel eksternaĵo . Do ni metas 10 en Ĉelo E6 kaj faras ĝin Absoluta Ĉela Referenco por ke ĉi tiu ĉelo estu fiksita dum skanado kaj kalkulado tra la tuta datumaro.

Post premado de Enigu , vi povas vidi, ke la unuaj datumoj ankoraŭ aperas en la rezulta ĉelo H6 . Ĉio, kion vi devis fari ĉi tie, estas nur konstrui la formulon por ke ni povu treni la Plenigi Tenilon por apliki la formulon al la ceteraj ĉeloj.

Nun trenu la vicon malsupren per Plenigi Tenilon kaj vi vidos, ke la ĉeloj, kiuj tenis la eksteraĵojn, nun estas plenigitaj per #N/A .

Kaj rigardu la linidiagramon nun, ĉi tio nun estas platigita grafeo sen eksteraj valoroj en ĝi.

Formula disfalo

=IF(

Dum ni komparos valorojn surbaze de kiuj ni ĉerpos la rezulton, ni komencas la formulon per la kondiĉo IF .

=IF(KAJ(

Ni komparos la nunan datuman punkton kaj la ĉelon supre kaj la ĉelon sube). Kaj se ambaŭ komparoj estas veraj, nur tiam ni montros la datumpunkton kiel rezulto. Do, ĉar ni devas trakti "Ambaŭ" komparojn, do ni uzu la funkcion KAJ .

=IF(KAJ(ABS(

Kiam ni subtrahas datumpunktojn, iuj datumoj povas ĵeti negativajn valorojn. Kaj ni faras). nevolas trakti negativajn valorojn ĉar negativaj valoroj ĉiam kontraŭos la kondiĉon de "forigi datumojn kiam la diferenco estas 10". Do por certigi, ke ni ĉiam havas pozitivajn rezultojn, ni devas envolvi la komparojn en Absoluta valora funkcio .

=IF(AND(ABS(C6-C5)>) ;$E$6

Ĉi tie ni komencis nian unuan komparon. Ni simple subtrahas la nunan valoron kun la supra valoro kaj vidas ĉu la rezulto estas pli granda ol la diferenco-nivelo konservita en Ĉelo E6 kaj faris la ĉelon Absoluta Referenco por konservi la ĉelan valoron ŝlosita.

=IF(KAJ(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

Sekva, la dua parto de la komparo, kiu estas apartigita per komo. Ĝi komparos la nunan datumpunkton kun la sekva datumpunkto.

=IF(KAJ(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Nun ni metas komo kaj determini meti NA-funkcion tien se ambaŭ funkcioj KAJ estas veraj.

=IF(KAJ(ABS(C6-C5)) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Kaj se la funkcio KAJ ne estas vera, tiam ni volas redoni la realan datuman punkton kiel la IF Falsa valoro.Do ni tajpas e en komo kaj enmetu la ĉelan referencan numeron C6 tie.

Legu Pli: Kiel Forigi Datumvalidigon en Excel (5 Manieroj)

Similaj legaĵoj

  • Kiel forigi kaplinion en Excel (4 metodoj)
  • Forigu Punktliniojn enenExcel (5 Rapidaj Manieroj)
  • Kiel Forigi Kradon de Excel (6 Facilaj Metodoj)
  • Forigi Bordojn en Excel (4 Rapidaj Manieroj)
  • Kiel Forigi Kongruecan Reĝimon en Excel (2 Facilaj Manieroj)

3. Forigi Outliers Mane en Excel

Alia facila maniero forigi outliers en Excel estas, simple ordigi la valorojn de via datumaro kaj permane forigi la suprajn kaj malsuprajn valorojn de ĝi.

Por ordigi. la datumoj,

  • Elektu la datumaron.
  • Iru al Ordi & Filtru en la grupo Redaktado kaj elektu aŭ Ordigi Plej Malgrande al Plej Granda Ordigi Plej Grandan al Plej Malgranda .

  • En nia kazo, ni elektis Ordigi Plej Malgranda al Plej Granda . Ĝi ordigis la nombrojn en nia datumaro en kreskanta ordo, metante la plej malgrandajn supre kaj la plej grandajn malsupre.

Nun simple forigu tiujn datumojn permane. por liberigi la eksterajn valorojn de datumaroj.

Ni ne rekomendas sekvi ĉi tiun procezon dum laborado kun granda datumaro. Kiam via datumaro estas malgranda kaj pli facile videbla, nur tiam vi povas apliki ĉi tiun proceduron, alie ne efektivigu ĉi tion.

Legu Pli: Kiel Forigi Ordigon en Excel ( 3 Facilaj Metodoj)

Konkludo

Ĉi tiu artikolo montris al vi kiel forigi eksteraĵojn en Excel. Mi esperas, ke ĉi tiu artikolo estis tre utila al vi. Bonvolu demandi se vi havas demandojn pri latemo.

Hugh West estas tre sperta Excel-trejnisto kaj analizisto kun pli ol 10 jaroj da sperto en la industrio. Li tenas bakalaŭron en Kontado kaj Financo kaj magistron en Komercadministracio. Hugh havas entuziasmon por instruado kaj evoluigis unikan instruan aliron kiu estas facile sekvi kaj kompreni. Lia sperta scio pri Excel helpis milojn da studentoj kaj profesiuloj tutmonde plibonigi siajn kapablojn kaj elstari en siaj karieroj. Per sia blogo, Hugh dividas sian scion kun la mondo, proponante senpagajn Excel-lernilojn kaj interretan trejnadon por helpi individuojn kaj entreprenojn atingi sian plenan potencialon.