Kako ukloniti nedostatke u Excelu (3 načina)

  • Podijeli Ovo
Hugh West

Pronalaženje izvanrednih vrijednosti i njihovo uklanjanje vrlo je uobičajen zadatak za analizu podataka u statistici, rudarenju podataka, mašinskom učenju itd. Postoji toliko mnogo načina na koje možete pronaći vanjske vrijednosti u svom skupu podataka, ali proces njihovog uklanjanja nije tako jednostavan za naći. U ovom članku ćemo vam pokazati kako ukloniti vanjske vrijednosti u Excelu .

Preuzmite radnu svesku

Možete preuzeti besplatnu Excel radnu svesku za vježbanje sa ovdje.

Ukloni Outliers.xlsx

Što su Outliers u Excelu?

An outlier je vrijednost koja je daleko od srednje vrijednosti ili medijane vrijednosti skupa podataka. Drugim riječima, outliers su vrijednosti koje su značajno veće ili niže od ostalih vrijednosti u skupu podataka.

Pomislite na meč u kriketu gdje su svi udarači postigli oko 50, ali je samo jedan udarač postigao vek (100 ) i drugi udarač je izašao na 0. Ti rezultati od 100 i 0 su odstupanja u ovom meču.

Outlieri su problematični jer mogu iskriviti rezultat analize podataka i dovesti do pogrešnih rezultata. Zato je bolje pronaći vanjske vrijednosti i ukloniti ih da biste imali glatki skup podataka.

3 načina uklanjanja odstupanja u Excelu

U ovom odjeljku ćete naučiti kako izbrišite odstupnike iz vašeg skupa podataka na 3 različita načina. Uklanjanje odstupanja je težak proces, stoga pažljivo pročitajte cijeli članak.

1. Korištenje Excel funkcije za izračunavanje prosjeka bezOutliers

Excel TRIMMEAN funkcija se može koristiti za izračunavanje prosjeka datog skupa podataka bez izuzetaka. Podaci koje treba isključiti daju se u procentima. Vrijednost postotka se može unijeti u decimalni ili postotni format.

Sintaksa za izračunavanje srednje vrijednosti bez odstupanja je,

=TRIMMEAN(niz, posto)

Ovdje,

  • niz = Raspon podataka za skraćivanje i izračunavanje prosječnog rezultata
  • posto = broj podataka koje treba isključiti

Da vidimo kako implementirati ovu funkciju za izračunavanje rezultata sa uklonjenim odstupnicima.

Razmotrite gornju sliku. Imamo podatke od ćelije B5 do B14 . Ovdje je većina brojeva između 20 i 27, ali dvije vrijednosti – 0 i 100 – su daleko od tih vrijednosti. Dakle, ovo su outliers u našem skupu podataka.

Za naš skup podataka, formula za izračunavanje srednje vrijednosti (prosjeka) bez vrijednosti odstupanja s Excel TRIMMEAN funkcijom je,

=TRIMMEAN(B5:B14,0.2)

Ovdje,

  • B5:B14 = Raspon podataka za skraćivanje i izračunavanje prosječnog rezultata
  • 0,2 (ili 20%) = Broj tačaka podataka koje treba isključiti

Ako bilo koji broj u skupu podataka padne 20% daleko od ostatka skupa podataka , tada će se taj broj zvati outliers.

Ako napišete formulu prema svom skupu podataka i pritisnete Enter , dobit ćete izračunatu srednju vrijednost bez odstupanja za vaš skup podataka. U našem slučaju, Ćelija E6 sadrži izračunatu srednju vrijednost koja je 23,50 .

Da provjerimo da li je odgovor tačan ili ne, pokrećemo funkciju PROSJEK u ćeliji E5 koja vraća prosjek ( 28,80 ) svih vrijednosti u rasponu B5:B14 . I u ćeliji E7 , pokrećemo još jednu funkciju AVERAGE ručnim unosom svih ćelija osim onih koje sadrže vrijednosti izvanrednih vrijednosti, i kao rezultat dobijamo povrat od 23,50 .

Dakle, možemo reći da funkcija TRIMMEAN može uspješno ukloniti vanjske vrijednosti iz datog skupa podataka dok izračunava prosjek u Excelu.

Pročitajte više: Kako izbrisati formulu u Excelu (7+ metoda)

2. Uklonite odstupnike iz skupa podataka i linijskog grafikona u Excelu

Primijetite sljedeću sliku. Imamo neke podatke na osnovu kojih smo napravili linijski grafikon. Iz linijskog grafa lako možemo vidjeti da u tačkama podataka 4 i 8 imamo svoje vanjske vrijednosti .

Sada ćemo vidjeti kako možemo izgladiti izvadite linijski grafikon tako što ćete ukloniti vanjske vrijednosti iz skupa podataka.

U drugoj ćeliji (u našem slučaju to je Ćelija H6 ), napišite sljedeću formulu,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Ovdje,

  • C6 = Ćelija koja drži prve podatke u skupu podataka
  • C5 = Ćelija iznad prve ćelije podataka
  • C7 = Ćelija ispod prve ćelije podataka
  • $E$6 = Razlika između tačaka podataka .

Gledanaši podaci, čini se da kada se data tačka razlikuje 10 jedinica od drugih, označava se kao izuzetak . Zato stavljamo 10 u ćeliju E6 i pravimo je apsolutnu referencu ćelije tako da će ova ćelija biti fiksirana dok skenira i izračunava cijeli skup podataka.

Nakon pritiska Enter , možete vidjeti da se prvi podaci još uvijek pojavljuju u ćeliji rezultata H6 . Sve što ste trebali učiniti ovdje je samo da konstruirate formulu tako da možemo povući Fill Handle da primijenimo formulu na ostale ćelije.

Sada povucite red prema dolje pomoću Fill Handle i vidjet ćete da su ćelije koje su držale vanjske vrijednosti sada popunjene sa #N/A .

I pogledajte sada linijski grafikon, ovo je sada spljošten graf bez ikakvih vanjskih vrijednosti u njemu.

Raščlamba formule

=IF(

Kako ćemo upoređivati ​​vrijednosti na osnovu kojih ćemo izdvojiti rezultat, iniciramo formulu sa uslov IF .

=IF(AND(

Uporedićemo trenutnu tačku podataka i ćeliju iznad i ćeliju ispod . I ako su oba poređenja tačna, tek tada ćemo prikazati tačku podataka kao rezultat. Dakle, pošto se moramo pozabaviti "Oba" poređenja, trebali bismo koristiti AND funkciju .

=IF(AND(ABS(

Kada oduzmemo tačke podataka, neki podaci mogu dati negativne vrijednosti. I mi neželite da se bavite negativnim vrednostima jer će negativne vrednosti uvek biti u suprotnosti sa uslovom „uklanjanja podataka kada je razlika 10“. Dakle, da bismo bili sigurni da uvijek imamo pozitivne rezultate, moramo umotati poređenja u funkciju apsolutne vrijednosti .

=IF(AND(ABS(C6-C5)> ;$E$6

Ovdje smo započeli naše prvo poređenje. Jednostavno oduzimamo trenutnu vrijednost gornjoj vrijednosti i vidimo da li je rezultat veći od razine razlike pohranjene u ćeliji E6 i napravila je ćeliju kao Apsolutnu referencu kako bi vrijednost ćelije bila zaključana.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

Sljedeći, drugi dio poređenja koji je odvojen zarezom. On će uporediti trenutnu tačku podataka sa sljedećom tačkom podataka.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Sada stavljamo zarez i odredite da se tamo stavi NA funkcija ako su obje funkcije AND istinite.

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

I ako funkcija AND nije tačna onda mi želite da vratite stvarnu tačku podataka kao IF False vrijednost. Dakle, kucamo e u zarezu i tamo unesite referentni broj ćelije C6 .

Pročitajte više: Kako ukloniti provjeru valjanosti podataka u Excelu (5 načina)

Slična očitanja

  • Kako ukloniti zaglavlje u Excelu (4 metode)
  • Uklonite isprekidane linijeExcel (5 brzih načina)
  • Kako ukloniti mrežu iz Excela (6 jednostavnih metoda)
  • Ukloniti ivice u Excelu (4 brza načina)
  • Kako ukloniti način kompatibilnosti u Excelu (2 laka načina)

3. Ručno uklanjanje odstupanja u Excelu

Još jedan jednostavan način za uklanjanje odstupanja u Excelu je samo sortiranje vrijednosti vašeg skupa podataka i ručno brisanje gornje i donje vrijednosti iz njega.

Da biste sortirali podatke,

  • Odaberi skup podataka.
  • Idi na Sort & Filtrirajte u grupi Uređivanje i odaberite ili Poređaj od najmanjeg do najvećeg ili Poređaj od najvećeg do najmanjeg .

  • U našem slučaju, odabrali smo Poređaj od najmanjeg do najvećeg . On je sortirao brojeve u našem skupu podataka uzlaznim redoslijedom, stavljajući najmanje na vrh, a najveće na dno.

Sada samo ručno izbrišite te podatke kako bi skup podataka vanjske vrijednosti bio slobodan.

Ne preporučujemo da slijedite ovaj proces dok radite s velikim skupom podataka. Kada je vaš skup podataka mali i lakši za pregled, tek tada možete primijeniti ovu proceduru, inače je nemojte implementirati.

Pročitajte više: Kako ukloniti sortiranje u Excelu ( 3 laka metoda)

Zaključak

Ovaj članak vam je pokazao kako ukloniti vanjske vrijednosti u Excelu. Nadam se da vam je ovaj članak bio od velike koristi. Slobodno pitajte ako imate pitanja u vezi satema.

Hugh West je vrlo iskusan Excel trener i analitičar s više od 10 godina iskustva u industriji. Diplomirao je računovodstvo i finansije i magistrirao poslovnu administraciju. Hugh ima strast prema podučavanju i razvio je jedinstven pristup podučavanju koji je lako pratiti i razumjeti. Njegovo stručno znanje o Excel-u pomoglo je hiljadama studenata i profesionalaca širom svijeta da poboljšaju svoje vještine i napreduju u karijeri. Kroz svoj blog, Hugh dijeli svoje znanje sa svijetom, nudeći besplatne Excel tutorijale i online obuku kako bi pomogli pojedincima i preduzećima da ostvare svoj puni potencijal.