Kako odstraniti izstopajoče vrednosti v programu Excel (3 načini)

  • Deliti To
Hugh West

Iskanje izstopajočih vrednosti in njihovo odstranjevanje je zelo pogosta naloga pri analizi podatkov v statistiki, podatkovnem rudarjenju, strojnem učenju itd. Obstaja veliko načinov, kako lahko v svoji zbirki podatkov najdete izstopajoče vrednosti, vendar postopek njihovega odstranjevanja ni tako enostaven. V tem članku vam bomo pokazali, kako odstranjevanje skrajnih vrednosti v Excelu .

Prenos delovnega zvezka

Brezplačni delovni zvezek Excel lahko prenesete s tega mesta.

Odstranitev odstopanj.xlsx

Kaj so izstopajoče vrednosti v programu Excel?

Na spletni strani odstopanja z drugimi besedami, izstopajoče vrednosti so vrednosti, ki so bistveno višje ali nižje od preostalih vrednosti v zbirki podatkov.

Predstavljajte si tekmo v kriketu, na kateri so vsi igralci dosegli približno 50 točk, vendar je le en igralec dosegel sto točk (100), drugi pa je izpadel pri 0. Rezultata 100 in 0 sta na tej tekmi izstopajoča.

Izstopajoče vrednosti so problematične, saj lahko izkrivljajo rezultate analize podatkov in povzročijo zavajajoče rezultate. Zato je bolje najti izstopajoče vrednosti in jih odstraniti, da dobimo gladko podatkovno zbirko.

3 načini odstranjevanja izstopajočih vrednosti v programu Excel

V tem razdelku boste izvedeli, kako izbrisati izstopajoče vrednosti iz nabora podatkov na tri različne načine. Odstranjevanje izstopajočih vrednosti je zapleten postopek, zato pozorno preberite celoten članek.

1. Uporaba Excelove funkcije za izračun povprečja brez odstopanj

Excel Funkcija TRIMMEAN se lahko uporabi za izračun povprečja danega nabora podatkov, pri čemer se izključijo izstopajoče vrednosti. Podatkovne točke, ki jih je treba izključiti, se navedejo v odstotkih. Vrednost odstotka se lahko vnese v decimalni obliki ali v obliki odstotkov.

Sintaksa za izračun povprečja brez izstopajočih vrednosti je,

=TRIMMEAN(polje, odstotek)

Tukaj,

  • polje = Obseg podatkov za obrezovanje in izračun povprečnega rezultata
  • odstotek = Število podatkovnih točk za izključitev

Oglejmo si, kako uporabiti to funkcijo za izračun rezultatov z odstranjenimi izstopajočimi vrednostmi.

Oglej si zgornjo sliko. Imamo podatke iz Celice B5 do B14 . Tu je večina številk med 20 in 27, vendar sta dve vrednosti - 0 in 100 - so daleč od teh vrednosti. To so torej odkloni v našem naboru podatkov.

Za naš nabor podatkov je formula za izračun povprečja brez odstopajočih vrednosti v programu Excel TRIMMEAN funkcija je,

=TRIMMEAN(B5:B14,0,2)

Tukaj,

  • B5:B14 = Obseg podatkov za obrezovanje in izračun povprečnega rezultata
  • 0.2 (ali 20 %) = število podatkovnih točk, ki jih je treba izključiti

Če katera koli številka v naboru podatkov za 20 % odstopa od preostalega nabora podatkov, se ta številka imenuje izstopajoča.

Če napišete formulo v skladu s svojim naborom podatkov in pritisnete Vnesite , boste dobili izračunano povprečje brez odstopanj za vaš nabor podatkov. V našem primeru, Celica E6 ima izračunano povprečje, ki je 23.50 .

Če želimo preveriti, ali je odgovor pravilen ali ne, zaženemo Funkcija AVERAGE na spletnem mestu Celica E5 ki vrne povprečje ( 28.80 ) vseh vrednosti v območju B5:B14 . In v Celica E7 , zaženemo še eno PRIMERNO z ročnim vnosom vseh celic, razen tistih, v katerih so vrednosti izstopajočih vrednosti, in dobil vrnitev 23.50 kot rezultat.

Zato lahko rečemo, da je TRIMMEAN lahko med izračunavanjem povprečja v Excelu iz danega nabora podatkov uspešno odstranite izstopajoče vrednosti.

Preberite več: Kako izbrisati formulo v Excelu (7+ metod)

2. Odstranjevanje izstopajočih vrednosti iz podatkovne zbirke in linijskega diagrama v programu Excel

Opazujte naslednjo sliko. Imamo nekaj podatkov, na podlagi katerih smo ustvarili linijski graf. Iz linijskega grafa zlahka vidimo, da je v podatkovni točki 4 in 8 imamo naše izstopajoče vrednosti .

Zdaj si bomo ogledali, kako lahko zgladimo linijski grafikon z odstranitvijo odklonskih vrednosti iz nabora podatkov.

V drugi celici (v našem primeru je to Celica H6 ), zapišite naslednjo formulo,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Tukaj,

  • C6 = celica, ki vsebuje prve podatke v naboru podatkov
  • C5 = celica nad prvo podatkovno celico
  • C7 = celica pod prvo podatkovno celico
  • $E$6 = Razlika med podatkovnimi točkami.

Če pogledamo naše podatke, se zdi, da ko je podatkovna točka razlika 10 enot od drugih, je označen kot odstopanja Tako smo postavili 10 na spletnem mestu Celica E6 in ga spremenite v Absolutna referenca na celico tako da bo ta celica med pregledovanjem in izračunavanjem celotnega nabora podatkov fiksirana.

Po pritisku na Vnesite , lahko vidite, da se prvi podatki še vedno pojavljajo v celici rezultata H6 Vse, kar ste morali storiti, je, da ste sestavili formulo, tako da lahko povlečemo Ročaj za polnjenje za uporabo formule v preostalih celicah.

Zdaj povlecite vrstico navzdol z Ročaj za polnjenje in videli boste, da so celice, v katerih so bile oddaljene vrednosti, zdaj napolnjene z #N/A .

Zdaj si oglejte linijski grafikon, ki je zdaj sploščen in nima nikakršnih odklonskih vrednosti.

Razčlenitev formule

=IF(

Ker bomo primerjali vrednosti, na podlagi katerih bomo pridobili rezultat, začnemo formulo z IF stanje.

=IF(AND(

Primerjali bomo trenutno podatkovno točko ter celico nad njo in celico pod njo. In če sta obe primerjavi resnični, bomo kot rezultat prikazali podatkovno točko. Ker se moramo ukvarjati s primerjavami "Both", moramo uporabiti Funkcija AND .

=IF(AND(ABS(

Ko odštevamo podatkovne točke, lahko nekateri podatki vrnejo negativne vrednosti. Z negativnimi vrednostmi se ne želimo ukvarjati, saj bodo negativne vrednosti vedno v nasprotju s pogojem "odstranitev podatkov, ko je razlika 10". Da bi zagotovili vedno pozitivne rezultate, moramo primerjave zaviti v Funkcija absolutne vrednosti .

=IF(AND(ABS(C6-C5)>$E$6

Tu smo začeli prvo primerjavo. Preprosto odštejemo trenutno vrednost od zgornje vrednosti in preverimo, ali je rezultat večji od ravni razlike, shranjene v Celica E6 in naredil celico za Absolutna referenca da vrednost celice ostane zaklenjena.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)

Sledi drugi del primerjave, ki je ločen z vejico. Primerja se trenutna podatkovna točka z naslednjo podatkovno točko.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Zdaj postavimo vejico in določimo, da Funkcija NA v njem, če sta oba IN funkcije so resnične.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

In če IN ni resnična, potem želimo vrniti dejansko podatkovno točko kot IF Napačna vrednost. Zato vnesemo vejico in posredujemo referenčno številko celice C6 v njem.

Preberite več: Kako odstraniti preverjanje podatkov v programu Excel (5 načinov)

Podobna branja

  • Kako odstraniti glavo v Excelu (4 metode)
  • Odstranjevanje pikčastih črt v Excelu (5 hitrih načinov)
  • Kako odstraniti mrežo iz programa Excel (6 enostavnih metod)
  • Odstranjevanje robov v Excelu (4 hitri načini)
  • Kako odstraniti način združljivosti v programu Excel (2 preprosta načina)

3. V programu Excel ročno odstranite izstopajoče vrednosti

Drug enostaven način za odpravo izstopajočih vrednosti v Excelu je, da razvrstite vrednosti podatkovnega niza in ročno izbrišete zgornjo in spodnjo vrednost.

Razvrščanje podatkov,

  • Izberite nabor podatkov.
  • Pojdi na Razvrsti in filtriraj v Urejanje in izberite eno od naslednjih možnosti Razvrsti od najmanjšega do največjega ali Razvrsti od največjega do najmanjšega .

  • V našem primeru smo izbrali Razvrsti od najmanjšega do največjega . Številke v naši zbirki podatkov je razvrstil po naraščajočem vrstnem redu, tako da je najmanjše postavil na vrh, največje pa na dno.

Zdaj te podatke samo ročno izbrišite, da bo nabor podatkov brez odklonskih vrednosti.

Pri delu z velikim naborom podatkov tega postopka ne priporočamo. Ko je vaš nabor podatkov majhen in ga je lažje pregledati, lahko uporabite ta postopek, sicer ga ne izvajajte.

Preberite več: Kako odstraniti razvrščanje v Excelu (3 preproste metode)

Zaključek

V tem članku je bilo prikazano, kako odstranite izstopajoče vrednosti. v Excelu. Upam, da vam je bil ta članek zelo koristen. Če imate v zvezi s to temo kakršno koli vprašanje, vas lahko vprašamo.

Hugh West je zelo izkušen trener Excela in analitik z več kot 10-letnimi izkušnjami v industriji. Po izobrazbi je diplomirani računovodstvo in finance ter magisterij poslovne administracije. Hugh ima strast do poučevanja in je razvil edinstven pristop k poučevanju, ki ga je enostavno slediti in razumeti. Njegovo strokovno znanje o Excelu je pomagalo na tisoče študentom in strokovnjakom po vsem svetu, da so izboljšali svoje sposobnosti in se izkazali v karieri. Prek svojega bloga Hugh deli svoje znanje s svetom, ponuja brezplačne vadnice za Excel in spletno usposabljanje, ki posameznikom in podjetjem pomaga doseči njihov polni potencial.