Ako odstrániť odľahlé hodnoty v programe Excel (3 spôsoby)

  • Zdieľajte To
Hugh West

Hľadanie odľahlých hodnôt a ich odstraňovanie je veľmi častou úlohou pri analýze údajov v štatistike, dolovaní údajov, strojovom učení atď. Existuje veľa spôsobov, ako môžete nájsť odľahlé hodnoty v súbore údajov, ale proces ich odstraňovania nie je taký jednoduchý. V tomto článku vám ukážeme, ako odstránenie odľahlých hodnôt v programe Excel .

Stiahnite si pracovný zošit

Bezplatný cvičný zošit Excel si môžete stiahnuť odtiaľto.

Odstrániť odľahlé hodnoty.xlsx

Čo sú odľahlé hodnoty v programe Excel?

. odľahlé hodnoty Inými slovami, odľahlé hodnoty sú hodnoty, ktoré sú výrazne vyššie alebo nižšie ako ostatné hodnoty v súbore údajov.

Predstavte si kriketový zápas, v ktorom všetci pálkari dosiahli okolo 50 bodov, ale iba jeden pálkar dosiahol sto bodov (100) a ďalší pálkar vypadol pri 0 bodoch. 100 a 0 bodov sú v tomto zápase odľahlé hodnoty.

Odľahlé hodnoty sú problematické, pretože môžu skresliť výsledok analýzy údajov a spôsobiť zavádzajúce výsledky. Preto je lepšie nájsť odľahlé hodnoty a odstrániť ich, aby sme získali hladký súbor údajov.

3 spôsoby odstránenia odľahlých hodnôt v programe Excel

V tejto časti sa dozviete, ako odstrániť odľahlé hodnoty zo súboru údajov 3 rôznymi spôsobmi. Odstránenie odľahlých hodnôt je zložitý proces, preto si pozorne prečítajte celý článok.

1. Využitie funkcie programu Excel na výpočet priemeru bez odľahlých hodnôt

Excel Funkcia TRIMMEAN možno použiť na výpočet priemeru daného súboru údajov pri vylúčení odľahlých hodnôt. Body údajov, ktoré sa majú vylúčiť, sa zadávajú v percentách. Percentuálnu hodnotu možno zadať v desatinnom formáte alebo v percentách.

Syntax na výpočet priemeru bez odľahlých hodnôt je,

=TRIMMEAN(pole, percent)

Tu,

  • pole = Rozsah údajov na orezanie a výpočet priemerného výsledku
  • percent = Počet dátových bodov, ktoré sa majú vylúčiť

Pozrime sa, ako implementovať túto funkciu na výpočet výsledkov s odstránenými odľahlými hodnotami.

Zoberme si vyššie uvedený obrázok. Máme údaje z Bunky B5 až B14 . Tu je väčšina čísel v rozmedzí 20 až 27, ale dve hodnoty - 0 a 100 - sú ďaleko od týchto hodnôt. Takže toto sú odľahlé hodnoty v našom súbore údajov.

Pre náš súbor údajov je vzorec na výpočet priemeru bez odľahlých hodnôt v programe Excel TRIMMEAN je funkcia,

=TRIMMEAN(B5:B14,0.2)

Tu,

  • B5:B14 = Rozsah údajov na orezanie a výpočet priemerného výsledku
  • 0.2 (alebo 20%) = počet dátových bodov, ktoré sa majú vylúčiť

Ak sa niektoré číslo v súbore údajov nachádza o 20 % mimo zvyšku súboru údajov, potom sa toto číslo nazýva odľahlé hodnoty.

Ak napíšete vzorec podľa svojho súboru údajov a stlačíte Vstúpte na stránku , dostanete vypočítaný priemer bez odľahlých hodnôt pre váš súbor údajov. V našom prípade, Bunka E6 má vypočítaný priemer, ktorý je 23.50 .

Ak chceme skontrolovať, či je odpoveď správna, spustíme príkaz Funkcia AVERAGE na stránke Bunka E5 ktorý vráti priemer ( 28.80 ) všetkých hodnôt v rozsahu B5:B14 . A v Bunka E7 , spustíme ďalší PRIEMERNÉ ručným zadaním všetkých buniek okrem tých, v ktorých sa nachádzajú hodnoty odľahlých hodnôt, a získal návratovú hodnotu 23.50 ako výsledok.

Môžeme teda povedať, že TRIMMEAN dokáže úspešne odstrániť odľahlé hodnoty z daného súboru údajov pri výpočte priemeru v programe Excel.

Prečítajte si viac: Ako vymazať vzorec v programe Excel (7+ metód)

2. Odstránenie odľahlých hodnôt zo súboru údajov a čiarového grafu v programe Excel

Všimnite si nasledujúci obrázok. Máme nejaké údaje, na základe ktorých sme vytvorili čiarový graf. Z čiarového grafu ľahko vidíme, že v dátové body 4 a 8 máme naše odľahlé hodnoty .

Teraz si ukážeme, ako môžeme vyhladiť čiarový graf odstránením odľahlých hodnôt zo súboru údajov.

V inej bunke (v našom prípade je to Bunka H6 ), napíšte nasledujúci vzorec,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Tu,

  • C6 = bunka, ktorá obsahuje prvé údaje v súbore údajov
  • C5 = bunka nad prvou dátovou bunkou
  • C7 = bunka pod prvou dátovou bunkou
  • $E$6 = Rozdiel medzi dátovými bodmi.

Pri pohľade na naše údaje sa zdá, že keď je dátový bod rozdiel 10 jednotiek od ostatných, je označená ako odľahlé hodnoty Tak sme dali 10 na stránke Bunka E6 a urobiť z neho Absolútny odkaz na bunku aby sa táto bunka pri skenovaní a výpočte celého súboru údajov zafixovala.

Po stlačení Vstúpte na stránku , môžete vidieť, že prvé údaje sa stále zobrazujú v bunke výsledku H6 Všetko, čo ste tu museli urobiť, je skonštruovať vzorec tak, aby sme mohli pretiahnuť Rukoväť náplne použiť vzorec na ostatné bunky.

Teraz potiahnite riadok nadol pomocou Rukoväť náplne a uvidíte, že bunky, v ktorých boli odľahlé hodnoty, sú teraz vyplnené #N/A .

A teraz sa pozrite na čiarový graf, ktorý je teraz sploštený a neobsahuje žiadne odľahlé hodnoty.

Rozdelenie vzorca

=IF(

Keďže budeme porovnávať hodnoty, na základe ktorých získame výsledok, vzorec začneme pomocou IF stav.

=IF(AND(

Budeme porovnávať aktuálny dátový bod a bunku nad ním a bunku pod ním. A ak sú obe porovnania pravdivé, iba vtedy zobrazíme dátový bod ako výsledok. Keďže teda potrebujeme riešiť porovnania "Both", mali by sme použiť Funkcia AND .

=IF(AND(ABS(

Keď odčítame dátové body, niektoré údaje môžu hodiť záporné hodnoty. A my sa nechceme zaoberať zápornými hodnotami, pretože záporné hodnoty budú vždy v rozpore s podmienkou "odstránenie údajov, keď je rozdiel 10". Aby sme teda mali istotu, že budeme mať vždy kladné výsledky, musíme porovnania zabaliť do Funkcia absolútnej hodnoty .

=IF(AND(ABS(C6-C5)>$E$6

Tu sme začali naše prvé porovnanie. Jednoducho odčítame aktuálnu hodnotu s hodnotou vyššie a zistíme, či je výsledok väčší ako úroveň rozdielu uložená v Bunka E6 a urobil z bunky Absolútna referencia aby bola hodnota bunky uzamknutá.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)

Ďalej druhá časť porovnania, ktorá je oddelená čiarkou. Porovná sa aktuálny údajový bod s nasledujúcim údajovým bodom.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Teraz vložíme čiarku a určíme, že vložíme Funkcia NA tam, ak obaja A funkcie sú pravdivé.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

A ak A nie je pravda, potom chceme vrátiť skutočný dátový bod ako IF Zadáme teda čiarku a odovzdáme referenčné číslo bunky C6 v ňom.

Prečítajte si viac: Ako odstrániť overovanie údajov v programe Excel (5 spôsobov)

Podobné čítania

  • Ako odstrániť záhlavie v programe Excel (4 metódy)
  • Odstránenie bodkovaných čiar v programe Excel (5 rýchlych spôsobov)
  • Ako odstrániť mriežku z programu Excel (6 jednoduchých metód)
  • Odstránenie hraníc v programe Excel (4 rýchle spôsoby)
  • Ako odstrániť režim kompatibility v programe Excel (2 jednoduché spôsoby)

3. Ručné odstránenie odľahlých hodnôt v programe Excel

Ďalším jednoduchým spôsobom, ako v programe Excel odstrániť odľahlé hodnoty, je jednoducho zoradiť hodnoty súboru údajov a ručne z nich odstrániť horné a dolné hodnoty.

Triedenie údajov,

  • Vyberte súbor údajov.
  • Prejsť na Triedenie & amp; Filter v Úprava stránky a vyberte buď Triediť od najmenšieho po najväčší alebo Triediť od najväčšieho po najmenší .

  • V našom prípade sme vybrali Triediť od najmenšieho po najväčší . Čísla v našom súbore údajov sa zoradili vzostupne, pričom najmenšie čísla sa umiestnili na začiatok a najväčšie na koniec.

Teraz stačí tieto údaje ručne odstrániť, aby sa súbor údajov zbavil odľahlých hodnôt.

Neodporúčame postupovať podľa tohto postupu pri práci s veľkým súborom údajov. Keď je váš súbor údajov malý a ľahšie sa zobrazuje, len vtedy môžete použiť tento postup, inak ho nepoužívajte.

Prečítajte si viac: Ako odstrániť triedenie v programe Excel (3 jednoduché metódy)

Záver

Tento článok vám ukázal, ako odstrániť odľahlé hodnoty v programe Excel. Dúfam, že tento článok bol pre vás veľmi prínosný. Ak máte akékoľvek otázky týkajúce sa tejto témy, neváhajte sa opýtať.

Hugh West je veľmi skúsený tréner a analytik Excelu s viac ako 10-ročnými skúsenosťami v tomto odvetví. Má bakalársky titul v odbore účtovníctvo a financie a magisterský titul v odbore Business Administration. Hugh má vášeň pre vyučovanie a vyvinul jedinečný vyučovací prístup, ktorý sa dá ľahko sledovať a pochopiť. Jeho odborné znalosti Excelu pomohli tisíckam študentov a profesionálov na celom svete zlepšiť svoje zručnosti a vyniknúť vo svojej kariére. Hugh sa prostredníctvom svojho blogu delí o svoje znalosti so svetom a ponúka bezplatné výukové programy Excelu a online školenia, ktoré jednotlivcom a firmám pomôžu naplno využiť ich potenciál.