Jak odstranit odlehlé hodnoty v aplikaci Excel (3 způsoby)

  • Sdílet Toto
Hugh West

Nalezení odlehlých hodnot a jejich odstranění je velmi častým úkolem při analýze dat ve statistice, dolování dat, strojovém učení atd. Existuje mnoho způsobů, jak odlehlé hodnoty v souboru dat najít, ale postup jejich odstranění není tak snadný. V tomto článku vám ukážeme, jak na to. odstranění odlehlých hodnot v aplikaci Excel .

Stáhnout pracovní sešit

Bezplatný cvičný sešit aplikace Excel si můžete stáhnout zde.

Odstranění odlehlých hodnot.xlsx

Co jsou odlehlé hodnoty v aplikaci Excel?

. odlehlé hodnoty je hodnota, která se výrazně odchyluje od střední hodnoty nebo mediánu souboru dat. Jinými slovy, odlehlé hodnoty jsou hodnoty, které jsou výrazně vyšší nebo nižší než ostatní hodnoty v souboru dat.

Představte si kriketový zápas, ve kterém všichni pálkaři dosáhli skóre kolem 50 bodů, ale pouze jeden pálkař dosáhl století (100 bodů) a další pálkař vypadl při skóre 0. Skóre 100 a 0 bodů jsou v tomto zápase odlehlé hodnoty.

Odlehlé hodnoty jsou problematické, protože mohou zkreslit výsledek analýzy dat a vést k zavádějícím výsledkům. Proto je lepší odlehlé hodnoty najít a odstranit, aby byl soubor dat hladký.

3 způsoby odstranění odlehlých hodnot v aplikaci Excel

V této části se dozvíte, jak odstranit odlehlé hodnoty ze souboru dat třemi různými způsoby. Odstranění odlehlých hodnot je složitý proces, proto si pozorně přečtěte celý článek.

1. Využití funkce aplikace Excel pro výpočet průměru bez odlehlých hodnot

Excel Funkce TRIMMEAN lze použít k výpočtu průměru daného souboru dat při vyloučení odlehlých hodnot. Datové body, které se mají vyloučit, se zadávají v procentech. Procentní hodnotu lze zadat v desetinném formátu nebo v procentech.

Syntaxe pro výpočet průměru bez odlehlých hodnot je,

=TRIMMEAN(pole, procenta)

Zde,

  • pole = Rozsah dat pro ořezání a výpočet průměrného výsledku
  • procenta = Počet datových bodů, které se mají vyloučit

Podívejme se, jak tuto funkci implementovat pro výpočet výsledků s odstraněnými odlehlými hodnotami.

Vezměme si výše uvedený obrázek. Máme údaje z Buňky B5 až B14 . Zde je většina čísel v rozmezí 20 až 27, ale dvě hodnoty - 0 a 100 - jsou od těchto hodnot velmi vzdálené. Takže tyto hodnoty jsou odlehlé hodnoty v našem souboru dat.

Vzorec pro výpočet průměru (průměru) bez odlehlých hodnot pomocí aplikace Excel pro náš soubor dat TRIMMEAN funkce je,

=TRIMMEAN(B5:B14,0.2)

Zde,

  • B5:B14 = Rozsah dat pro ořezání a výpočet průměrného výsledku
  • 0.2 (nebo 20 %) = počet datových bodů, které se vyloučí.

Pokud se některé číslo v souboru dat odchyluje o 20 % od zbytku souboru dat, pak se toto číslo označí jako odlehlé hodnoty.

Pokud napíšete vzorec podle své datové sady a stisknete tlačítko Vstupte na , získáte vypočtený průměr bez odlehlých hodnot pro vaši sadu dat. V našem případě, Buňka E6 je vypočtený průměr, který je 23.50 .

Abychom ověřili, zda je odpověď správná, spustíme příkaz Funkce AVERAGE na adrese Buňka E5 který vrací průměr ( 28.80 ) všech hodnot v rozsahu B5:B14 . A v Buňka E7 , spustíme další PRŮMĚRNÉ ručním zadáním všech buněk kromě těch, které obsahují odlehlé hodnoty, a získal návratovou hodnotu 23.50 jako výsledek.

Můžeme tedy říci, že TRIMMEAN dokáže úspěšně odstranit odlehlé hodnoty z daného souboru dat při výpočtu průměru v aplikaci Excel.

Přečtěte si více: Jak vymazat vzorec v aplikaci Excel (7+ metod)

2. Odstranění odlehlých hodnot ze souboru dat a čárového grafu v aplikaci Excel

Všimněte si následujícího obrázku. Máme k dispozici určitá data, na jejichž základě jsme vytvořili spojnicový graf. Z tohoto spojnicového grafu snadno zjistíme, že v případě datových bodů 4 a 8 máme naše odlehlé hodnoty. .

Nyní se podíváme, jak můžeme vyhladit čárový graf odstraněním odlehlých hodnot ze souboru dat.

V jiné buňce (v našem případě je to Buňka H6 ), napište následující vzorec,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Zde,

  • C6 = Buňka, která obsahuje první data v souboru dat
  • C5 = buňka nad první datovou buňkou
  • C7 = buňka pod první datovou buňkou
  • $E$6 = Rozdíl mezi datovými body.

Při pohledu na naše data se zdá, že když je datový bod rozdíl 10 jednotek od ostatních, je označen jako odlehlé hodnoty ...tak jsme dali 10 na adrese Buňka E6 a udělat z něj Absolutní odkaz na buňku aby se tato buňka při skenování a výpočtu celého souboru dat zafixovala.

Po stisknutí Vstupte na , můžete vidět, že první data se stále objevují v buňce výsledku. H6 Vše, co jste zde museli udělat, je pouze sestavit vzorec tak, abychom mohli přetáhnout položku Plnicí rukojeť použít vzorec na ostatní buňky.

Nyní přetáhněte řádek dolů pomocí Plnicí rukojeť a uvidíte, že buňky, ve kterých byly odlehlé hodnoty, jsou nyní zaplněny. #N/A .

A nyní se podívejte na čárový graf, který je nyní zploštělý a neobsahuje žádné odlehlé hodnoty.

Rozdělení vzorců

=IF(

Protože budeme porovnávat hodnoty, na jejichž základě získáme výsledek, zahájíme vzorec pomocí příkazu IF stav.

=IF(AND(

Budeme porovnávat aktuální datový bod a buňku nad ním a buňku pod ním. A pokud jsou obě porovnání pravdivá, teprve potom zobrazíme datový bod jako výsledek. Protože tedy potřebujeme řešit porovnání "Obě", měli bychom použít příkaz Funkce AND .

=IF(AND(ABS(

Při odečítání datových bodů mohou některá data vyhodit záporné hodnoty. A my se zápornými hodnotami nechceme zabývat, protože záporné hodnoty budou vždy v rozporu s podmínkou "odstranění dat, když je rozdíl 10". Abychom tedy měli jistotu, že budeme mít vždy kladné výsledky, musíme porovnávání zabalit do příkazu Funkce absolutní hodnoty .

=IF(AND(ABS(C6-C5)>$E$6

Zde jsme zahájili naše první porovnání. Jednoduše odečteme aktuální hodnotu s hodnotou výše a zjistíme, zda je výsledek větší než úroveň rozdílu uložená v položce Buňka E6 a udělal z buňky Absolutní reference aby byla hodnota buňky uzamčena.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)

Následuje druhá část porovnání, která je oddělena čárkou. Porovná se aktuální datový bod s dalším datovým bodem.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Nyní vložíme čárku a určíme, že vložíme Funkce NA v případě, že oba A funkce jsou pravdivé.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

A pokud A není pravdivá, pak chceme vrátit skutečný datový bod jako hodnotu IF Zadáme tedy čárku a předáme referenční číslo buňky. C6 v něm.

Přečtěte si více: Jak odstranit ověřování dat v aplikaci Excel (5 způsobů)

Podobná čtení

  • Jak odstranit záhlaví v aplikaci Excel (4 metody)
  • Odstranění tečkovaných čar v aplikaci Excel (5 rychlých způsobů)
  • Jak odstranit mřížku z aplikace Excel (6 snadných metod)
  • Odstranění okrajů v aplikaci Excel (4 rychlé způsoby)
  • Jak odstranit režim kompatibility v aplikaci Excel (2 snadné způsoby)

3. Ruční odstranění odlehlých hodnot v aplikaci Excel

Dalším snadným způsobem, jak v aplikaci Excel odstranit odlehlé hodnoty, je seřadit hodnoty datového souboru a ručně z něj odstranit horní a dolní hodnoty.

Třídění dat,

  • Vyberte datové sady.
  • Přejít na Třídit a filtrovat v Úpravy a vyberte buď Třídit od nejmenšího po největší nebo Třídit od největšího po nejmenší .

  • V našem případě jsme vybrali Třídit od nejmenšího po největší . Seřadil čísla v našem souboru dat vzestupně, přičemž nejmenší čísla byla umístěna na začátek a největší na konec.

Nyní stačí tato data ručně odstranit, aby se soubor dat zbavil odlehlých hodnot.

Tento postup nedoporučujeme používat při práci s velkým souborem dat. Pokud je váš soubor dat malý a přehlednější, teprve pak můžete tento postup použít, jinak jej nepoužívejte.

Přečtěte si více: Jak odstranit třídění v aplikaci Excel (3 snadné metody)

Závěr

Tento článek vám ukázal, jak odstranit odlehlé hodnoty v Excelu. Doufám, že pro vás byl tento článek velmi přínosný. Neváhejte se zeptat, pokud máte k tématu nějaké dotazy.

Hugh West je velmi zkušený školitel a analytik Excelu s více než 10 lety zkušeností v oboru. Má bakalářský titul v oboru Účetnictví a finance a magisterský titul v oboru Business Administration. Hugh má vášeň pro výuku a vyvinul jedinečný přístup k výuce, který lze snadno sledovat a pochopit. Jeho odborné znalosti Excelu pomohly tisícům studentů a profesionálů po celém světě zlepšit své dovednosti a vyniknout ve své kariéře. Prostřednictvím svého blogu Hugh sdílí své znalosti se světem a nabízí bezplatné výukové programy Excelu a online školení, které jednotlivcům a firmám pomohou dosáhnout jejich plného potenciálu.