Jak vypočítat odlehlé hodnoty v aplikaci Excel (5 snadných způsobů)

  • Sdílet Toto
Hugh West

K provedení statistických výpočtů na datech ze souboru dat může být nutné identifikovat odlehlé hodnoty. Odlehlé hodnoty z obrovských souborů dat můžete pomocí aplikace Microsoft Excel zjistit mnoha způsoby. V tomto příspěvku vám ukážeme, jak vypočítat odlehlé hodnoty v aplikaci Microsoft Excel pomocí pěti různých způsobů.

Stáhnout cvičebnici

Bezplatný sešit Excelu si můžete stáhnout zde a procvičit se sami.

Najít odlehlé hodnoty.xlsx

5 praktických přístupů k výpočtu odlehlých hodnot v aplikaci Excel

Outliers jsou hodnoty dat, které se výrazně liší od ostatních hodnot v souboru dat. Jinými slovy, odlehlé hodnoty jsou mimořádné hodnoty. Jsou to buď výjimečné hodnoty, které se liší od ostatních hodnot v souboru dat. vysoká nebo nadměrně nízká ve srovnání s ostatními hodnotami v souboru dat. Vyhledávání odlehlých hodnot je při statistických výpočtech zásadní, protože má vliv na výsledky naší analýzy dat.

Máte například soubor dat, který ukazuje denní příjem dvanácti lidí. Nyní potřebujete vypočítat odlehlé hodnoty pomocí aplikace Microsoft Excel. Zde vám ukážu pět snadných přístupů, jak na to.

1. Použití třídění & filtru pro výpočet odlehlých hodnot v aplikaci Excel

Odlehlé hodnoty můžete vypočítat z malého souboru dat pomocí příkazu Třídit a filtrovat Pokud chcete vypočítat odlehlé hodnoty pomocí funkce třídění a filtrování, můžete to provést podle níže uvedeného postupu.

Krok 1:

  • Nejprve vyberte záhlaví sloupce v souboru dat v aplikaci Excel, který chcete seřadit. Například v daném souboru dat je v záhlaví sloupce souboru s názvem Denní příjem (Cell C40 je vybrána).

Krok 2:

  • Pak stiskněte tlačítko Home na pásu karet a přejděte na kartu Úpravy skupina.

Krok 3:

  • Poté v Skupina úprav klikněte na Třídit a filtrovat a klikněte na příkaz Vlastní Třídit .

Krok 4:

  • Poté se zobrazí nové dialogové okno s názvem Třídit V zobrazeném dialogovém okně vyberte možnost Denně Příjmy v Seřadit podle rozevírací seznam a Od nejmenšího po největší v rozevíracím seznamu Order. Poté klikněte na tlačítko OK .

Krok 5:

  • Nakonec Denní příjem Sloupec by byl seřazen uvedeným způsobem, přičemž nejnižší hodnoty by byly nahoře a největší hodnoty dole. Po spuštění postupu vyhledejte případné nepravidelnosti v rozsahu dat, abyste určili odlehlé hodnoty.

Například první dvě hodnoty ve sloupci jsou výrazně nižší a poslední dvě hodnoty ve sloupci jsou výrazně vyšší než ostatní hodnoty v souboru dat, jak ukazuje výše uvedený výsledek.

Přečtěte si více: Jak najít odlehlé hodnoty v regresní analýze v aplikaci Excel (3 snadné způsoby)

2. Použití funkce QUARTILE pro výpočet odlehlých hodnot v aplikaci Excel

Funkce QUARTILE Přístup je vědeckým způsobem výpočtu odlehlých hodnot v aplikaci Excel. Pomocí této funkce můžete rozdělit soubor dat na čtyři stejné části. Následující hodnoty vrátí funkce funkce QUARTILE :

  • Na stránkách minimum hodnotu.
  • Na stránkách 1. kvartil (Q1 - nejnižších 25 % daného souboru dat).
  • Na stránkách 2. kvartil (Q2 - nejnižších 25 % souboru dat).
  • Na stránkách 3. kvartilu (Q3 - druhých 25 % souboru dat).
  • Na stránkách maximum hodnotu.

Syntaxe funkce QUARTILE v aplikaci Excel je:

=QUARTILE(array,quart)

Syntaxe obsahuje následující argumenty:

  • a rray : rozsah buněk daného souboru dat, pro který se vypočítá hodnota kvartilu.
  • kvart: Určuje, která hodnota má být vrácena.

Pro výpočet odlehlých hodnot pro výše uvedený soubor dat pomocí funkce QUARTILE, postupujte podle následujících kroků.

Krok 1:

  • Nejprve zadejte následující vzorec pro stanovení 1. kvartil ( Q1 ) je uveden níže.
=KVARTIL($C$5:$C$16,1)

Krok 2:

  • I v tomto případě platí vzorec pro výpočet 3. kvartil ( Q3 ) je uveden níže.
=KVARTIL($C$5:$C$16,3)

Krok 3:

  • Za třetí, musíte určit IQR, což je Mezikvartilové rozpětí (představuje 50% daných dat z rozsahu souboru dat, která spadají do prvního a třetího kvartilu) odečtením. Q1 (v buňce G4 ) od Q3 (v buňce G5 ). Pro výpočet odečtu zadejte následující vzorec.

    =G5-G4

Krok 4:

  • Po nalezení IQR, dále je třeba určit horní a nižší Protože horní a nižší hranice by obsahovala většinu údajů v souboru dat. Zapište následující vzorec pro výpočet horní hranice.

    =G5+(1,5*G6)

Krok 5:

  • Pro výpočet dolní meze pak zapište následující vzorec.
=G4-(1,5*G6)

Krok 6:

  • Nakonec, po dokončení předchozího kroku, můžete určit odlehlé hodnoty pro každou hodnotu dat. Do pracovního listu Excelu zadejte následující vzorec s tím, že funkce OR v buňce D5 .
=OR(C5$G$7)

  • Tento vzorec pomůže identifikovat data, která nespadají do výše uvedeného limitu rozsahu. Po zpracování vzorce se zobrazí vzorec Prohlášení TRUE pokud jsou konkrétní data odlehlá a FALSE pokud tomu tak není. Dvakrát klikněte na adresu na Automatické vyplňování nástroj v buňce C5 ke kopírování vzorec do ostatních buněk v sloupec C . U všech odlehlých hodnot v souboru dat tak můžete pozorovat hodnotu True.

3. Kombinace funkcí AVERAGE a STDEV.P pro výpočet odlehlých hodnot z průměru a směrodatné odchylky

A směrodatná odchylka (nebo σ ) je metrika, která určuje, jak jsou data rozložena vzhledem ke střední hodnotě celého souboru dat. Data jsou seskupena kolem střední hodnoty, pokud je směrodatná odchylka nízká, zatímco data jsou více rozptýlena, pokud je směrodatná odchylka vysoká. Pro výpočet odlehlých hodnot pomocí Průměr a Směrodatná odchylka můžete postupovat podle následujících kroků.

Krok 1:

  • Nejprve použijte stejný soubor dat, který je uveden na začátku tohoto článku, a poté vypočítejte průměr a směrodatnou odchylku. Chcete-li vypočítat průměr, zadejte následující vzorec, do kterého napište funkce AVERAGE v buňce G5 .
=PRŮMĚR(C5:C16)

Krok 2:

  • Chcete-li vypočítat směrodatnou odchylku, dosaďte následující vzorec s funkce STDEV.P v buňce G6 .
=STDEV.P(C5:C16)

Krok 3:

  • Dále vypočtete horní hranici pro další postup v procesu. V buňce G7 , vypočtěte dolní mez podle následujícího vzorce.
=G5-(1,25*G6)

Krok 4:

  • A v buňce G8 vypočítat horní mez z následujícího vzorce
=G5+(1,5*G6)

Krok 5:

  • Poté pro výpočet, zda existují nějaké odlehlé hodnoty, zadejte do buňky následující vzorec D5 .
=OR(C5$G$8)

  • Vzorec tedy vrátí hodnotu TRUE hodnota, pokud jsou konkrétní data v požadované buňce odlehlá a FALEŠNÉ.
  • Dvakrát klikněte na adresu na Automatické vyplňování nástroj v buňce D5 zkopírovat vzorec do ostatních buněk v poli sloupec D . Takto můžete zjistit všechny zbývající odlehlé hodnoty v souboru dat.

Přečtěte si více: Jak najít odlehlé hodnoty pomocí směrodatné odchylky v aplikaci Excel (v rychlých krocích)

4. Vložení Z-skóre pro výpočet odlehlých hodnot v aplikaci Excel

Na stránkách Z-skóre je jednou z nejčastěji používaných metrik pro identifikaci odlehlých hodnot. Tato metoda ukazuje, jak daleko je konkrétní údaj od průměru souboru dat vzhledem k jeho směrodatné odchylce. Pro výpočet odlehlých hodnot pomocí Z-skóre v aplikaci Excel si můžete prohlédnout níže popsané kroky.

Krok 1:

  • Nejdříve vezměte požadovaný soubor dat.

Krok 2:

  • Za druhé, v buňce H5, zadejte následující vzorec pro výpočet průměr pro zadaná data.
=PRŮMĚR(C5:C16)

Krok 3:

  • Za třetí, vypočítejte směrodatná odchylka daného souboru dat v buňce H6 podle následujícího vzorce.
=STDEV.P(C5:C16)

Krok 4:

  • Poté musíte určit Z -skóre pro každou datovou hodnotu. K tomu slouží vzorec uvedený níže.
=(C5-$H$5)/$H$6

Krok 5:

  • Po výpočtu všech Hodnoty Z, uvidíte, že rozsah Hodnoty Z je mezi -1.44 a 13 Uvažujeme tedy hodnoty Z-skóre méně než -1,2 nebo více než +1.8 pro limity odlehlých hodnot.
  • Pak do buňky zadejte následující vzorec E 5 .
=OR((D51.8))

  • Nakonec vzorec vrátí TRUE hodnotu, pokud jsou konkrétní data odlehlá, a vrátí hodnotu FALSE
  • Dvakrát klikněte na adresu na buňce E5 používat Automatické vyplňování zkopírujte vzorec do ostatních buněk v poli sloupec E . Takto můžete najít všechny zbývající odlehlé hodnoty v souboru dat.

Přečtěte si více: Jak najít odlehlé hodnoty pomocí Z skóre v aplikaci Excel (v rychlých krocích)

5. Sloučení funkcí LARGE a SMALL pro vyhledání odlehlých hodnot v aplikaci Excel

Funkce LARGE a funkce SMALL v Excelu mají opačné operace. Použijeme je k nalezení největšího, respektive nejmenšího údaje nebo hodnoty v souboru dat. Tato funkce vytáhne všechny údaje v souboru dat a najde nejmenší a největší číslo. Umí najít druhé nejmenší nebo největší, třetí největší nebo nejmenší atd.

Krok 1:

  • Nejprve použijte následující vzorec v buňce E5 s funkce LARGE .
=LARGE($C$5:$C$16,1)

    • Tedy od 12 hodnoty, můžete vidět 1. největší hodnotu, která je 780 .

Krok 2:

  • Poté v buňce G5 , zapište následující vzorec pro nalezení nejmenší hodnoty.
=SMALL($C$5:$C$16,1)

  • A konečně, z 12 hodnoty, můžete si prohlédnout 1. nejmenší hodnota 110 .
  • Jakmile zjistíte všechny požadované hodnoty, můžete snadno poukázat na případné odlehlé hodnoty v souboru dat.

Závěr

To je konec tohoto článku. Doufám, že vám tento článek pomohl. Po přečtení tohoto článku budete schopni vypočítat odlehlé hodnoty v aplikaci Excel pomocí některé z metod. O další dotazy nebo doporučení se s námi podělte v komentářích níže.

Hugh West je velmi zkušený školitel a analytik Excelu s více než 10 lety zkušeností v oboru. Má bakalářský titul v oboru Účetnictví a finance a magisterský titul v oboru Business Administration. Hugh má vášeň pro výuku a vyvinul jedinečný přístup k výuce, který lze snadno sledovat a pochopit. Jeho odborné znalosti Excelu pomohly tisícům studentů a profesionálů po celém světě zlepšit své dovednosti a vyniknout ve své kariéře. Prostřednictvím svého blogu Hugh sdílí své znalosti se světem a nabízí bezplatné výukové programy Excelu a online školení, které jednotlivcům a firmám pomohou dosáhnout jejich plného potenciálu.