Obsah
Na vykonanie štatistických výpočtov údajov zo súboru údajov môže byť potrebné identifikovať odľahlé hodnoty. Odľahlé hodnoty z obrovských súborov údajov môžete pomocou programu Microsoft Excel zistiť mnohými spôsobmi. V tomto príspevku vám ukážeme, ako vypočítať odľahlé hodnoty v programe Microsoft Excel pomocou piatich rôznych spôsobov.
Stiahnite si cvičebnicu
Bezplatný zošit programu Excel si môžete stiahnuť odtiaľto a precvičiť si ho sami.
Nájsť odľahlé hodnoty.xlsx5 praktických prístupov na výpočet odľahlých hodnôt v programe Excel
Outliers sú hodnoty údajov, ktoré sa výrazne odlišujú od ostatných hodnôt v súbore údajov. Odľahlé hodnoty sú inými slovami mimoriadne hodnoty. vysoká alebo nadmerne nízka v porovnaní s inými hodnotami v súbore údajov. Vyhľadávanie odľahlých hodnôt sú pri štatistických výpočtoch veľmi dôležité, pretože majú vplyv na výsledky našej analýzy údajov.
Máte napríklad súbor údajov, ktorý zobrazuje denný príjem dvanástich ľudí. Teraz potrebujete vypočítať odľahlé hodnoty pomocou programu Microsoft Excel. Tu vám ukážem päť jednoduchých prístupov, ako to urobiť.
1. Použitie triedenia & filtra na výpočet odľahlých hodnôt v programe Excel
Odľahlé hodnoty môžete vypočítať z malého súboru údajov pomocou Triedenie & amp; Filter príkaz v programe Excel. Ak chcete vypočítať odľahlé hodnoty pomocou funkcie triedenia a filtrovania, môžete to urobiť podľa nasledujúcich krokov.
Krok 1:
- Najprv vyberte záhlavie stĺpca v súbore údajov Excel, ktorý chcete zoradiť. Napríklad v danom súbore údajov v záhlaví stĺpca súboru s názvom Denný príjem (Cell C40 je zvolená).
Krok 2:
- Potom stlačte tlačidlo Domov na páse kariet a prejdite na kartu Úprava stránky skupina.
Krok 3:
- Potom v Skupina úprav kliknite na Triedenie & amp; Filter a kliknite na príkaz Vlastné Triediť .
Krok 4:
- Potom sa zobrazí nové dialógové okno s názvom Triediť V otvorenom dialógovom okne vyberte Denne Príjmy v Zoradiť podľa rozbaľovacie okno a Od najmenšieho po najväčší v rozbaľovacom zozname Objednávka. Potom kliknite na OK .
Krok 5:
- Nakoniec Denný príjem Stĺpec by bol zoradený uvedeným spôsobom, pričom najnižšie hodnoty by boli na vrchu a najväčšie hodnoty na spodku. Po spustení postupu vyhľadajte akékoľvek nepravidelnosti v rozsahu údajov, aby ste určili odľahlé hodnoty.
Napríklad prvé dve hodnoty v stĺpci sú výrazne nižšie a posledné dve hodnoty v stĺpci sú výrazne vyššie ako ostatné hodnoty v súbore údajov, ako je uvedené vo vyššie uvedenom výsledku.
Prečítajte si viac: Ako nájsť odľahlé hodnoty v regresnej analýze v programe Excel (3 jednoduché spôsoby)
2. Použitie funkcie QUARTILE na výpočet odľahlých hodnôt v programe Excel
Funkcia QUARTILE Prístup je vedeckejší spôsob výpočtu odľahlých hodnôt v programe Excel. Pomocou tejto funkcie môžete rozdeliť svoje súbory údajov na štyri rovnaké časti. Nasledujúce hodnoty vráti funkcia QUARTILE :
- Stránka minimálne hodnota.
- Stránka 1. kvartil (Q1 - najnižších 25 % daného súboru údajov).
- Stránka 2. kvartil (Q2 - najbližších 25 % súboru údajov).
- Stránka 3. kvartil (Q3 - druhých 25 % najvyššej hodnoty súboru údajov).
- Stránka maximum hodnota.
Syntax funkcia QUARTILE v programe Excel je:
=QUARTILE(array,quart)
Syntax obsahuje nasledujúce argumenty:
- a rray : rozsah buniek daného súboru údajov, pre ktorý sa vypočíta hodnota kvartilu.
- kvart: Určuje, ktorá hodnota sa má vrátiť.
Na výpočet odľahlých hodnôt pre uvedený súbor údajov pomocou funkciu QUARTILE, postupujte podľa nasledujúcich krokov.
Krok 1:
- Najprv zadajte nasledujúci vzorec na určenie 1. kvartil ( Q1 ) je uvedený nižšie.
= KVARTIL($C$5:$C$16,1)
Krok 2:
- Aj v tomto prípade sa vzorec na výpočet 3. kvartil ( Q3 ) je uvedený nižšie.
= KVARTIL($C$5:$C$16,3)
Krok 3:
- Po tretie, musíte určiť IQR, čo je Medzikvartilové rozpätie (predstavuje 50% daných údajov z rozsahu súboru údajov, ktoré patria do prvého a tretieho kvartilu) odčítaním Q1 (v bunke G4 ) od Q3 (v bunke G5 ). Na výpočet odčítania zadajte nasledujúci vzorec.
=G5-G4
Krok 4:
- Po nájdení IQR, ďalej musíte určiť horný a nižšie Pretože horný a nižšie hranica by obsahovala väčšinu údajov v rámci súboru údajov. Napíšte nasledujúci vzorec na výpočet hornej hranice.
=G5+(1,5*G6)
Krok 5:
- Potom si na výpočet dolnej hranice zapíšte nasledujúci vzorec.
=G4-(1,5*G6)
Krok 6:
- Nakoniec, po dokončení predchádzajúceho kroku, môžete určiť odľahlé hodnoty pre každú hodnotu údajov. Do pracovného hárka programu Excel zadajte nasledujúci vzorec s funkcia OR v bunke D5 .
=OR(C5$G$7)
- Tento vzorec pomôže identifikovať údaje, ktoré nespadajú do vyššie uvedenej hranice rozsahu. Po spracovaní vzorca sa zobrazí Vyhlásenie TRUE ak sú konkrétne údaje odľahlé a FALSE ak nie je. Dvakrát kliknite na stránku na Automatické vypĺňanie nástroj v bunke C5 na kopírovanie vzorec do ostatných buniek v stĺpec C Takto môžete pri všetkých odľahlých hodnotách v súbore údajov pozorovať hodnotu True.
3. Kombinácia funkcií AVERAGE a STDEV.P na výpočet odľahlých hodnôt z priemeru a štandardnej odchýlky
A štandardná odchýlka (alebo σ ) je metrika na určenie toho, ako sú údaje rozložené vzhľadom na strednú hodnotu celého súboru údajov. Údaje sú zoskupené okolo strednej hodnoty, keď je štandardná odchýlka nízka, zatiaľ čo údaje sú viac rozptýlené, keď je štandardná odchýlka vysoká. Na výpočet odľahlých hodnôt pomocou Priemer a Štandardná odchýlka môžete postupovať podľa nasledujúcich krokov.
Krok 1:
- Najprv použite rovnaký súbor údajov, ktorý je uvedený na začiatku tohto článku, a potom vypočítajte priemer a štandardnú odchýlku. Ak chcete vypočítať priemer, zadajte nasledujúci vzorec s funkcia AVERAGE v bunke G5 .
=PRIEMER(C5:C16)
Krok 2:
- Ak chcete vypočítať štandardnú odchýlku, vložte nasledujúci vzorec s funkcia STDEV.P v bunke G6 .
=STDEV.P(C5:C16)
Krok 3:
- Ďalej vypočítate hornú hranicu pre ďalší postup v procese. V bunke G7 , vypočítajte dolnú hranicu podľa nasledujúceho vzorca.
=G5-(1,25*G6)
Krok 4:
- A v bunke G8 vypočítajte hornú hranicu z tohto vzorca
=G5+(1,5*G6)
Krok 5:
- Potom, ak chcete vypočítať, či existujú nejaké odľahlé hodnoty, alebo nie, zadajte do bunky nasledujúci vzorec D5 .
=OR(C5$G$8)
- Vzorec teda vráti hodnotu TRUE hodnota, ak sú konkrétne údaje v požadovanej bunke odľahlé a FALSE.
- Dvakrát kliknite na stránku na Automatické vypĺňanie nástroj v bunke D5 skopírovať vzorec do ostatných buniek v stĺpec D Takto môžete zistiť všetky zostávajúce odľahlé hodnoty v súbore údajov.
Prečítajte si viac: Ako nájsť odľahlé hodnoty pomocou štandardnej odchýlky v programe Excel (s rýchlymi krokmi)
4. Vloženie Z-skóre na výpočet odľahlých hodnôt v programe Excel
Stránka Z-skóre je jednou z najčastejšie používaných metrík na identifikáciu odľahlých hodnôt. Táto metóda ukazuje, ako ďaleko je konkrétny údaj od priemeru súboru údajov vzhľadom na jeho štandardnú odchýlku. Na výpočet odľahlých hodnôt pomocou Z-skóre v programe Excel si môžete pozrieť kroky opísané nižšie.
Krok 1:
- Najskôr zoberte požadovaný súbor údajov.
Krok 2:
- Po druhé, v bunke H5, zadajte nasledujúci vzorec pre výpočet priemer pre dané údaje.
=PRIEMER(C5:C16)
Krok 3:
- Po tretie, vypočítajte štandardná odchýlka daného súboru údajov v bunke H6 pomocou nasledujúceho vzorca.
=STDEV.P(C5:C16)
Krok 4:
- Potom musíte určiť Z -skóre pre každú hodnotu údajov. Na tento účel použite vzorec uvedený nižšie.
=(C5-$H$5)/$H$6
Krok 5:
- Po výpočte všetkých Hodnoty Z, uvidíte, že rozsah Hodnoty Z je medzi -1.44 a 13 Uvažujeme teda o hodnotách Z-skóre menej ako -1,2 alebo viac ako +1.8 pre limity odľahlých hodnôt.
- Potom do bunky zadajte nasledujúci vzorec E 5 .
=OR((D51.8))
- Nakoniec vzorec vráti TRUE hodnotu, ak sú konkrétne údaje odľahlé, a vráti FALSE
- Dvakrát kliknite na stránku na bunke E5 používať Automatické vypĺňanie nástroj vyplniť rukoväť na skopírovanie vzorca do ostatných buniek v stĺpec E . Takto môžete nájsť všetky zostávajúce odľahlé hodnoty v súbore údajov.
Prečítajte si viac: Ako nájsť odľahlé hodnoty pomocou skóre Z v programe Excel (s rýchlymi krokmi)
5. Zlúčenie funkcií LARGE a SMALL na vyhľadávanie odľahlých hodnôt v programe Excel
Funkcia LARGE a funkcia SMALL v programe Excel majú opačné operácie. Použijeme ju na nájdenie najväčšieho, resp. najmenšieho údaju alebo hodnoty v súbore údajov. Táto funkcia vytiahne všetky údaje v rámci súboru údajov a nájde najmenšie a najväčšie číslo. Dokáže nájsť druhé najmenšie alebo najväčšie, tretie najväčšie alebo najmenšie atď.
Krok 1:
- Najprv použite nasledujúci vzorec v bunke E5 s funkcia LARGE .
=LARGE($C$5:$C$16,1)
- Teda od 12 hodnoty, môžete vidieť 1. najväčšiu hodnotu, ktorá je 780 .
Krok 2:
- Potom v bunke G5 , zapíšte nasledujúci vzorec na nájdenie najmenšej hodnoty.
=SMALL($C$5:$C$16,1)
- Nakoniec od 12 hodnoty, môžete vidieť 1. najmenšia hodnota 110 .
- Po zistení všetkých požadovaných hodnôt môžete ľahko poukázať na všetky odľahlé hodnoty v súbore údajov.
Záver
To je koniec tohto článku. Dúfam, že vám tento článok pomohol. Po prečítaní tohto článku budete schopní vypočítať odľahlé hodnoty v programe Excel pomocou niektorej z metód. Podeľte sa s nami o ďalšie otázky alebo odporúčania v sekcii komentárov nižšie.