Kako izračunati outliere u Excelu (5 jednostavnih načina)

  • Podijeli Ovo
Hugh West

Možda će biti potrebno identificirati izvanredne vrijednosti kako bi se izvršili statistički izračuni podataka iz skupa podataka. Pomoću programa Microsoft Excel možete otkriti odstupanja iz ogromnih skupova podataka na brojne načine. U ovom postu ćemo vam pokazati kako izračunati outliere u programu Microsoft Excel na pet različitih načina.

Preuzmite radnu bilježnicu za vježbe

Ovdje možete preuzeti besplatnu radnu bilježnicu programa Excel i vježbati sami .

Pronađi Outliers.xlsx

5 praktičnih pristupa za izračunavanje outliera u Excelu

Outliers su vrijednosti podataka koje se značajno razlikuju od ostalih vrijednosti podataka u skupu podataka. Drugim riječima, izvanredne vrijednosti su izvanredne vrijednosti. One su ili iznimno visoke ili pretjerano niske u usporedbi s drugim vrijednostima u skupu podataka. Pronalaženje outliera je vitalno u statističkim izračunima budući da oni utječu na nalaze naše analize podataka.

Na primjer, imate skup podataka koji prikazuje dnevni prihod dvanaest ljudi. Sada trebate izračunati outliere koristeći Microsoft Excel. Ovdje ću vam pokazati pet jednostavnih pristupa za to.

1. Koristite Sort & Filter za izračun odstupanja u programu Excel

Možete izračunati odstupanja iz malog skupa podataka korištenjem opcije Sortiraj & Naredba Filter u Excelu. Ako želite izračunati outliere pomoću funkcije sortiranja i filtriranja, to možete učiniti slijedećikorake u nastavku.

1. korak:

  • Prvo odaberite zaglavlje stupca u svom skupu podataka programa Excel koji želite sortirati. Na primjer, u zadanom skupu podataka, u zaglavlju stupca datoteke pod nazivom Dnevni prihod (odabrana je ćelija C40 ).

Korak 2:

  • Zatim pritisnite Home na vrpci i idite na grupu Uređivanje .

3. korak:

  • Nakon toga, u grupi za uređivanje kliknite na Sortiraj & Filter naredba i kliknite na Custom Sort .

Korak 4:

  • Tada će se otvoriti novi dijaloški okvir pod nazivom Sortiraj . U dijaloškom okviru koji se pojavi, odaberite Dnevni Prihod u Poredaj po padajući izbornik i Od najmanjeg do najvećeg u padajućem izborniku Redoslijed. Nakon toga kliknite OK .

Korak 5:

  • Konačno, stupac Dnevni prihod bio bi sortiran na navedeni način, s najnižim vrijednostima na vrhu i najvećim vrijednostima na dnu. Nakon pokretanja postupka potražite bilo kakve nepravilnosti u rasponu podataka kako biste odredili odstupanja.

Na primjer, prve dvije vrijednosti u stupcu značajno su niže, a posljednje dvije vrijednosti u stupcu znatno su veće od ostalih vrijednosti u skupu podataka, kao što je prikazano uiznad rezultata.

Pročitajte više: Kako pronaći outliere u regresijskoj analizi u Excelu (3 jednostavna načina)

2. Primijenite funkciju QUARTILE na Izračunajte outliere u Excelu

Pristup QUARTILE funkcije je znanstveniji način izračunavanja outliera u Excelu. Ovu funkciju možete koristiti za dijeljenje skupova podataka na četiri jednaka dijela. Funkcija QUARTILE vratit će sljedeće vrijednosti:

  • minimalna vrijednost.
  • 1. kvartil (Q1- najnižih 25% danog skupa podataka).
  • 2. kvartil (Q2-sljedeći najnižih 25% skupa podataka).
  • 3. kvartil (Q3- drugih najviših 25% skupa podataka).
  • maksimalna vrijednost.

Sintaksa funkcije QUARTILE u Excelu je:

=QUARTILE( array,quart)

Sintaksa sadrži sljedeće argumente:

  • a niz : raspon ćelija danog skup podataka za koji ćete izračunati vrijednost kvartila.
  • kvart: Ovo određuje koja vrijednost treba biti vraćena.

Za izračunavanje outliera za gornji skup podataka pomoću funkcije QUARTILE, slijedite korake u nastavku.

Korak 1:

  • Prvo, upišite sljedeću formulu za određivanje 1. kvartila ( Q1 ) koja je dana u nastavku.
=QUARTILE($C$5:$C$16,1)

2. korak:

  • Ovdjeopet, formula za izračunavanje 3. kvartila ( Q3 ) je dana u nastavku.
=QUARTILE($C$5:$C$16,3)

Korak 3:

  • Treće, morate odrediti IQR, koji je Međukvartilni raspon (predstavlja 50% danih podataka iz niza skupa podataka koji spadaju u prvi i treći kvartil) oduzimanjem Q1 (u ćeliji G4 ) od Q3 (u ćeliji G5 ). Upišite sljedeću formulu za izračun oduzimanja.

    =G5-G4

Korak 4:

  • Nakon pronalaženja IQR, sljedeće morate odrediti gornji i donja Jer bi gornja i donja granica sadržavala većinu podataka unutar skup podataka. Zapišite sljedeću formulu za izračun gornje granice.

    =G5+(1.5*G6)

Korak 5:

  • Zatim, za izračun donje granice, zapišite sljedeću formulu.
=G4-(1.5*G6)

Korak 6:

  • Konačno, nakon završetka prethodnog koraka, možete odrediti outliere za svaki podatak vrijednost. U radni list programa Excel upišite sljedeću formulu pomoću funkcije OR u ćeliju D5 .
=OR(C5$G$7)

  • Ova formula pomoći će identificirati podatke koji ne spadaju unutar gore navedenog ograničenja raspona. Nakon obradeformula će prikazati ISTINITU izjavu ako je određeni podatak izvanredan i NETOČNO ako nije. Dvaput kliknite na alat Automatsko popunjavanje u ćeliji C5 za kopiranje formule u ostale ćelije u stupcu C . Stoga možete promatrati True vrijednost pored svih outliera u vašem skupu podataka.

3. Kombinirajte funkcije AVERAGE i STDEV.P za izračun outliera iz srednje vrijednosti i standardne devijacije

A standardna devijacija (ili σ ) je metrika za određivanje koliko su podaci raspoređeni u odnosu na srednju vrijednost cijelog skupa podataka. Podaci su grupirani oko srednje vrijednosti kada je standardna devijacija niska, dok su podaci šire kada je standardna devijacija visoka. Za izračun odstupanja koristeći srednju vrijednost i standardnu ​​devijaciju možete slijediti sljedeće korake.

1. korak:

  • Prvo upotrijebite isti skup podataka prikazan na početku ovog članka, a zatim izračunajte srednju vrijednost i standardnu ​​devijaciju. Da biste izračunali srednju vrijednost, upišite sljedeću formulu s funkcijom AVERAGE u ćeliju G5 .
=AVERAGE(C5:C16)

Korak 2:

  • Da biste izračunali standardnu ​​devijaciju, umetnite sljedeću formulu sa STDEV .P funkcija u ćeliji G6 .
=STDEV.P(C5:C16)

3. korak:

  • Sljedeće ćete izračunatigornja granica za daljnji napredak u procesu. U ćeliji G7 izračunajte donju granicu pomoću sljedeće formule.
=G5-(1.25*G6)

Korak 4:

  • I u ćeliji G8 izračunajte gornju granicu iz sljedeće formule
=G5+(1.5*G6)

Korak 5:

  • Nakon toga , da biste izračunali postoji li odstupanje ili ne, upišite sljedeću formulu u ćeliju D5 .
=OR(C5$G$8)

  • Stoga će formula vratiti TRUE vrijednost ako su određeni podaci u željenoj ćeliji izvanredni podaci i NETOČNO.
  • Dvaput kliknite na alat Automatsko popunjavanje u ćeliji D5 za kopiranje formule u ostale ćelije u stupcu D . Stoga možete saznati sve preostale odstupanja u svom skupu podataka.

Pročitajte više: Kako pronaći odstupanja sa standardnim odstupanjem u Excelu (uz brze korake)

4. Umetnite Z-ocjenu za izračun odstupanja u Excelu

Z-ocjena jedna je od najčešće korištenih metrika za identificiranje izvanrednih vrijednosti. Ova metoda pokazuje koliko je određeni podatak udaljen od srednje vrijednosti skupa podataka u odnosu na njegovu standardnu ​​devijaciju. Za izračunavanje outliera koristeći Z-rezultat u Excelu možete vidjeti korake opisane u nastavku.

Korak 1:

  • Prvo uzmite željeni skup podataka.

Korak2:

  • Drugo, u ćeliju H5, upišite sljedeću formulu za izračunavanje srednje vrijednosti za dane podatke.
=AVERAGE(C5:C16)

Korak 3:

  • Treće, izračunajte standardnu ​​devijaciju zadanog skupa podataka u ćeliji H6 pomoću sljedeće formule.
=STDEV.P(C5:C16)

4. korak:

  • Nakon toga , morate odrediti Z -rezultat za svaku vrijednost podataka. Da biste to učinili, koristite donju formulu.
=(C5-$H$5)/$H$6

Korak 5:

  • Nakon izračuna svih Z-vrijednosti, vidjet ćete da je raspon Z-vrijednosti je između -1,44 i 13 . Dakle, smatramo da su vrijednosti Z-rezultata manje od -1,2 ili više od +1,8 za vanjske granice.
  • Zatim upišite sljedeću formulu u ćeliju E 5 .
=OR((D51.8))

  • Konačno, formula će vratiti TRUE vrijednost ako je određeni podatak izuzetak i vratit će FALSE
  • Dvaput kliknite na ćeliju E5 za korištenje Automatsko popunjavanje ručica za popunjavanje alata za kopiranje formule u ostatak ćelija u stupcu E . Dakle, možete pronaći sve preostale ekstremne vrijednosti u svom skupu podataka.

Pročitajte više: Kako pronaći outliere pomoću Z rezultata u Excelu (uz QuickKoraci)

5. Spojite LARGE i SMALL funkcije za pronalaženje odstupanja u Excelu

LARGE funkcija i SMALL funkcija u Excelu imaju suprotne operacije. Koristit ćemo ga za pronalaženje najvećih i najmanjih podataka ili vrijednosti u skupu podataka. Ova funkcija će povući sve podatke unutar skupa podataka, pronalazeći najmanji i najveći broj. Oni mogu pronaći drugi najmanji ili najveći, treći najveći ili najmanji i tako dalje.

1. korak:

  • Prvo upotrijebite sljedeću formulu u ćeliji E5 s funkcijom LARGE .
=LARGE($C$5:$C$16,1)

    • Dakle, od 12 vrijednosti, možete vidjeti prvu najveću vrijednost koja je 780 .

2. korak:

  • Nakon toga, u ćeliju G5 zapišite sljedeću formulu kako biste pronašli najmanju vrijednost.
=SMALL($C$5:$C$16,1)

  • Konačno, od 12 vrijednosti, možete vidjeti 1. najmanja vrijednost 110 .
  • Nakon što pronađete sve tražene vrijednosti, lako možete ukazati na sve odstupanja u skupu podataka.

Zaključak

To je kraj ovog članka. Nadam se da će vam ovaj članak biti od pomoći. Nakon čitanja ovog članka, moći ćete izračunati outliere u Excelu koristeći bilo koju od metoda. Podijelite sve daljnje upite ili preporuke su odjeljku za komentare ispod.

Hugh West vrlo je iskusan Excel trener i analitičar s više od 10 godina iskustva u industriji. Diplomirao je računovodstvo i financije te magistrirao poslovno upravljanje. Hugh ima strast za podučavanjem i razvio je jedinstveni pristup podučavanju koji je lako pratiti i razumjeti. Njegovo stručno poznavanje programa Excel pomoglo je tisućama studenata i profesionalaca diljem svijeta da poboljšaju svoje vještine i postignu uspjeh u karijeri. Putem svog bloga, Hugh dijeli svoje znanje sa svijetom, nudeći besplatne vodiče za Excel i online obuku kako bi pomogao pojedincima i tvrtkama da dostignu svoj puni potencijal.