Kako izračunati outliers u Excelu (5 jednostavnih načina)

  • Podijeli Ovo
Hugh West

Možda će biti potrebno identificirati izvanredne vrijednosti kako bi se izvršila statistička izračunavanja podataka iz skupa podataka. Možete otkriti izvanredne vrijednosti iz ogromnih skupova podataka koristeći Microsoft Excel na brojne načine. U ovom postu ćemo vam pokazati kako izračunati vanredne vrijednosti u Microsoft Excelu na pet različitih načina.

Preuzmite radnu svesku za vježbu

Možete preuzeti besplatnu Excel radnu svesku odavde i vježbati sami .

Pronađi Outliers.xlsx

5 praktičnih pristupa za izračunavanje odstupanja u Excelu

Outliers su vrijednosti podataka koje se značajno razlikuju od ostalih vrijednosti podataka u skupu podataka. Drugim riječima, izvanredne vrijednosti su izvanredne vrijednosti. One su ili izuzetno visoke ili pretjerano niske u poređenju s drugim vrijednostima u skupu podataka. Pronalaženje outliera je od vitalnog značaja u statističkim proračunima jer oni utiču na nalaze naše analize podataka.

Na primjer, imate skup podataka koji prikazuje dnevni prihod dvanaest ljudi. Sada morate izračunati odstupnike koristeći Microsoft Excel. Ovdje ću vam pokazati pet jednostavnih pristupa za to.

1. Koristite Sort & Filter za izračunavanje odstupanja u Excelu

Možete izračunati odstupanja iz malog skupa podataka korištenjem Sort & Naredba Filter u Excelu. Ako želite da izračunate vanjske vrijednosti pomoću funkcije sortiranja i filtriranja, to možete učiniti slijedećikoraci u nastavku.

Korak 1:

  • Prvo, odaberite zaglavlje kolone u vašem skupu podataka Excela koje želite sortirati. Na primjer, u datom skupu podataka, u zaglavlju stupca datoteke pod nazivom Dnevni prihod (odabrana je ćelija C40 ).

Korak 2:

  • Zatim pritisnite Početna karticu na traci i idite na grupu Uređivanje .

Korak 3:

  • Nakon toga, u grupi Uređivanje kliknite na Sort & Filtriraj naredbu i kliknite na Prilagođeno Sort .

Korak 4:

  • Tada će se otvoriti novi dijaloški okvir pod nazivom Sort . U iskačućem dijaloškom okviru odaberite Dnevno Prihod u Sortiraj po padajući izbornik i Najmanji do najveći u padajućem izborniku Red. Nakon toga kliknite OK .

Korak 5:

  • Konačno, kolona Dnevni prihod bila bi sortirana na navedeni način, sa najnižim vrijednostima na vrhu i najvećim vrijednostima na dnu. Nakon pokretanja procedure, potražite bilo kakve nepravilnosti u rasponu podataka da biste odredili vanjske vrijednosti.

Na primjer, prve dvije vrijednosti u koloni su znatno niže i posljednje dvije vrijednosti u koloni su znatno veće od ostalih vrijednosti u skupu podataka, kao što je prikazano uiznad rezultata.

Pročitajte više: Kako pronaći outliers u regresijskoj analizi u Excelu (3 jednostavna načina)

2. Primijenite funkciju QUARTILE na Izračunavanje odstupanja u Excelu

Pristup funkcije QUARTILE je naučniji način izračunavanja odstupanja u Excelu. Ovu funkciju možete koristiti da podijelite svoje skupove podataka na četiri jednaka dijela. funkcija QUARTILE će vratiti sljedeće vrijednosti:

  • Minimalna minimalna vrijednost.
  • 1. kvartil (Q1- najnižih 25% datog skupa podataka).
  • 2. kvartil (Q2-sljedeći najnižih 25% skupa podataka).
  • 3. kvartil (Q3- drugi najviših 25% skupa podataka).
  • maksimalna vrijednost.

Sintaksa funkcije QUARTILE u Excelu je:

=QUARTILE( array,quart)

Sintaksa sadrži sljedeće argumente:

  • a rray : opseg ćelija datog skup podataka za koji ćete izračunati kvartilnu vrijednost.
  • kvart: Ovo određuje koja vrijednost treba biti vraćena.

Za izračunavanje odstupanja za gornji skup podataka koristeći funkciju QUARTILE, slijedite dolje navedene korake.

Korak 1:

  • Prvo, upišite sljedeću formulu za određivanje 1. kvartila ( Q1 ) koji je dat ispod.
=QUARTILE($C$5:$C$16,1)

Korak 2:

  • Ovdjeopet, formula za izračunavanje 3. kvartila ( Q3 ) je data ispod.
=QUARTILE($C$5:$C$16,3)

Korak 3:

  • Treće, morate odrediti IQR, koji je Inter-kvartilni raspon (predstavlja 50% datih podataka iz raspona skupa podataka koji spadaju u prvi i treći kvartil) oduzimanjem Q1 (u ćeliji G4 ) od Q3 (u ćeliji G5 ). Unesite sljedeću formulu da izračunate oduzimanje.

    =G5-G4

Korak 4:

  • Nakon pronalaska IQR, sljedeće morate odrediti gornji i donja Zato što bi gornja i donja granica sadržavala većinu podataka unutar skup podataka. Zapišite sljedeću formulu da izračunate gornju granicu.

    =G5+(1.5*G6)

Korak 5:

  • Zatim, da biste izračunali donju granicu, zapišite sljedeću formulu.
=G4-(1.5*G6)

Korak 6:

  • Konačno, nakon završetka prethodnog koraka, možete odrediti outliers za svaki podatak vrijednost. U Excel radni list upišite sljedeću formulu sa funkcija ILI u ćeliju D5 .
=OR(C5$G$7)

  • Ova formula će pomoći da se identifikuju podaci koji ne spadaju u gore navedeno ograničenje raspona. Nakon obradeformula će pokazati TRUE naredbu ako su specifični podaci izvan vrijednosti i FALSE ako nisu. Dvaput kliknite na alatku Automatsko popunjavanje u ćeliji C5 da kopirate formulu u ostale ćelije u koloni C . Dakle, možete uočiti True vrijednost pored svih outliers u vašem skupu podataka.

3. Kombinirajte AVERAGE i STDEV.P funkcije za izračunavanje odstupanja od srednje vrijednosti i standardne devijacije

A standardna devijacija (ili σ ) je metrika za određivanje koliko su podaci raspoređeni u odnosu na srednju vrijednost cijelog skupa podataka. Podaci se grupišu oko srednje vrijednosti kada je standardna devijacija niska, dok su podaci više rasprostranjeni kada je standardna devijacija visoka. Za izračunavanje odstupanja koristeći srednju vrijednost i standardnu ​​devijaciju možete slijediti sljedeće korake.

Korak 1:

  • Prvo, koristite isti skup podataka prikazan na početku ovog članka, a zatim izračunajte srednju vrijednost i standardnu ​​devijaciju. Da biste izračunali srednju vrijednost, upišite sljedeću formulu sa prosjek funkcije u ćeliju G5 .
=AVERAGE(C5:C16)

Korak 2:

  • Da biste izračunali standardnu ​​devijaciju, umetnite sljedeću formulu sa STDEV .P funkcija u ćeliji G6 .
=STDEV.P(C5:C16)

Korak 3:

  • Dalje, izračunat ćetegornja granica za dalje napredovanje u procesu. U ćeliji G7 , izračunajte donju granicu koristeći sljedeću formulu.
=G5-(1.25*G6)

4. korak:

  • I u ćeliji G8 izračunajte gornju granicu iz sljedeće formule
=G5+(1.5*G6)

Korak 5:

  • Nakon toga , da biste izračunali postoje li odstupanja ili ne, upišite sljedeću formulu u ćeliju D5 .
=OR(C5$G$8)

  • Dakle, formula će vratiti vrijednost TRUE ako su specifični podaci u željenoj ćeliji izvan i FALSE.
  • Dvaput kliknite na alat AutoFill u ćeliji D5 za kopiranje formule u ostale ćelije u koloni D . Tako možete saznati sve preostale odstupanja u vašem skupu podataka.

Pročitajte više: Kako pronaći vanjske vrijednosti sa standardnom devijacijom u Excelu (sa brzim koracima)

4. Umetnite Z-score za izračunavanje odstupanja u Excelu

Z-score je jedna od najčešće korištenih metrika za identifikaciju outliers. Ova metoda pokazuje koliko je određeni podatak udaljen od srednje vrijednosti skupa podataka u odnosu na njegovu standardnu ​​devijaciju. Za izračunavanje odstupanja koristeći Z-score u Excelu možete vidjeti dolje opisane korake.

Korak 1:

  • Prvo, uzmite željeni skup podataka.

Korak2:

  • Drugo, u ćeliju H5, upišite sljedeću formulu za izračunavanje srednje vrijednosti za date podatke.
=AVERAGE(C5:C16)

Korak 3:

  • Treće, izračunajte standardnu ​​devijaciju datog skupa podataka u ćeliji H6 koristeći sljedeću formulu.
=STDEV.P(C5:C16)

Korak 4:

  • Nakon toga , morate odrediti Z -score za svaku vrijednost podataka. Da biste to učinili, koristite formulu datu u nastavku.
=(C5-$H$5)/$H$6

Korak 5:

  • Nakon izračunavanja svih Z-vrijednosti, vidjet ćete da je raspon Z-vrijednosti je između -1,44 i 13 . Dakle, smatramo vrijednosti Z-score manje od -1,2 ili više od +1,8 za vanjske granice.
  • Zatim, upišite sljedeću formulu u ćeliju E 5 .
=OR((D51.8))

  • Konačno, formula će vratiti TRUE vrijednost ako su specifični podaci izvan granica i vratit će FALSE
  • Dvaput kliknite na ćeliju E5 za korištenje Automatskog popunjavanja ručica za popunjavanje alata za kopiranje formule u ostale ćelije u koloni E . Tako možete pronaći sve preostale odstupanja u svom skupu podataka.

Pročitajte više: Kako pronaći odstupnike koristeći Z Score u Excelu (sa QuickKoraci)

5. Spojite VELIKE i MALE funkcije da biste pronašli odstupnike u Excelu

VELIKA funkcija i MALA funkcija u Excelu imaju suprotne operacije. Koristit ćemo ga za pronalaženje najvećih i najmanjih podataka ili vrijednosti u skupu podataka. Ova funkcija će povući sve podatke unutar skupa podataka, pronalazeći najmanji i najveći broj. Oni su u stanju pronaći drugi najmanji ili najveći, treći najveći ili najmanji i tako dalje.

Korak 1:

  • Prvo, koristite sljedeću formulu u ćeliji E5 sa velikom funkcijom .
=LARGE($C$5:$C$16,1)

    • Dakle, iz 12 vrijednosti, možete vidjeti prvu najveću vrijednost koja je 780 .

Korak 2:

  • Nakon toga, u ćeliju G5 , zapišite sljedeću formulu da pronađete najmanju vrijednost.
=SMALL($C$5:$C$16,1)

  • Konačno, od 12 vrijednosti, možete vidjeti 1. najmanja vrijednost 110 .
  • Kada ste saznali sve tražene vrijednosti, tada možete lako istaknuti sve odstupnike u skupu podataka.

Zaključak

To je kraj ovog članka. Nadam se da će vam ovaj članak biti od pomoći. Nakon što pročitate ovaj članak, moći ćete izračunati vanjske vrijednosti u Excelu koristeći bilo koju od metoda. Molimo vas da podijelite sva dodatna pitanja ili preporuke sau odeljku za komentare ispod.

Hugh West je vrlo iskusan Excel trener i analitičar s više od 10 godina iskustva u industriji. Diplomirao je računovodstvo i finansije i magistrirao poslovnu administraciju. Hugh ima strast prema podučavanju i razvio je jedinstven pristup podučavanju koji je lako pratiti i razumjeti. Njegovo stručno znanje o Excel-u pomoglo je hiljadama studenata i profesionalaca širom svijeta da poboljšaju svoje vještine i napreduju u karijeri. Kroz svoj blog, Hugh dijeli svoje znanje sa svijetom, nudeći besplatne Excel tutorijale i online obuku kako bi pomogli pojedincima i preduzećima da ostvare svoj puni potencijal.