Sadržaj
U izračunima statističke vjerojatnosti z rezultat je od primarne važnosti. Distribucije podataka i outlieri u skupu podataka mogu se odrediti ovim pojmom. Moguće ih je ručno odrediti iz skupa podataka. Ako imate veći skup podataka, na raspolaganju vam je nekoliko alata. Excel je jedan od njih. Ako tražite posebne trikove za pronalaženje odstupanja pomoću z rezultata u Excelu, došli ste na pravo mjesto. U ovom će se članku raspravljati o svakom koraku metode za pronalaženje izvanrednih vrijednosti pomoću z rezultata. Slijedimo potpuni vodič kako bismo naučili sve ovo.
Preuzmite radnu bilježnicu za vježbe
Preuzmite ovu radnu bilježnicu za vježbe kako biste vježbali dok čitate ovaj članak. Sadrži sve skupove podataka u različitim proračunskim tablicama za jasno razumijevanje. Isprobajte se dok prolazite kroz postupak korak po korak.
Pronađite odstupanja pomoću Z ocjene.xlsx
Što je Z ocjena?
U statistici, rezultat z predstavlja standardnu devijaciju od populacije za određenu podatkovnu točku. Ova mjera nam govori koliko je određena vrijednost daleko od srednje vrijednosti skupa u odnosu na njegovu standardnu devijaciju. (Standardno odstupanje je RMS vrijednost svih različitih točaka i srednje vrijednosti). Matematička formula za z rezultat je
Gdje je,
Z = z rezultat
X =promatrana vrijednost
x̅ = srednja vrijednost
σ = standardna devijacija
ŠtoJe li Outlier?
Outlieri su vrijednosti koje se značajno razlikuju od ostalih vrijednosti u skupu podataka. Drugi način da se to kaže je da je outlier vrijednost koja je puno viša ili niža od srednje vrijednosti i medijana skupa podataka. U Excel grafikonu možete promatrati podatkovne točke koje su daleko od ostalih podatkovnih točaka kao ekstremne vrijednosti. Na primjer, razmislite o scenariju u kojemu imate ukupno poena koje je postiglo 5 različitih igrača u NBA sezoni. Osvojeni bodovi su 1600, 1400, 300 i 1500. Sada, ako iscrtate grafikon u Excelu, vidjet ćete da je točka 300 daleko od ostalih. Dakle, u ovih 3000 je outlier.
Outlier se smatra vrijednošću z rezultata unutar raspona od 3 do -3 jer su te vrijednosti prilično udaljene od vrijednosti srednje vrijednosti.
Korak-po-korak postupak za pronalaženje outliera pomoću Z rezultata u Excelu
U sljedećem odjeljku koristit ćemo jednu učinkovitu i lukavu metodu za pronalaženje outliera pomoću rezultat z u Excelu. Odredit ćemo z rezultat uzorka izračunavanjem srednje vrijednosti i standardnih devijacija svih brojeva. A onda ćemo pronaći izvanredne vrijednosti svakog opažanja. Ovaj odjeljak pruža opširne pojedinosti o ovoj metodi. Trebali biste naučiti i primijeniti sve ovo kako biste poboljšali svoju sposobnost razmišljanja i znanje o programu Excel. Ovdje koristimo verziju Microsoft Office 365 , ali možete koristiti bilo koju drugu verziju premaprema vašim željama.
Korak 1: Izračunajte srednju vrijednost skupa podataka
Na početku ćemo pronaći srednju vrijednost skupa podataka. Ovo će biti od pomoći za određivanje standardne devijacije i z rezultata. Ona, mi koristimo funkciju AVERAGE za određivanje srednje vrijednosti opažanja. Ova funkcija uzima niz argumenata ili raspon vrijednosti i vraća njihovu srednju vrijednost. Prođimo kroz korake za izračunavanje srednje vrijednosti skupa podataka.
- Prvo odaberite raspon ćelija i upišite sljedeću formulu u ćeliju H4 .
=AVERAGE(C5:C20)
- Zatim pritisnite Enter .
- Kao posljedica toga, imat će srednju vrijednost svih podataka.
Pročitajte više: Kako pronaći outliere sa standardnim odstupanjem u Excelu ( s brzim koracima)
Korak 2: Procijenite standardnu devijaciju
Sada ćemo procijeniti standardnu devijaciju. Koristit ćemo funkciju STDEV.P za određivanje standardnih odstupanja za skup podataka. Ova funkcija vraća standardnu devijaciju niza brojeva ili raspona vrijednosti koje uzima kao argumente. Prođimo kroz korake za procjenu standardne devijacije.
- Prvo odaberite raspon ćelija i upišite sljedeću formulu u ćeliju H5 .
=STDEV.P(C5:C20)
- Zatim pritisnite Enter .
- Kao posljedica toga, imat ćete standardna devijacijavrijednost za sve podatke.
Pročitajte više: Kako izračunati outliere u Excelu (5 jednostavnih načina)
Korak 3: Procijenite Z rezultat
Sada ćemo procijeniti z rezultat. Da bismo odredili z rezultat vrijednosti, prije svega, potrebna nam je razlika vrijednosti od srednje vrijednosti, a zatim je podijelimo sa standardnom devijacijom prema formuli. Prođimo kroz korake za procjenu z rezultata.
- Prije svega, da biste procijenili z rezultat, morate upisati sljedeću formulu u ćeliju D5 .
=(C5-$H$4)/$H$5
- Zatim pritisnite Enter .
- Kao rezultat toga, imat će rezultat z za prvu vrijednost u skupu podataka.
- Zatim povucite ikonu Ručica za popunjavanje da biste ispunili ostatak ćelija u stupcu s formulom.
- Kao posljedica toga, dobit ćete rezultat z za sve unose skupa podataka.
- U našem skupu podataka srednja vrijednost je 113,875 , a standardna devijacija 100,21 . Sada, ako uzmemo u obzir specifičnu vrijednost od $79 , z rezultat za ovu vrijednost je -0,347 što znači da je $79 0,347 standard odstupanja ispod srednje ili prosječne vrijednosti.
- U drugom slučaju, kada je vrijednost $500 , dobivamo z rezultat 3,85 . To znači da je 500$ 3,85 standardna devijacija iznad srednje vrijednosti.
Pročitajte više: KakoPronađite outliere u regresijskoj analizi u Excelu (3 laka načina)
Korak 4: Pronađite outliere iz skupa podataka
Sada ćemo pronaći outliere u našem skupu podataka. Outlier se smatra z vrijednošću rezultata unutar raspona od 3 do -3 , kao što je gore spomenuto. Prođimo kroz korake kako bismo saznali odstupanja u skupu podataka. Ovdje ćemo upotrijebiti funkciju OR da saznamo sadrže li vrijednosti u skupu podataka odstupanja ili ne. Ako bilo koja od vrijednosti unutar raspona zadovoljava uvjet tada će rezultat biti ISTINIT.
- Prije svega, da biste pronašli outliere, morate upisati sljedeću formulu u ćeliju E5 .
=OR((D53))
- Zatim pritisnite Enter .
- Kao rezultat toga, saznat ćete sadrži li prva vrijednost outliere ili ne u skupu podataka.
- Dalje, povucite ikonu Ručka za popunjavanje da biste ispunili ostatak ćelija u stupcu formulom.
- Kao posljedica toga, moći ćete znati sadrže li vrijednosti u skupu podataka odstupanja ili ne kao što je prikazano u nastavku.
Iz gornjeg skupa podataka, možemo vidjeti da je samo jedan z rezultat ID-a iznad vrijednosti 3. Zato dobivamo samo jedan outlier .
Sada ćemo prikazati outliere pomoću raspršenog grafikona. Moramo slijediti sljedeći postupak:
- Prvo odaberite raspon ćelija C5:D20 .
- Zatim idite na Umetni karticu. Odaberite Insert Scatter (X, Y) ili Bubble Chart, i na kraju odaberite Scatter .
- Kao posljedica toga, dobit ćete sljedeći grafikon.
- Za izmjenu stila grafikona odaberite Grafikon Dizajn , a zatim odaberite željenu opciju Stil 9 iz grupe Stilovi grafikona .
- Kao posljedicu, dobit ćete sljedeći Scatter grafikon.
Pročitajte više: Kako za pronalaženje odstupanja u programu Excel (5 korisnih načina)
Zaključak
To je kraj današnjeg predavanja. Čvrsto vjerujem da ćete od sada moći pronaći outliere koristeći z rezultat u Excelu. Ako imate bilo kakvih pitanja ili preporuka, podijelite ih u odjeljku za komentare ispod.
Ne zaboravite provjeriti našu web stranicu Exceldemy.com za razne probleme i rješenja u vezi s Excelom. Nastavite učiti nove metode i rasti!