Sadržaj
koeficijent korelacije je jedna od onih stvari na koje se vrlo često susrećete u statističkoj analizi. Pearsonov koeficijent korelacije je jednostavan, ali efikasan način da se izrazi linearna korelacija između dvije varijable . Excel, kao alat za analizu podataka, pruža neke odlične načine za izračunavanje koeficijenata korelacije. U ovom tutorijalu pokazat ću vam kako da izračunate Pearsonov koeficijent korelacije u Excel-u.
Preuzmite radnu svesku za vježbu
Skup podataka korišten za ovaj primjer je priložen ispod za referencu. Možete ga preuzeti odavde i sami isprobati korake dok prolazite kroz metode.
Izračunajte Pearsonov koeficijent korelacije.xlsx
Šta je Pearsonov koeficijent korelacije?
Kao što je ranije spomenuto, Pearsonov koeficijent korelacije je mjera linearne korelacije između dvije varijable. Matematički gledano, to je omjer kovarijanse i proizvoda standardne devijacije dvije varijable. U formuli, Pearsonov koeficijent korelacije (r) dvije varijable X i Y bi bio
Zbog prirode ove formule, koeficijent korelacije uvijek rezultira vrijednošću između -1 do 1. U nekim slučajevima, vrijednost može biti 0 što ukazuje da nema korelacije između varijabli. Za druge ekstremne, vrijednost od -1 ili 1 označava savršenu negativnu ili pozitivnu linearnukorelacija između to dvoje. Dakle, općenito govoreći, što je vrijednost bliža 0, to je niža korelacija. Što je vrijednost dalje od 0, to je veća korelacija.
Na primjer, veličina cipela i stopala kao dvije varijable uvijek će imati savršenu pozitivnu korelaciju. Pogledajte sljedeći skup podataka.
Kako je veličina cipela rasla s povećanjem veličine stopala, to ukazuje na pozitivnu linearnu korelaciju.
Ali, većina varijabli u scenarijima iz stvarnog života ne predstavlja korelaciju. U većini slučajeva, koeficijent korelacije bi bio bliži nuli. Na primjer, uzmimo u obzir veličinu stopala s IQ-om osobe.
Kao rezultat, grafikon bi izgledao otprilike ovako, ukazujući da nema linearne korelacije između dvije varijable.
4 laka načina za izračunavanje Pearsonovog koeficijenta korelacije u Excelu
U Excelu postoji nekoliko metoda za izračunavanje Pearsonovog koeficijenta korelacije. Prvo, možete ručno izračunati vrijednosti i saznati vrijednost gore opisane formule. Također, Excel ima dvije namjenske funkcije za otkrivanje korelacija i Pearsonove korelacije između varijabli. Postoji i dodatni alat koji možete koristiti da saznate korelacije između dvije varijable.
Da bih demonstrirao sve metode, koristit ću isti skup podataka u nastavku.
Prošao sam svaku metodu u njihovojodgovarajućim pododjeljcima. Pratite svaku od njih kako biste pronašli odgovarajući za vas. Ili ako imate neki poseban na umu, pronađite ga u gornjoj tabeli.
1. Ručno izračunajte Pearsonov koeficijent korelacije u Excelu
Uvijek postoji "ručna" metoda stare škole za izračunavanje Pearsonov koeficijent korelacije između dvije varijable u Excelu. U slučaju da slijedite ovu metodu, potrebno je da saznate sve vrijednosti prosjeka, razlika, kvadrata i suma i iz njih ručno izračunate Pearsonov koeficijent korelacije. Uzet ću u obzir dob kao X varijablu i BMI kao varijablu Y iz formule i pronaći vrijednost r. U ovoj metodi ćemo naići na funkcije AVERAGE , SUM , i SQRT .
Za detaljan vodič, slijedite ove korake.
Koraci:
- Prvo pronađite prosječnu starost tako što ćete napisati sljedeću formulu. Odabrao sam ćeliju C12 na vrijednost prosječne starosti.
=AVERAGE(C5:C10)
- Zatim saznajte prosječnu vrijednost BMI tako što ćete napisati sljedeću formulu.
=AVERAGE(D5:D10)
I su odabrali ćeliju D12 za pohranjivanje vrijednosti.
- Sada, da saznate X i - X̅ , zapišite sljedeću formulu.
=C5-$C$12
- Sada pritisnite Enter .
- Zatim ponovo odaberite ćeliju. Sada kliknite i povucite Ikona ručke za popunjavanje napopunite ostatak kolone.
- Na sličan način saznajte vrijednost Y i -Y̅ upisivanjem sljedeće formule.
=D5-$D$12
- Na sličan način pritisnite Enter. A zatim popunite ostatak kolone sa Ikonom ručke za popunjavanje .
- Sada saznajte vrijednost (X i -X̅)*(Y i -Y̅) koristeći formulu:
=F5*G5
- Kliknite i povucite Ikona ručice za popunjavanje da popunite ostatak kolone kao što je prikazano iznad.
- Sada saznaj (X i -X̅)2 zapiši sljedeću formulu:
=F5*F5
- Kliknite i povucite Ikona ručke za popunjavanje da popunite ostatak kolone.
- Da biste saznali vrijednost (Y i -Y̅)2 zapišite sljedeću formulu:
=G5*G5
- Kliknite i povucite traku Ikona ručice za popunjavanje kao što je prikazano iznad. Popunit će vrijednosti za ostatak kolone.
- Da biste pronašli zbir (X i -X̅)*(Y i -Y̅) zapišite sljedeću formulu. Zatim pritisnite Enter .
=SUM(H5:H10)
- Da biste pronašli zbir (X i -X̅)2 i (Y i -Y̅)2 na ovom listu, kliknite i povucite Ikona ručke za popunjavanje udesno da popunite redistu formulu.
- Konačno da biste pronašli Pearsonov koeficijent zapišite sljedeću formulu. Koristio sam reference ćelija određenog lista.
=H12/SQRT(I12*J12)
- Sada pritisnite Enter na vašoj tastaturi. U ovom trenutku, imat ćete Pearsonov koeficijent dvije varijable (starost i BMI) ručno.
Pročitajte više: Kako izračunati koeficijent korelacije unutar klase u Excelu
2. Korištenje PEARSON funkcije za izračunavanje Pearsonovog koeficijenta korelacije
Osnovna metoda za pronalaženje Pearsonovog koeficijenta korelacije u Excelu je relativno dug proces . Naprotiv, korištenje funkcija za pronalaženje Pearsonovog koeficijenta korelacije je brz i lak proces koji duge proračune prepušta Excelu i samo saznaje vrijednost koeficijenta korelacije dvije varijable.
Excel ima namjenski PEARSON funkcija za pronalaženje koeficijenta korelacije dvije varijable iz vrijednosti. Funkcija uzima dva niza kao argumente i vraća Pearsonov koeficijent korelacije.
Za detaljniji vodič, slijedite korake.
Koraci:
- Prvo, odaberite ćeliju u koju želite staviti vraćenu vrijednost. Odabrao sam ćeliju D12 za demonstraciju.
- Zapišite sljedeću formulu ućelija.
=PEARSON(C5:C10,D5:D10)
- Zatim pritisnite Enter na vašoj tastaturi. Direktno ćete imati Pearsonov koeficijent korelacije.
Pročitajte više: Kako pronaći Spearmanov koeficijent korelacije ranga u Excelu (2 načina)
3. Korištenje CORREL funkcije u Excelu
Postoji još jedna namjenska funkcija za pronalaženje vrijednosti koeficijenata korelacije između dvije varijable. To je CORREL funkcija . Baš kao i prethodna funkcija, ova funkcija također uzima dva niza kao argumente i vraća vrijednost koeficijenta korelacije za ta dva, koja je ista kao i Pearsonov koeficijent korelacije.
Za detaljniji vodič, slijedite ove korake.
Koraci:
- Prvo, odaberite ćeliju u koju želite pohraniti vrijednost. Odabrao sam ćeliju D12 ovdje u tu svrhu.
- Zatim zapišite sljedeću formulu u ćeliju.
=CORREL(C5:C10,D5:D10)
- Sada pritisnite Enter na tastaturi . Tako ćete imati vrijednost koeficijenta korelacije.
Pročitajte više: Kako izračunati P vrijednost za Spearmanovu korelaciju u Excelu
4. Izračunajte Pearsonov koeficijent korelacije u Excelu pomoću dodataka
Pored prethodno opisanih metoda, Excel također ima dodatak za pronalaženje koeficijenta korelacije između dvije varijable. Trebaš daprvo dodajte alat Analiza podataka da biste saznali koeficijent u ovoj metodi. Ova metoda je posebno korisna ako želite koeficijent korelacije između više od dvije varijable u isto vrijeme.
Slijedite ove korake da dodate alat i pronađete koeficijent korelacije.
Koraci :
- Prvo, idite na karticu Datoteka na traci i odaberite Opcije .
- An Excel Pojavit će se okvir za opcije. Odaberite karticu Dodaci .
- Pored Upravljanje , provjerite je li odabrana opcija Excel dodaci .
- Nakon toga kliknite na Idi .
- Dalje, u okviru Dodaci koji se pojavio, provjerite Paket alata za analizu . Nakon toga, kliknite na OK . Sada ćete imati dostupne alate Analiza podataka .
- Sada idite na karticu Podaci na vašoj vrpci.
- Zatim, u grupi Analiza , odaberite Analiza podataka .
- Sljedeće, u polju Analiza podataka , odaberite Korelacija iz Alata za analizu . Zatim kliknite na OK .
- U polju Korelacija , odaberite raspon unosa $C$4:$D$10 .
- Zatim u polju Grupirano po , odaberite Kolone jer su varijable grupirane kao kolone.
- Nakon toga, provjerite Oznake u prvom redu .
- Zatim u Opcije izlaza, odaberite Izlazni opseg . Isu odabrali $B$12 ovdje.
- Konačno, kliknite na OK . Imat ćete sve vrijednosti korelacije između varijabli.
U ovom primjeru postoje samo dvije varijable. Dakle, koeficijenti korelacije su prikazani kao 2X2 matrica sa svim kombinacijama varijabli.
Pročitajte više: Kako napraviti matricu korelacije u Excelu ( 2 zgodna pristupa)
Zaključak
Ovim se završava vodič o tome kako izračunati Pearsonov koeficijent korelacije u Excelu. Nadamo se da vam je ovaj vodič bio koristan i informativan. Ako imate bilo kakvih pitanja ili prijedloga za nas, javite nam u nastavku. Za više ovakvih vodiča posjetite Exceldemy.com .