Kako izračunati Pearsonov koeficijent korelacije u Excelu (4 metode)

  • Podijeli Ovo
Hugh West

Koeficijent korelacije jedna je od onih stvari s kojima se često susrećete u statističkoj analizi. Pearsonov koeficijent korelacije je jednostavan, ali učinkovit način za izražavanje linearne korelacije između dviju varijabli . Excel, kao alat za analizu podataka, pruža izvrsne načine za izračunavanje koeficijenata korelacije. U ovom vodiču pokazat ću vam kako izračunati Pearsonov koeficijent korelacije u Excelu.

Preuzmite vježbovnu bilježnicu

Skup podataka korišten za ovaj primjer priložen je u nastavku za referencu. Možete ga preuzeti odavde i sami isprobati korake dok prolazite kroz metode.

Izračunajte Pearsonov koeficijent korelacije.xlsx

Što je Pearsonov koeficijent korelacije?

Kao što je ranije spomenuto, Pearsonov koeficijent korelacije je mjera linearne korelacije između dviju varijabli. Matematički govoreći, to je omjer kovarijance i umnoška standardne devijacije dviju varijabli. U formuli bi Pearsonov koeficijent korelacije(r) dviju varijabli X i Y bio

Zbog prirode ove formule, koeficijent korelacije uvijek rezultira vrijednošću između -1 do 1. U nekim slučajevima, vrijednost može biti 0 što ukazuje da nema korelacije između varijabli. Za ostale ekstremne, vrijednost -1 ili 1 označava savršeno negativan ili pozitivan linearkorelacija između to dvoje. Dakle, općenito govoreći, što je vrijednost bliža 0, korelacija je niža. Što je vrijednost udaljenija od 0, to je korelacija veća.

Na primjer, veličina cipela i veličina stopala kao dvije varijable uvijek će imati savršenu pozitivnu korelaciju. Pogledajte sljedeći skup podataka.

Kako je veličina cipela rasla kao i veličina stopala, to ukazuje na pozitivnu linearnu korelaciju.

Ali, većina varijabli u scenarijima stvarnog života ne predstavljaju korelaciju. U većini slučajeva koeficijent korelacije bio bi bliži nuli. Na primjer, uzmimo u obzir veličinu stopala s kvocijentom inteligencije osobe.

Kao rezultat toga, grafikon bi izgledao otprilike ovako, pokazujući da nema linearne korelacije između dvije varijable.

4 jednostavna načina za izračunavanje Pearsonovog koeficijenta korelacije u Excelu

U Excelu postoji nekoliko metoda za izračunavanje Pearsonovog koeficijenta korelacije. Prvo, možete izračunati vrijednosti ručno i saznati vrijednost gore opisane formule. Također, Excel ima dvije namjenske funkcije za otkrivanje korelacija i Pearsonovih korelacija između varijabli. Tu je i dodatni alat koji možete upotrijebiti za pronalaženje korelacija između dviju varijabli.

Da bih demonstrirao sve metode, koristit ću isti skup podataka u nastavku.

Prošao sam kroz svaku njihovu metoduodgovarajuće pododjeljke. Pratite svaki kako biste pronašli onaj koji vam odgovara. Ili ako imate nešto posebno na umu, pronađite ga u gornjoj tablici.

1. Ručno izračunajte Pearsonov koeficijent korelacije u Excelu

Uvijek postoji stara školska metoda "ručnog" izračunavanja Pearsonov koeficijent korelacije između dvije varijable u Excelu. U slučaju da slijedite ovu metodu, trebate saznati sve vrijednosti prosjeka, razlika, kvadrata i zbrojeva te iz njih ručno izračunati Pearsonov koeficijent korelacije. Uzet ću u obzir dob kao X varijablu i BMI kao varijablu Y iz formule i pronaći vrijednost r. Naletjet ćemo na funkcije AVERAGE , SUM , i SQRT u ovoj metodi.

Za detaljan vodič slijedite ove korake.

Koraci:

  • Prvo pronađite prosječnu dob tako što ćete napisati sljedeću formulu. Odabrao sam ćeliju C12 na vrijednost prosječne dobi.

=AVERAGE(C5:C10)

  • Zatim saznajte prosječnu vrijednost BMI tako što ćete napisati sljedeću formulu.

=AVERAGE(D5:D10)

I su odabrali ćeliju D12 za pohranu vrijednosti.

  • Sada, da saznamo X i - X̅ , zapišite sljedeću formulu.

=C5-$C$12

  • Sada pritisnite Enter .
  • Zatim ponovno odaberite ćeliju. Sada kliknite i povucite Ikonu ručke za popunjavanje naispunite ostatak stupca.

  • Na sličan način saznajte vrijednost Y i -Y̅ napisivanjem sljedeće formule.

=D5-$D$12

  • Na isti način pritisnite Enter. Zatim ispunite ostatak stupca Ikonom ručke za popunjavanje .

  • Sada saznajte vrijednost (X i -X̅)*(Y i -Y̅) pomoću formule:

=F5*G5

  • Kliknite i povucite Ikonu ručice za popunjavanje da biste ispunili ostatak stupca kao što je prikazano gore.

  • Sada saznajte (X i -X̅)2 zapišite sljedeću formulu:

=F5*F5

  • Kliknite i povucite ikonu Ručke za popunjavanje za popunjavanje ostatka stupca.

  • Za pronalaženje vrijednosti (Y i -Y̅)2 zapišite sljedeću formulu:

=G5*G5

  • Kliknite i povucite traku Ikona ručke za popunjavanje kao što je gore prikazano. Ispunit će vrijednosti za ostatak stupca.

  • Da biste pronašli zbroj (X i -X̅)*(Y i -Y̅) zapišite sljedeću formulu. Zatim pritisnite Enter .

=SUM(H5:H10)

  • Da biste pronašli zbroj (X i -X̅)2 i (Y i -Y̅)2 na ovom listu, kliknite i povucite ikonu ručice za popunjavanje udesno da ispunite redista formula.

  • Na kraju da biste pronašli Pearsonov koeficijent zapišite sljedeću formulu. Koristio sam reference ćelija određenog lista.

=H12/SQRT(I12*J12)

  • Sada pritisnite Enter na tipkovnici. U ovom trenutku imat ćete Pearsonov koeficijent dviju varijabli (dob i BMI) ručno.

Pročitajte više: Kako izračunati unutarklasni koeficijent korelacije u Excelu

2. Upotreba PEARSON funkcije za izračun Pearsonovog koeficijenta korelacije

Osnovna metoda za pronalaženje Pearsonovog koeficijenta korelacije u Excelu relativno je dug proces . Naprotiv, korištenje funkcija za pronalaženje Pearsonovog koeficijenta korelacije brz je i jednostavan postupak koji duge izračune prepušta Excelu i samo pronalazi vrijednost koeficijenta korelacije dviju varijabli.

Excel ima namjensku PEARSON funkcija za pronalaženje korelacijskog koeficijenta dviju varijabli iz vrijednosti. Funkcija uzima dva niza kao argumente i vraća Pearsonov koeficijent korelacije.

Za detaljniji vodič slijedite korake.

Koraci:

  • Prvo odaberite ćeliju u koju želite staviti vraćenu vrijednost. Odabrao sam ćeliju D12 za demonstraciju.

  • Zapišite sljedeću formulu ućelija.

=PEARSON(C5:C10,D5:D10)

  • Zatim pritisnite Enter na vašoj tipkovnici. Imat ćete izravno Pearsonov koeficijent korelacije.

Pročitajte više: Kako pronaći Spearmanov koeficijent korelacije u Excelu (2 načina)

3. Korištenje funkcije CORREL u Excelu

Postoji još jedna namjenska funkcija za pronalaženje vrijednosti korelacijskih koeficijenata između dviju varijabli. To je funkcija CORREL . Baš kao i prethodna funkcija, ova funkcija također uzima dva polja kao argumente i vraća vrijednost korelacijskog koeficijenta za njih, što je isto kao i Pearsonov koeficijent korelacije.

Za detaljniji vodič, slijedite ove korake.

Koraci:

  • Prvo odaberite ćeliju u koju želite pohraniti vrijednost. Ovdje sam odabrao ćeliju D12 u tu svrhu.

  • Zatim zapišite sljedeću formulu u ćeliju.

=CORREL(C5:C10,D5:D10)

  • Sada pritisnite Enter na tipkovnici . Tako ćete imati vrijednost koeficijenta korelacije.

Pročitajte više: Kako izračunati P vrijednost za Spearmanovu korelaciju u Excelu

4. Izračunajte Pearsonov koeficijent korelacije u Excelu pomoću dodataka

Pored prethodno opisanih metoda, Excel također ima dodatak za pronalaženje koeficijenta korelacije između dvije varijable. Trebašnajprije dodajte alat Analiza podataka da biste saznali koeficijent ove metode. Ova metoda je posebno korisna ako želite korelacijski koeficijent između više od dvije varijable u isto vrijeme.

Slijedite ove korake da biste dodali alat i pronašli korelacijski koeficijent.

Koraci :

  • Prvo idite na karticu Datoteka na vrpci i odaberite Opcije .
  • An Excel Pojavit će se okvir s opcijama . Odaberite karticu Add-ins iz njega.
  • Osim Manage , provjerite je li odabrana opcija Excel Add-ins .
  • Nakon toga kliknite Idi .

  • Dalje, u okviru Dodaci koji se pojavio, provjerite Analysis Toolpak . Nakon toga kliknite na OK . Sada će vam biti dostupni vaši Analiza podataka alati.

  • Sada idite na karticu Podaci u vašoj vrpci.
  • Zatim, u grupi Analiza odaberite Analiza podataka .

  • Zatim, u okviru Analiza podataka odaberite Korelacija iz Alata za analizu . Zatim kliknite na OK .

  • U okviru Korelacija odaberite raspon unosa $C$4:$D$10 .
  • Zatim u polju Grupirano po odaberite Stupci jer su varijable grupirane kao stupci.
  • Nakon toga provjerite Oznake u prvom redu .
  • Zatim u Opcijama izlaza, odaberite Raspon izlaza . jaodabrali $B$12 ovdje.

  • Na kraju kliknite na OK . Imat ćete sve vrijednosti korelacije između varijabli.

U ovom primjeru postoje samo dvije varijable. Tako su koeficijenti korelacije prikazani kao 2X2 matrica sa svim kombinacijama varijabli.

Pročitajte više: Kako napraviti korelacijsku matricu u Excelu ( 2 praktična pristupa)

Zaključak

Ovim se završava vodič o tome kako izračunati Pearsonov koeficijent korelacije u Excelu. Nadamo se da vam je ovaj vodič bio koristan i informativan. Ako imate pitanja ili prijedloga za nas, javite nam u nastavku. Za više ovakvih vodiča posjetite Exceldemy.com .

Hugh West vrlo je iskusan Excel trener i analitičar s više od 10 godina iskustva u industriji. Diplomirao je računovodstvo i financije te magistrirao poslovno upravljanje. Hugh ima strast za podučavanjem i razvio je jedinstveni pristup podučavanju koji je lako pratiti i razumjeti. Njegovo stručno poznavanje programa Excel pomoglo je tisućama studenata i profesionalaca diljem svijeta da poboljšaju svoje vještine i postignu uspjeh u karijeri. Putem svog bloga, Hugh dijeli svoje znanje sa svijetom, nudeći besplatne vodiče za Excel i online obuku kako bi pomogao pojedincima i tvrtkama da dostignu svoj puni potencijal.