Cuprins
The coeficientul de corelație este unul dintre acele lucruri pe care le întâlnești foarte des în analiza statistică. Coeficientul de corelație Pearson este un mod simplu, dar eficient de a exprima coeficientul de corelație liniară corelația dintre două variabile Excel, fiind un instrument de analiză a datelor, oferă câteva modalități excelente de a calcula coeficienții de corelație. În acest tutorial, vă voi arăta cum să calculați coeficientul de corelație Pearson în Excel.
Descărcați caietul de practică
Setul de date utilizat pentru acest exemplu este atașat mai jos pentru referință. Îl puteți descărca de aici și puteți încerca pașii pe măsură ce parcurgeți metodele.
Calculați coeficientul de corelație Pearson.xlsx
Ce este coeficientul de corelație Pearson?
Așa cum am menționat anterior, coeficientul de corelație Pearson este o măsură a corelației liniare dintre două variabile. Din punct de vedere matematic, este raportul dintre covarianța și produsul abaterii standard a celor două variabile. În formulă, coeficientul de corelație Pearson(r) a două variabile X și Y ar fi
Din cauza naturii acestei formule, coeficientul de corelație rezultă întotdeauna o valoare cuprinsă între -1 și 1. În unele cazuri, valoarea poate fi 0, indicând o corelație nulă între variabile. Pentru alte cazuri extreme, o valoare de -1 sau 1 indică o corelație liniară negativă sau pozitivă perfectă între cele două variabile. Astfel, în general, cu cât valoarea este mai apropiată de 0, cu atât corelația este mai mică. Coeficientul de corelație este mai mic. Coeficientul de corelațiecu cât valoarea este mai departe de 0, cu atât este mai mare corelația.
De exemplu, mărimea pantofilor și mărimea piciorului ca două variabile vor avea întotdeauna o corelație pozitivă perfectă. Aruncați o privire la următorul set de date.
Pe măsură ce mărimea pantofilor a crescut odată cu creșterea mărimii piciorului, acest lucru indică o corelație liniară pozitivă.
Dar, majoritatea variabilelor din scenariile din viața reală nu reprezintă o corelație. În majoritatea cazurilor, coeficientul de corelație ar fi mai aproape de zero. De exemplu, să luăm în considerare mărimea piciorului cu IQ-ul persoanei.
Ca urmare, graficul ar arăta cam așa, indicând că nu există o corelație liniară între cele două variabile.
4 moduri simple de a calcula coeficientul de corelație Pearson în Excel
În Excel, există mai multe metode pentru a calcula coeficientul de corelație Pearson. În primul rând, puteți calcula valorile manual și puteți afla valoarea formulei descrise mai sus. De asemenea, Excel are două funcții dedicate pentru a afla corelațiile și corelațiile Pearson între variabile. Există, de asemenea, un instrument add-in pe care îl puteți utiliza pentru a afla corelațiile dintre două variabile.
Pentru a demonstra toate metodele, voi folosi același set de date de mai jos.
Am trecut în revistă fiecare metodă în sub-secțiunile respective. Urmăriți fiecare dintre ele pentru a o găsi pe cea potrivită pentru dvs. Sau, dacă aveți în minte una anume, găsiți-o în tabelul de mai sus.
1. Calculați manual coeficientul de corelație Pearson în Excel
Există întotdeauna vechea metodă "manuală" pentru a calcula coeficientul de corelație Pearson între două variabile în Excel. În cazul în care urmați această metodă, trebuie să găsiți toate valorile mediilor, diferențelor, pătratelor și sumelor și să calculați manual coeficientul de corelație Pearson din acestea. Voi considera vârsta ca fiind variabila X și IMC ca variabilă Y din tabelulformula și să găsim valoarea lui r. Ne vom lovi de formula MEDIU , SUM , și SQRT în această metodă.
Pentru un ghid detaliat, urmați acești pași.
Pași:
- În primul rând, găsiți vârsta medie scriind următoarea formulă. Am selectat celula C12 la valoarea vârstei medii.
=MEDIA(C5:C10)
- Apoi, aflați valoarea medie a IMC scriind următoarea formulă.
=MEDIA(D5:D10)
Am selectat celula D12 pentru a stoca valoarea.
- Acum, pentru a afla X i -X̅ , scrieți următoarea formulă.
=C5-$C$12
- Acum, apăsați Introduceți .
- Apoi, selectați din nou celula. Pictograma Mâner de umplere pentru a completa restul coloanei.
- În mod similar, găsiți valoarea lui Y i -Y̅ prin scrierea următoarei formule.
=D5-$D$12
- În același mod, apăsați Enter. Și apoi completați restul coloanei cu Pictograma Mâner de umplere .
- Acum, aflați valoarea lui (X i -X̅)*(Y i -Y̅) prin utilizarea formulei:
=F5*G5
- Dați clic și trageți de butonul Pictograma Mâner de umplere pentru a completa restul coloanei, așa cum se arată mai sus.
- Acum, aflați (X i -X̅)2 scrieți următoarea formulă:
=F5*F5
- Faceți clic și trageți Pictograma Mâner de umplere pentru a completa restul coloanei.
- Pentru a afla valoarea lui (Y i -Y̅)2 scrieți următoarea formulă:
=G5*G5
- Faceți clic și trageți Pictograma Mâner de umplere Aceasta va completa valorile pentru restul coloanei.
- Pentru a afla suma dintre (X i -X̅)*(Y i -Y̅) scrieți următoarea formulă, apoi apăsați Introduceți .
=SUM(H5:H10)
- Pentru a afla suma dintre (X i -X̅)2 și (Y i -Y̅)2 în această foaie, faceți clic și trageți Pictograma Mâner de umplere la dreapta pentru a completa rândul cu aceeași formulă.
- În cele din urmă, pentru a găsi coeficientul Pearson, scrieți următoarea formulă. Am folosit referințele celulelor din foaia respectivă.
=H12/SQRT(I12*J12)
- Acum apăsați Introduceți În acest moment, veți obține manual coeficientul Pearson al celor două variabile (vârsta și IMC).
Citește mai mult: Cum se calculează coeficientul de corelație intraclasă în Excel
2. Utilizarea funcției PEARSON pentru calcularea coeficientului de corelație Pearson
Metoda de bază pentru a găsi coeficientul de corelație Pearson în Excel este un proces relativ lung. Dimpotrivă, utilizarea funcțiilor pentru a afla coeficientul de corelație Pearson este un proces rapid și ușor care lasă calculele lungi în seama Excel și doar află valoarea coeficientului de corelație a două variabile.
Excel are o funcție dedicată PEARSON funcția pentru a afla coeficientul de corelație a două variabile din valori. Funcția ia ca argumente două matrici și returnează coeficientul de corelație Pearson.
Pentru un ghid mai detaliat, urmați pașii.
Pași:
- În primul rând, selectați celula în care doriți să puneți valoarea returnată. Am selectat celula D12 pentru demonstrație.
- Scrieți următoarea formulă în celulă.
=PEARSON(C5:C10,D5:D10)
- Apoi apăsați Introduceți de pe tastatură. Veți obține direct coeficientul de corelație Pearson.
Citiți mai mult: Cum să găsiți coeficientul de corelație Spearman Rank în Excel (2 moduri)
3. Utilizarea funcției CORREL în Excel
Există o altă funcție dedicată pentru a afla valoarea coeficienților de corelație între două variabile. Este vorba despre funcția funcția CORREL La fel ca și funcția anterioară, și această funcție primește ca argumente două matrici și returnează valoarea coeficientului de corelație dintre cele două, care este același cu coeficientul de corelație Pearson.
Pentru un ghid mai detaliat, urmați acești pași.
Pași:
- Mai întâi, selectați celula în care doriți să stocați valoarea. Am selectat celula D12 aici în acest scop.
- Apoi scrieți următoarea formulă în celulă.
=CORREL(C5:C10,D5:D10)
- Acum, apăsați Introduceți Astfel, veți obține valoarea coeficientului de corelație.
Citește mai mult: Cum se calculează valoarea P pentru corelația Spearman în Excel
4. Calculați coeficientul de corelație Pearson în Excel folosind add-in-uri
În plus față de metodele descrise anterior, Excel are și un add-in pentru a afla coeficientul de corelație dintre două variabile. Trebuie să adăugați în Analiza datelor Această metodă este deosebit de utilă în cazul în care doriți să obțineți un coeficient de corelație între mai mult de două variabile în același timp.
Urmați pașii de mai jos pentru a adăuga instrumentul și a găsi coeficientul de corelație.
Pași:
- În primul rând, mergeți la Fișier din panglica dvs. și selectați Opțiuni .
- Un Opțiuni Excel Se va deschide o casetă de selectare. Completări fila de pe ea.
- Pe lângă Gestionați , asigurați-vă că Suplimente Excel este selectată.
- După aceea, faceți clic pe Du-te .
- În continuare, în secțiunea Completări care a apărut, bifați caseta Pachet de instrumente de analiză După aceea, faceți clic pe OK Acum vei avea Analiza datelor instrumente disponibile.
- Acum, mergeți la Date din panglică.
- Apoi, în Analiză grup, selectați Analiza datelor .
- În continuare, în secțiunea Analiza datelor caseta, selectați Corelație de la Instrumente de analiză Apoi faceți clic pe OK .
- În Corelație selectați intervalul de intrare $C$4:$D$10 .
- Apoi, în Grupate prin câmpul, selectați Coloane deoarece variabilele sunt grupate sub formă de coloane.
- După aceea, verificați Etichete în primul rând .
- Apoi, în Opțiuni de ieșire, selectați Gama de ieșire . am selectat $B$12 aici.
- În cele din urmă, faceți clic pe OK Veți avea toate valorile corelației dintre variabile.
În acest exemplu, există doar două variabile, astfel încât coeficienții de corelație sunt afișați sub forma unui 2X2 matrice cu toate combinațiile de variabile.
Citește mai mult: Cum se face o matrice de corelație în Excel (2 abordări practice)
Concluzie
Astfel se încheie ghidul despre cum se calculează coeficientul de corelație Pearson în Excel. Sperăm că ați găsit acest ghid util și informativ. Dacă aveți întrebări sau sugestii pentru noi, anunțați-ne mai jos. Pentru mai multe ghiduri ca acesta, vizitați Exceldemy.com .