Taula de continguts
El coeficient de correlació és una d'aquestes coses amb les que et trobes molt sovint a l'anàlisi estadística. El coeficient de correlació de Pearson és una manera senzilla, però eficaç d'expressar la correlació lineal entre dues variables . Excel, com l'eina d'anàlisi de dades que és, ofereix algunes maneres excel·lents de calcular els coeficients de correlació. En aquest tutorial, us mostraré com calcular el coeficient de correlació de Pearson a Excel.
Baixeu el quadern de pràctiques
El conjunt de dades utilitzat per a aquest exemple s'adjunta a continuació com a referència. Podeu descarregar-lo des d'aquí i provar els passos vosaltres mateixos mentre aneu a través dels mètodes.
Calculeu el coeficient de correlació de Pearson.xlsx
Què és Coeficient de correlació de Pearson?
Com s'ha esmentat anteriorment, el coeficient de correlació de Pearson és una mesura de la correlació lineal entre dues variables. Matemàticament parlant, és la relació entre la covariància i el producte de la desviació estàndard de les dues variables. A la fórmula, el coeficient de correlació de Pearson (r) de dues variables X i Y seria
A causa de la naturalesa d'aquesta fórmula, el coeficient de correlació sempre dóna lloc a un valor entre -1 i 1. En alguns casos, el valor pot ser 0 indicant que no hi ha correlació entre les variables. Per a altres extrems, un valor de -1 o 1 indica una lineal negativa o positiva perfectacorrelació entre ambdós. Per tant, en termes generals, com més a prop estigui el valor de 0, menor serà la correlació. Com més allunyat de 0, el valor, més gran serà la correlació.
Per exemple, la talla de sabates i la talla del peu com a dues variables sempre tindran una correlació positiva perfecta. Fes una ullada al conjunt de dades següent.
Com que la talla de la sabata augmentava a mesura que augmentava la talla del peu, això indica una correlació lineal positiva.
Però, la majoria de les variables en escenaris de la vida real no representen una correlació. En la majoria dels casos, el coeficient de correlació estaria més proper a zero. Per exemple, considerem la mida del peu amb el coeficient intel·lectual de la persona.
Com a resultat, el gràfic es veuria com aquest, indicant que no hi ha correlació lineal entre les dues variables.
4 maneres senzilles de calcular el coeficient de correlació de Pearson a Excel
A Excel, hi ha diversos mètodes per calcular el coeficient de correlació de Pearson. En primer lloc, podeu calcular els valors manualment i esbrinar el valor de la fórmula descrita anteriorment. A més, Excel té dues funcions dedicades per esbrinar correlacions i correlacions de Pearson entre variables. També hi ha una eina complementària que podeu utilitzar per trobar correlacions entre dues variables.
Per demostrar tots els mètodes, faré servir el mateix conjunt de dades a continuació.
He passat per cada mètode en el seusubapartats respectius. Segueix cadascun per trobar l'adequat per a tu. O si teniu algun en ment, trobeu-lo a la taula anterior.
1. Calcula manualment el coeficient de correlació de Pearson a Excel
Sempre hi ha el mètode "a mà" de la vella escola per calcular el coeficient de correlació de Pearson entre dues variables a Excel. En el cas que seguiu aquest mètode, haureu d'esbrinar tots els valors de mitjanes, diferències, quadrats i sumacions i calcular-los manualment el coeficient de correlació de Pearson. Consideraré l'edat com a variable X i l'IMC com a variable Y de la fórmula i trobaré el valor de r. Ens trobarem amb les funcions MITJANA , SUMA , i SQRT en aquest mètode.
Per obtenir una guia detallada, seguiu aquests passos.
Passos:
- Primer, trobeu l'edat mitjana escrivint la fórmula següent. He seleccionat la cel·la C12 al valor de l'edat mitjana.
=AVERAGE(C5:C10)
- A continuació, esbrineu el valor mitjà de l'IMC escrivint la fórmula següent.
=AVERAGE(D5:D10)
I heu seleccionat la cel·la D12 per emmagatzemar el valor.
- Ara, per esbrinar X i - X̅ , escriu la fórmula següent.
=C5-$C$12
- Ara, premeu Retorn .
- A continuació, torneu a seleccionar la cel·la. Ara feu clic i arrossegueu la Icona de mànec d'ompliment cap aomple la resta de la columna.
- De manera semblant, esbrina el valor de Y i -Y̅ escrivint la fórmula següent.
=D5-$D$12
- De la mateixa manera, premeu Intro. A continuació, ompliu la resta de la columna amb la Icona d'emplenament .
- Ara, esbrineu el valor de (X i -X̅)*(Y i -Y̅) utilitzant la fórmula:
=F5*G5
- Feu clic i arrossegueu la Icona d'emplenament per omplir la resta de la columna tal com es mostra a dalt.
- Ara, esbrina (X i -X̅)2 escriu la fórmula següent:
=F5*F5
- Feu clic i arrossegueu la icona de mànec d'ompliment per omplir la resta de la columna.
- Per esbrinar el valor de (Y i -Y̅)2 escriu la fórmula següent:
=G5*G5
- Feu clic i arrossegueu la barra Emplenar la icona del mànec com es mostra a dalt. Omplirà els valors de la resta de la columna.
- Per trobar la suma de (X i -X̅)*(Y i -Y̅) escriu la fórmula següent. A continuació, premeu Retorn .
=SUM(H5:H10)
- Per trobar la suma de (X i -X̅)2 i (Y i -Y̅)2 en aquest full, feu clic i arrossegueu la Icona del mànec d'ompliment cap a la dreta per omplir la filala mateixa fórmula.
- Finalment per trobar el coeficient de Pearson escriu la fórmula següent. He utilitzat les referències de cel·les del full concret.
=H12/SQRT(I12*J12)
- Ara premeu Enter al vostre teclat. En aquest moment, tindreu el coeficient de Pearson de les dues variables (edat i IMC) manualment.
Llegir més: Com calcular el coeficient de correlació intraclasse a Excel
2. Ús de la funció PEARSON per calcular el coeficient de correlació de Pearson
El mètode bàsic per trobar el coeficient de correlació de Pearson a Excel és un procés relativament llarg . Per contra, l'ús de funcions per esbrinar el coeficient de correlació de Pearson és un procés ràpid i fàcil que deixa els llargs càlculs a Excel i només esbrina el valor del coeficient de correlació de dues variables.
Excel té un programa dedicat. PEARSON funció per trobar el coeficient de correlació de dues variables a partir dels valors. La funció pren dues matrius com a arguments i retorna el coeficient de correlació de Pearson.
Per obtenir una guia més detallada, seguiu els passos.
Passos:
- Primer, seleccioneu la cel·la on voleu posar el valor retornat. He seleccionat la cel·la D12 per a la demostració.
- Anoteu la fórmula següent alcel·la.
=PEARSON(C5:C10,D5:D10)
- A continuació, premeu Retorn al teu teclat. Tindreu el coeficient de correlació de Pearson directament.
Llegiu més: Com trobar el coeficient de correlació de rang de Spearman a Excel (2 vies)
3. Utilització de la funció CORREL a Excel
Hi ha una altra funció dedicada per esbrinar el valor dels coeficients de correlació entre dues variables. És la funció CORREL . Igual que la funció anterior, aquesta funció també pren dues matrius com a arguments i retorna el valor del coeficient de correlació dels dos, que és el mateix que el coeficient de correlació de Pearson.
Per obtenir una guia més detallada, seguiu aquests passos.
Pasos:
- Primer, seleccioneu la cel·la on voleu emmagatzemar el valor. He seleccionat la cel·la D12 aquí per a aquest propòsit.
- A continuació, escriu la fórmula següent a la cel·la.
=CORREL(C5:C10,D5:D10)
- Ara, premeu Retorn al teclat . Així, tindreu el valor del coeficient de correlació.
Llegir més: Com calcular el valor P per a la correlació de Spearman a Excel
4. Calcula el coeficient de correlació de Pearson a Excel mitjançant complements
A més dels mètodes anteriors descrits, Excel també té un complement per esbrinar el coeficient de correlació entre dues variables. Tu necessitesafegiu primer l'eina Anàlisi de dades per esbrinar el coeficient d'aquest mètode. Aquest mètode és especialment útil si voleu un coeficient de correlació entre més de dues variables alhora.
Seguiu aquests passos per afegir l'eina i trobar el coeficient de correlació.
Passos. :
- Primer, aneu a la pestanya Fitxer de la cinta i seleccioneu Opcions .
- Un Excel Apareixerà el quadre d'opcions . Seleccioneu-ne la pestanya Complements .
- A més de Gestiona , assegureu-vos que l'opció Complements d'Excel estigui seleccionada.
- Després, feu clic a Vés .
- A continuació, al quadre Complements que va aparèixer, comproveu el Paquet d'eines d'anàlisi . Després d'això, feu clic a D'acord . Ara tindreu les vostres eines Anàlisi de dades disponibles.
- Ara, aneu a la pestanya Dades a la vostra cinta.
- A continuació, al grup Anàlisi , seleccioneu Anàlisi de dades .
- A continuació, al quadre Anàlisi de dades , seleccioneu Correlació a Eines d'anàlisi . A continuació, feu clic a D'acord .
- Al quadre Correlació , seleccioneu l'interval d'entrada $C$4:$D$10 .
- A continuació, al camp Agrupat per , seleccioneu Columnes ja que les variables s'agrupen com a columnes.
- Després, comproveu Etiquetes a la primera fila .
- A continuació, a les Opcions de sortida, seleccioneu Interval de sortida . joheu seleccionat $B$12 aquí.
- Finalment, feu clic a D'acord . Tindreu tots els valors de correlació entre les variables.
En aquest exemple, només hi ha dues variables. Així, els coeficients de correlació es mostren com una matriu 2X2 amb totes les combinacions de variables.
Llegir més: Com fer una matriu de correlació a Excel ( 2 enfocaments útils)
Conclusió
Això conclou la guia sobre com calcular el coeficient de correlació de Pearson a Excel. Espero que hagis trobat aquesta guia útil i informativa. Si teniu cap pregunta o suggeriment per a nosaltres, feu-nos-ho saber a continuació. Per obtenir més guies com aquesta, visiteu Exceldemy.com .