Съдържание
Сайтът коефициент на корелация Коефициентът на корелация на Пиърсън е прост, но ефективен начин за изразяване на линейната зависимост между корелация между две променливи . Excel, като инструмент за анализ на данни, предлага някои отлични начини за изчисляване на корелационни коефициенти. В този урок ще ви покажа как да изчислите корелационния коефициент на Пиърсън в Excel.
Изтегляне на работна тетрадка за практика
Наборът от данни, използван за този пример, е приложен по-долу за справка. Можете да го изтеглите оттук и сами да опитате стъпките, докато преминавате през методите.
Изчисляване на коефициента на корелация на Пиърсън.xlsx
Какво представлява корелационният коефициент на Пиърсън?
Както беше споменато по-рано, коефициентът на корелация на Пиърсън е мярка за линейна корелация между две променливи. Математически погледнато, той е съотношението на ковариацията и произведението на стандартното отклонение на двете променливи. Във формулата коефициентът на корелация на Пиърсън (r) на две променливи X и Y ще бъде
Поради естеството на тази формула коефициентът на корелация винаги води до стойност между -1 и 1. В някои случаи стойността може да бъде 0, което показва липса на корелация между променливите. За други крайни случаи стойност от -1 или 1 показва перфектна отрицателна или положителна линейна корелация между двете. Така че, най-общо казано, колкото по-близо е стойността до 0, толкова по-ниска е корелацията.колкото по-далеч от 0 е стойността, толкова по-висока е корелацията.
Например размерът на обувките и размерът на стъпалото като две променливи винаги ще имат перфектна положителна корелация. Разгледайте следната съвкупност от данни.
Тъй като размерът на обувките се увеличава с нарастването на размера на стъпалото, това показва положителна линейна корелация.
Но повечето от променливите в сценариите от реалния живот не представляват корелация. В повечето случаи коефициентът на корелация би бил по-близък до нулата. Например нека разгледаме размера на краката с коефициента на интелигентност на човека.
В резултат на това графиката ще изглежда по следния начин, което показва, че между двете променливи няма линейна корелация.
4 лесни начина за изчисляване на коефициента на корелация на Пиърсън в Excel
В Excel има няколко метода за изчисляване на коефициента на корелация на Пиърсън. Първо, можете да изчислите стойностите ръчно и да откриете стойността на формулата, описана по-горе. Също така Excel има две специални функции за откриване на корелации и корелации на Пиърсън между променливи. Има и инструмент за добавяне, който можете да използвате, за да откриете корелациите между две променливи.
За да демонстрирам всички методи, ще използвам същия набор от данни по-долу.
Прегледах всеки метод в съответните му подраздели. Следвайте всеки от тях, за да намерите подходящия за вас. Или ако имате предвид конкретен метод, намерете го в таблицата по-горе.
1. Изчисляване на корелационния коефициент на Пиърсън в Excel ръчно
Винаги съществува старият метод "на ръка" за изчисляване на коефициента на корелация на Пиърсън между две променливи в Excel. В случай че следвате този метод, трябва да откриете всички стойности на средните стойности, разликите, квадратите и сумите и да изчислите коефициента на корелация на Пиърсън от тях ръчно. Ще разглеждам възрастта като променлива X и ИТМ като променлива Y отформула и да намерите стойността на r. Ние ще се сблъскат с СРЕДНА СТОЙНОСТ , SUM , и SQRT функции в този метод.
За да получите подробно ръководство, следвайте следните стъпки.
Стъпки:
- Първо, намерете средната възраст, като напишете следната формула. Избрах клетка C12 до стойността на средната възраст.
=СРЕДНА СТОЙНОСТ(C5:C10)
- След това намерете средната стойност на ИТМ, като напишете следната формула.
=СРЕДНА СТОЙНОСТ(D5:D10)
Избрах клетка D12 за съхраняване на стойността.
- Сега, за да разберете X i -X̅ , запишете следната формула.
=C5-$C$12
- Сега натиснете Въведете .
- След това изберете отново клетката. Сега щракнете и плъзнете Икона на дръжката за запълване за да попълните останалата част от колоната.
- По подобен начин намерете стойността на Y i -Y̅ като напишете следната формула.
=D5-$D$12
- По същия начин натиснете Enter. След това попълнете останалата част от колоната с Икона на дръжката за запълване .
- Сега намерете стойността на (X i -X̅)*(Y i -Y̅) като използвате формулата:
=F5*G5
- Кликнете и плъзнете Икона на дръжката за запълване за да попълните останалата част от колоната, както е показано по-горе.
- Сега разберете (X i -X̅)2 запишете следната формула:
=F5*F5
- Кликнете и плъзнете Икона на дръжката за запълване за да попълните останалата част от колоната.
- За да разберете стойността на (Y i -Y̅)2 запишете следната формула:
=G5*G5
- Кликнете и плъзнете Икона на дръжката за запълване ще попълни стойностите за останалата част от колоната.
- Намиране на сумата на (X i -X̅)*(Y i -Y̅) запишете следната формула. След това натиснете Въведете .
=SUM(H5:H10)
- Намиране на сумата на (X i -X̅)2 и (Y i -Y̅)2 в този лист, щракнете и плъзнете Икона на дръжката за запълване надясно, за да попълните реда със същата формула.
- Накрая, за да намерите коефициента на Пирсън, запишете следната формула. Използвах препратките към клетките на конкретния лист.
=H12/SQRT(I12*J12)
- Сега натиснете Въведете В този момент ще разполагате с коефициента на Пиърсън на двете променливи (възраст и ИТМ) ръчно.
Прочетете още: Как да изчислим коефициента на вътрешнокласова корелация в Excel
2. Използване на функцията PEARSON за изчисляване на коефициента на корелация на Пиърсън
Основният метод за намиране на коефициента на корелация на Пиърсън в Excel е сравнително дълъг процес. Напротив, използването на функции за намиране на коефициента на корелация на Пиърсън е бърз и лесен процес, който оставя дългите изчисления на Excel и просто намира стойността на коефициента на корелация на две променливи.
Excel има специален PEARSON функция за намиране на коефициента на корелация на две променливи от стойностите. Функцията приема два масива като аргументи и връща коефициента на корелация на Пиърсън.
За по-подробно ръководство следвайте стъпките.
Стъпки:
- Първо, изберете клетката, в която искате да поставите върнатата стойност. Аз избрах клетката D12 за демонстрация.
- Запишете следната формула в клетката.
=PEARSON(C5:C10,D5:D10)
- След това натиснете Въведете ще получите директно коефициента на корелация на Пиърсън.
Прочетете още: Как да намерите коефициента на корелация на Спирман в Excel (2 начина)
3. Използване на функцията CORREL в Excel
Съществува и друга специална функция за определяне на стойността на корелационните коефициенти между две променливи. функцията CORREL Подобно на предишната функция, тази функция също приема два масива като аргументи и връща стойността на коефициента на корелация на двата масива, което е същото като коефициента на корелация на Пиърсън.
За по-подробно ръководство следвайте тези стъпки.
Стъпки:
- Първо, изберете клетката, в която искате да съхраните стойността. Аз избрах клетката D12 тук за тази цел.
- След това запишете следната формула в клетката.
=CORREL(C5:C10,D5:D10)
- Сега натиснете Въведете Така ще получите стойността на коефициента на корелация.
Прочетете още: Как да изчислите стойността P за корелация на Спирман в Excel
4. Изчисляване на коефициента на корелация на Пиърсън в Excel с помощта на добавки
В допълнение към описаните предишни методи Excel разполага и с добавка за установяване на коефициента на корелация между две променливи. Трябва да добавите в Анализ на данните инструмент, за да откриете коефициента при този метод. Този метод е особено полезен, ако искате да получите коефициент на корелация между повече от две променливи едновременно.
Следвайте следните стъпки, за да добавите инструмента и да намерите коефициента на корелация.
Стъпки:
- Първо, отидете в Файл в лентата и изберете Опции .
- Един Опции за Excel Ще се появи поле. Изберете Добавки таб от него.
- Освен Управление на , уверете се, че Добавки за Excel е избрана опцията.
- След това кликнете върху Отидете на .
- След това в Добавки в появилото се поле, маркирайте Инструменти за анализ . След това щракнете върху ОК Сега ще имате своя Анализ на данните налични инструменти.
- Сега отидете в Данни в лентата.
- След това в Анализ група, изберете Анализ на данните .
- След това в Анализ на данните изберете Корелация от Инструменти за анализ След това щракнете върху OK .
- В Корелация изберете обхвата за въвеждане $C$4:$D$10 .
- След това в Групирани по изберете Колони тъй като променливите са групирани като колони.
- След това проверете Етикети в първия ред .
- След това в Възможности за извеждане, изберете Изходен обхват . Избрах $B$12 тук.
- Накрая щракнете върху ОК . Ще разполагате с всички стойности на корелацията между променливите.
В този пример има само две променливи, така че коефициентите на корелация се показват като 2Х2 матрица с всички комбинации от променливи.
Прочетете още: Как да направим корелационна матрица в Excel (2 удобни подхода)
Заключение
С това завършва ръководството за изчисляване на коефициента на корелация на Пиърсън в Excel. Надяваме се, че това ръководство ви е било полезно и информативно. Ако имате въпроси или предложения към нас, споделете ги по-долу. За повече ръководства като това посетете Exceldemy.com .