Як розрахувати коефіцієнт кореляції Пірсона в Excel (4 способи)

  • Поділитися Цим
Hugh West

На сьогоднішній день, на жаль, це не так. коефіцієнт кореляції є однією з тих речей, з якими дуже часто стикаються в статистичному аналізі. Коефіцієнт кореляції Пірсона - це простий, але ефективний спосіб виразити лінійну залежність між кореляція між двома змінними Excel, будучи інструментом аналізу даних, надає кілька відмінних способів розрахунку коефіцієнтів кореляції. У цьому уроці я покажу вам, як розрахувати коефіцієнт кореляції Пірсона в Excel.

Завантажити Практичний посібник

Набір даних, використаний для цього прикладу, додається нижче для довідки. Ви можете завантажити його звідси і спробувати виконати кроки самостійно, коли будете проходити через методи.

Розрахувати коефіцієнт кореляції Пірсона.xlsx

Що таке коефіцієнт кореляції Пірсона?

Як згадувалося раніше, коефіцієнт кореляції Пірсона є мірою лінійної кореляції між двома змінними. Математично кажучи, це відношення коваріації та добутку стандартного відхилення двох змінних. У формулі коефіцієнт кореляції Пірсона (r) для двох змінних X та Y буде мати вигляд

Через природу цієї формули коефіцієнт кореляції завжди дає значення від -1 до 1. У деяких випадках значення може дорівнювати 0, що вказує на відсутність кореляції між змінними. В інших крайніх випадках значення -1 або 1 вказує на ідеальну негативну або позитивну лінійну кореляцію між ними. Таким чином, загалом, чим ближче значення до 0, тим менша кореляція.чим далі від 0 значення, тим вища кореляція.

Наприклад, розмір взуття та розмір стопи як дві змінні завжди матимуть ідеальну позитивну кореляцію. Погляньте на наступний набір даних.

Оскільки розмір взуття збільшувався зі збільшенням розміру ноги, це свідчить про позитивну лінійну кореляцію.

Але більшість змінних у реальних сценаріях не мають кореляції. У більшості випадків коефіцієнт кореляції буде ближчим до нуля. Наприклад, розглянемо розмір ноги з IQ людини.

В результаті графік буде виглядати приблизно так, що вказує на відсутність лінійної кореляції між двома змінними.

4 простих способи розрахунку коефіцієнта кореляції Пірсона в Excel

В Excel існує кілька методів розрахунку коефіцієнта кореляції Пірсона. По-перше, можна розрахувати значення вручну і дізнатися значення за формулою, описаною вище. Також в Excel є дві спеціальні функції для знаходження кореляцій і кореляцій Пірсона між змінними. Існує також інструмент надбудови, який можна використовувати для знаходження кореляцій між двома змінними.

Щоб продемонструвати всі методи, я буду використовувати той самий набір даних нижче.

Я розглянув кожен метод у відповідних підрозділах. Дотримуйтесь кожного з них, щоб знайти відповідний для вас. Або, якщо ви маєте на увазі конкретний метод, знайдіть його в таблиці вище.

1. розрахувати коефіцієнт кореляції Пірсона в Excel вручну

Для розрахунку коефіцієнта кореляції Пірсона між двома змінними в Excel завжди є старий добрий метод "вручну". У разі, якщо ви будете слідувати цьому методу, вам потрібно дізнатися всі значення середніх, різниць, квадратів і сум і розрахувати з них коефіцієнт кореляції Пірсона вручну. Я буду розглядати вік як змінну X і ІМТ як змінну Y з таблиціі знайдемо значення r. Натрапимо на формулу СЕРЕДНІЙ , СУМА , і SQRT функціонує в цьому методі.

Для отримання детальної інструкції виконайте наступні кроки.

Сходинки:

  • Спочатку знайдемо середній вік, записавши наступну формулу. Я виділив комірку C12 до значення середнього віку.

=СЕРЕДНЄ(C5:C10)

  • Потім дізнайтеся середнє значення ІМТ, записавши наступну формулу.

=СЕРЕДНЄ(D5:D10)

Я вибрав комірку D12 для зберігання цінності.

  • Тепер, щоб з'ясувати X i -X̅ запишемо наступну формулу.

=C5-$C$12

  • Тепер натисніть Увійдіть .
  • Потім знову виділіть комірку. Тепер клацніть і перетягніть Піктограма ручки заповнення заповнити решту колонки.

  • Аналогічним чином з'ясуйте значення Y i -Y̅ записавши наступну формулу.

=D5-$D$12

  • Аналогічним чином натискаємо Enter, після чого заповнюємо решту колонки за допомогою клавіш Піктограма ручки заповнення .

  • А тепер дізнайтеся про значення (X i -X̅)*(Y i -Y̅) за формулою:

=F5*G5

  • Натисніть і перетягніть кнопку Піктограма ручки заповнення заповнити решту колонки, як показано вище.

  • А тепер дізнайтеся (X i -X̅)2 запишемо наступну формулу:

=F5*F5

  • Натисніть і перетягніть кнопку Піктограма ручки заповнення заповнити решту колонки.

  • Щоб дізнатися вартість (Y i -Y̅)2 запишемо наступну формулу:

=G5*G5

  • Натисніть і перетягніть кнопку Піктограма ручки заповнення Він заповнить значення для решти стовпчика.

  • Знайти суму (X i -X̅)*(Y i -Y̅) запишіть наступну формулу. Потім натисніть Увійдіть .

=SUM(H5:H10)

  • Знайти суму (X i -X̅)2 і (Y i -Y̅)2 на цьому аркуші натисніть і перетягніть Піктограма ручки заповнення праворуч заповнити рядок з такою ж формулою.

  • Нарешті, щоб знайти коефіцієнт Пірсона, запишіть наступну формулу. Я використовував посилання на комірки конкретного аркуша.

=H12/SQRT(I12*J12)

  • Тепер натисніть Увійдіть В цей момент ви отримаєте коефіцієнт Пірсона для двох змінних (вік та ІМТ) вручну.

Читати далі: Як розрахувати коефіцієнт внутрішньокласової кореляції в Excel

2. використання функції Пірсона для розрахунку коефіцієнта кореляції Пірсона

Базовий метод знаходження коефіцієнта кореляції Пірсона в Excel є порівняно довгим процесом. На відміну від нього, використання функцій для знаходження коефіцієнта кореляції Пірсона є швидким і простим процесом, який залишає довгі обчислення Excel і просто знаходить значення коефіцієнта кореляції двох змінних.

В Excel є спеціальна функція ПЕРСОН функція для знаходження коефіцієнта кореляції двох змінних за значеннями. Функція отримує в якості аргументів два масиви і повертає коефіцієнт кореляції Пірсона.

Для більш детального ознайомлення перейдіть за посиланнями.

Сходинки:

  • Спочатку виберіть комірку, в яку ви хочете помістити значення, що повертається. Я вибрав комірку D12 для демонстрації.

  • Запишіть у клітинку наступну формулу.

=PEARSON(C5:C10,D5:D10)

  • Потім натисніть Увійдіть на клавіатурі, і ви отримаєте безпосередньо коефіцієнт кореляції Пірсона.

Читати далі: Як знайти коефіцієнт рангової кореляції Спірмена в Excel (2 способи)

3. використання функції КОРРЕЛ в Excel

Існує ще одна спеціальна функція для знаходження значення коефіцієнтів кореляції між двома змінними, а саме функція CORREL Як і попередня функція, ця функція також приймає в якості аргументів два масиви і повертає значення коефіцієнта кореляції між ними, що збігається з коефіцієнтом кореляції Пірсона.

Для більш детального ознайомлення з інструкцією виконайте наступні кроки.

Сходинки:

  • Спочатку виберіть комірку, в яку ви хочете зберегти значення. Я вибрав комірку D12 з цією метою.

  • Потім запишіть у клітинку наступну формулу.

=CORREL(C5:C10,D5:D10)

  • Тепер натисніть Увійдіть Таким чином, ви отримаєте значення коефіцієнта кореляції.

Читати далі: Як розрахувати значення P для кореляції Спірмена в Excel

4. розрахувати коефіцієнт кореляції Пірсона в Excel за допомогою надбудов

Крім описаних раніше способів, в Excel також є надбудова, що дозволяє дізнатися коефіцієнт кореляції між двома змінними. Для цього потрібно додати в поле Аналіз даних Цей метод особливо корисний, якщо вам потрібен коефіцієнт кореляції між більш ніж двома змінними одночасно.

Щоб додати інструмент та знайти коефіцієнт кореляції, виконайте наступні дії.

Сходинки:

  • По-перше, зайдіть на сайт Файл у вашій стрічці і виберіть Опції .
  • An Параметри Excel з'явиться вікно, в якому виберіть пункт Надбудови вкладка з нього.
  • Крім того Керувати переконайтеся в тому, що Надбудови для Excel обрано опцію "Вимкнути".
  • Після цього натисніть на Іди. .

  • Далі, в рамках Надбудови У вікні, що з'явилося, встановіть прапорець Інструментарій для аналізу Після цього натисніть на кнопку ГАРАЗД. Зараз ви отримаєте свій Аналіз даних доступні інструменти.

  • Тепер перейдіть до Дані у вашій стрічці.
  • Потім, в рамках Аналіз групу, виберіть Аналіз даних .

  • Далі, в рамках Аналіз даних у вікні, виберіть Кореляція від Інструменти аналізу Потім натисніть на ГАРАЗД. .

  • В рамках проекту Кореляція виберіть діапазон вхідних даних C$4:D$10 .
  • Потім у Згруповано за поле, виберіть Колонки оскільки змінні згруповані у вигляді стовпчиків.
  • Після цього перевірте Етикетки в першому ряду .
  • Потім у Вихідні дані, вибрати Вихідний діапазон Я вибрав $B$12 тут.

  • Нарешті, натисніть на ГАРАЗД. Ви будете мати всі значення кореляції між змінними.

У цьому прикладі є лише дві змінні, тому коефіцієнти кореляції відображаються у вигляді 2X2 матриця з усіма комбінаціями змінних.

Читати далі: Як створити кореляційну матрицю в Excel (2 зручних підходи)

Висновок

На цьому ми завершуємо інструкцію про те, як розрахувати коефіцієнт кореляції Пірсона в Excel. Сподіваємося, ви знайшли цю інструкцію корисною та інформативною. Якщо у вас виникли питання або пропозиції до нас, дайте нам знати нижче. Щоб отримати більше подібних інструкцій, відвідайте Exceldemy.com .

Г’ю Вест — досвідчений тренер і аналітик Excel із понад 10-річним досвідом роботи в галузі. Він має ступінь бакалавра з бухгалтерського обліку та фінансів і ступінь магістра з ділового адміністрування. Г’ю має пристрасть до викладання та розробив унікальний підхід до викладання, який легко зрозуміти та дотримуватися. Його експертне знання Excel допомогло тисячам студентів і професіоналів у всьому світі вдосконалити свої навички та досягти успіху в кар’єрі. У своєму блозі Г’ю ділиться своїми знаннями зі світом, пропонуючи безкоштовні навчальні посібники з Excel та онлайн-навчання, щоб допомогти окремим особам і компаніям повністю розкрити свій потенціал.