Оглавление
Сайт коэффициент корреляции это одна из тех вещей, с которыми вы очень часто сталкиваетесь в статистическом анализе. Коэффициент корреляции Пирсона - это простой, но эффективный способ выразить линейное корреляция между двумя переменными Excel, будучи инструментом анализа данных, предоставляет несколько отличных способов расчета коэффициентов корреляции. В этом учебном пособии я покажу вам, как рассчитать коэффициент корреляции Пирсона в Excel.
Скачать Практическое пособие
Набор данных, использованный для этого примера, прикреплен ниже для справки. Вы можете загрузить его отсюда и попробовать выполнить все шаги самостоятельно по мере изучения методов.
Рассчитать коэффициент корреляции Пирсона.xlsx
Что такое коэффициент корреляции Пирсона?
Как упоминалось ранее, коэффициент корреляции Пирсона - это измерение линейной корреляции между двумя переменными. Говоря математическим языком, он представляет собой отношение ковариации и произведения стандартного отклонения двух переменных. В формуле коэффициент корреляции Пирсона (r) двух переменных X и Y будет иметь вид
Из-за характера этой формулы коэффициент корреляции всегда дает значение от -1 до 1. В некоторых случаях значение может быть равно 0, что указывает на отсутствие корреляции между переменными. В других крайних случаях значение -1 или 1 указывает на идеальную отрицательную или положительную линейную корреляцию между двумя переменными. Таким образом, в общем случае, чем ближе значение к 0, тем ниже корреляция.чем дальше от 0 находится значение, тем выше корреляция.
Например, размер обуви и размер ноги как две переменные всегда будут иметь идеальную положительную корреляцию. Посмотрите на следующий набор данных.
Поскольку размер обуви увеличивался по мере увеличения размера стопы, это указывает на положительную линейную корреляцию.
Но большинство переменных в реальных сценариях не представляют собой корреляцию. В большинстве случаев коэффициент корреляции будет ближе к нулю. Например, рассмотрим размер стопы с IQ человека.
В результате график будет выглядеть примерно так, что указывает на отсутствие линейной корреляции между двумя переменными.
4 простых способа вычисления коэффициента корреляции Пирсона в Excel
В Excel существует несколько методов расчета коэффициента корреляции Пирсона. Во-первых, вы можете рассчитать значения вручную и найти значение по формуле, описанной выше. Также в Excel есть две специальные функции для поиска корреляций и корреляций Пирсона между переменными. Существует также надстройка, которую вы можете использовать для поиска корреляций между двумя переменными.
Для демонстрации всех методов я буду использовать один и тот же набор данных.
Я рассмотрел каждый метод в соответствующих подразделах. Следуйте каждому из них, чтобы найти подходящий для вас метод. Или, если у вас на уме какой-то конкретный метод, найдите его в таблице выше.
1. Рассчитать коэффициент корреляции Пирсона в Excel вручную
Для расчета коэффициента корреляции Пирсона между двумя переменными в Excel всегда существует старый школьный метод "вручную". В случае, если вы следуете этому методу, вам нужно найти все значения средних, разностей, квадратов и сумм и рассчитать коэффициент корреляции Пирсона на их основе вручную. Я буду рассматривать возраст как переменную X, а индекс массы тела как переменную Y из файлаформулу и найти значение r. Мы наткнемся на СРЕДНЕЕ , SUM , и SQRT функции в этом методе.
Для получения подробного руководства выполните следующие действия.
Шаги:
- Сначала найдите средний возраст, написав следующую формулу. Я выделил ячейку C12 к значению среднего возраста.
= СРЕДНЕЕ(C5:C10)
- Затем найдите среднее значение ИМТ, написав следующую формулу.
= СРЕДНЕЕ(D5:D10)
Я выбрал ячейку D12 для хранения значения.
- Теперь, чтобы выяснить X i -X̅ , запишите следующую формулу.
=C5-$C$12
- Теперь нажмите Войти .
- Затем снова выделите ячейку. Теперь нажмите и перетащите ячейку в ячейку Значок ручки заполнения заполнить оставшуюся часть колонки.
- Аналогичным образом узнайте значение Y i -Y̅ написав следующую формулу.
=D5-$D$12
- Таким же образом нажмите Enter. Затем заполните оставшуюся часть столбца с помощью клавиш Значок ручки заполнения .
- Теперь узнайте значение (X i -X̅)*(Y i -Y̅) по формуле:
=F5*G5
- Нажмите и перетащите Значок ручки заполнения заполнить оставшуюся часть колонки, как показано выше.
- Теперь узнайте (X i -X̅)2 запишите следующую формулу:
=F5*F5
- Нажмите и перетащите Значок ручки заполнения заполнить оставшуюся часть колонки.
- Чтобы узнать значение (Y i -Y̅)2 запишите следующую формулу:
=G5*G5
- Нажмите и перетащите Значок ручки заполнения как показано выше. Он заполнит значения для остальных столбцов.
- Чтобы найти сумму (X i -X̅)*(Y i -Y̅) запишите следующую формулу. Затем нажмите Войти .
=SUM(H5:H10)
- Чтобы найти сумму (X i -X̅)2 и (Y i -Y̅)2 в этом листе, нажмите и перетащите Значок ручки заполнения справа, чтобы заполнить строку той же формулой.
- Наконец, для нахождения коэффициента Пирсона запишите следующую формулу. Я использовал ссылки на ячейки конкретного листа.
=H12/SQRT(I12*J12)
- Теперь нажмите Войти на клавиатуре. В этот момент вы получите коэффициент Пирсона для двух переменных (возраст и ИМТ) вручную.
Читать далее: Как рассчитать коэффициент внутриклассовой корреляции в Excel
2. Использование функции PEARSON для расчета коэффициента корреляции Пирсона
Основной метод нахождения коэффициента корреляции Пирсона в Excel - это сравнительно долгий процесс. Напротив, использование функций для определения коэффициента корреляции Пирсона - это быстрый и простой процесс, который оставляет долгие вычисления в Excel и просто находит значение коэффициента корреляции двух переменных.
В Excel есть специальный PEARSON функция для нахождения коэффициента корреляции двух переменных из значений. Функция принимает два массива в качестве аргументов и возвращает коэффициент корреляции Пирсона.
Для получения более подробного руководства выполните следующие действия.
Шаги:
- Сначала выберите ячейку, в которую вы хотите поместить возвращаемое значение. Я выбрал ячейку D12 для демонстрации.
- Запишите в ячейке следующую формулу.
=PEARSON(C5:C10,D5:D10)
- Затем нажмите Войти на клавиатуре. Вы получите коэффициент корреляции Пирсона напрямую.
Читайте также: Как найти коэффициент ранговой корреляции Спирмена в Excel (2 способа)
3. Использование функции КОРРЕЛ в Excel
Существует еще одна специальная функция, позволяющая узнать значение коэффициентов корреляции между двумя переменными, это функция КОРРЕЛ Как и предыдущая функция, эта функция также принимает два массива в качестве аргументов и возвращает значение коэффициента корреляции между ними, что аналогично коэффициенту корреляции Пирсона.
Для получения более подробного руководства выполните следующие действия.
Шаги:
- Сначала выберите ячейку, в которую вы хотите сохранить значение. Я выбрал ячейку D12 здесь для этой цели.
- Затем запишите в ячейке следующую формулу.
=CORREL(C5:C10,D5:D10)
- Теперь нажмите Войти на клавиатуре. Таким образом, вы получите значение коэффициента корреляции.
Читать далее: Как рассчитать значение P для корреляции Спирмена в Excel
4. Вычислить коэффициент корреляции Пирсона в Excel с помощью надстроек
В дополнение к предыдущим описанным методам, в Excel также есть надстройка для определения коэффициента корреляции между двумя переменными. Вам нужно добавить в надстройку Анализ данных Этот метод особенно полезен, если вам нужен коэффициент корреляции между более чем двумя переменными одновременно.
Выполните следующие шаги, чтобы добавить инструмент и найти коэффициент корреляции.
Шаги:
- Сначала зайдите в Файл на вкладке ленты и выберите Опции .
- An Параметры Excel появится окно. Выберите Дополнения вкладку из него.
- Кроме того, Управляйте , убедитесь, что Надстройки Excel выбрана опция.
- После этого нажмите на кнопку Перейти .
- Далее, в Дополнения в появившемся окне установите флажок Пакет инструментов анализа После этого нажмите на OK Теперь у вас будет Анализ данных доступные инструменты.
- Теперь перейдите к Данные на вкладке ленты.
- Затем, в Анализ группу, выберите Анализ данных .
- Далее, в Анализ данных выберите Корреляция из Инструменты анализа Затем нажмите на OK .
- В Корреляция выберите диапазон ввода $C$4:$D$10 .
- Затем в Сгруппированные по поле, выберите Колонки поскольку переменные сгруппированы в виде столбцов.
- После этого проверьте Ярлыки в первом ряду .
- Затем в Варианты вывода, выберите Выходной диапазон Я выбрал $B$12 здесь.
- Наконец, нажмите на OK Вы получите все значения корреляции между переменными.
В данном примере имеется только две переменные. Поэтому коэффициенты корреляции отображаются в виде 2X2 матрица со всеми комбинациями переменных.
Читать далее: Как составить корреляционную матрицу в Excel (2 удобных подхода)
Заключение
На этом мы завершаем руководство по расчету коэффициента корреляции Пирсона в Excel. Надеемся, вы нашли это руководство полезным и информативным. Если у вас есть вопросы или предложения к нам, сообщите нам об этом ниже. Для получения других руководств, подобных этому, посетите сайт Exceldemy.com .