Как да тълкуваме резултатите от регресията в Excel (подробен анализ)

  • Споделя Това
Hugh West

Регресионният анализ се използва в почти всички видове статистически софтуер, като SPSS , R, Регресията може да ни даде цялостна представа за връзките между променливите. Линейната регресия може да се направи доста бързо в Excel с помощта на Анализ на данните Тази статия ще покаже как можете да интерпретиране на резултатите от регресията в Excel.

Изтегляне на работна тетрадка за практика

Изтеглете тази работна тетрадка по-долу.

Интерпретиране на резултатите от регресията.xlsx

Какво е регресия?

Регресионният анализ често се използва при анализа на данни за определяне на връзките между множество променливи. Регресионният анализ ви позволява да изберете какво ще се случи със зависимата променлива, ако се промени една от независимите променливи. Той също така ви позволява да разберете математически кои независими променливи оказват влияние.

Проста линейна регресия е различен от a множествена линейна регресия в статистиката. Използване на линейна функция, проста линейни регресионни анализи връзката между променливите и една независима променлива. Множествена линейна регресия е, когато за определяне на променливите се използват два или повече обяснителни фактора. Използването на нелинейна регресия вместо зависимата променлива се описва като нелинейна функция, тъй като връзките между данните не са линейни. В тази статия ще се съсредоточим върху множествена линейна регресия за да покажете как можете да интерпретиране на резултатите от регресията в Excel.

Стъпки за извършване на регресия в Excel

За целите на регресията ще използваме следния набор от данни за целите на анализа. Тук независимата променлива ще бъде Цена колона и Продава се колона. независим колоната ще бъде Търсене колона.

Стъпки

  • Трябва да отидем в Данни и щракнете върху Анализ на данните за извършване на регресия .

  • Ще се появи нов прозорец; изберете обхвата на данните за зависимата и независимата променлива.
  • След това маркирайте Етикети кутия и Доверие кутия.
  • След това щракнете върху полето за обхват на изходната клетка, за да изберете адреса на изходната клетка
  • След това поставете отметка върху Остатъчен за изчисляване на остатъчните стойности.
  • След това маркирайте Остатъчен парцели и Кутии за линейно напасване
  • Кликнете върху OK след това.

  • След като щракнете върху ДОБРЕ, основните изходни параметри на анализа ще бъдат в посочените клетки.

  • След това ще получите и някои параметри, като например Значение стойност и т.н. в ANOVA ( Анализ на отклоненията ) таблица.
  • Тук, df обозначава степента на свобода, свързана с източника на дисперсия.
  • SS Вашият модел ще отразява по-добре данните, ако Остатъчен SS е по-малък от Общо SS.
  • MS означава квадрат.
  • F обозначава F -проверка на нулевата хипотеза.
  • Значимост F обозначава P -стойност на F .

  • След това ще получите и коефициентите на променливата, стойността на значимостта и т.н. в таблица.

  • След това ще получите окончателна таблица под таблицата с коефициентите, която съдържа остатъчната стойност за всеки запис.

  • След това ще получите Търсене срещу Цена регресионна диаграма с линия на тенденцията.

  • След това получавате Търсене срещу Продава се регресионна диаграма с линия на тенденцията.

  • Има още една диаграма, показваща разпределението на остатъчните стойности на всеки запис от Продава се променлива.

  • Има още една диаграма, показваща разпределението на остатъчните стойности на всеки запис от Цена променлива.

След това ще ви покажем как можете да интерпретирате тези регресионни резултати в Excel.

Прочетете още: Как се прави логистична регресия в Excel (с бързи стъпки)

Как да интерпретираме резултатите от регресията в Excel

Следващото нещо, което трябва да направите след извършването на регресионния анализ, и да ги интерпретирате. Резултатите са описани и подробно разгледани по-долу.

Анализ на стойността на множествената регресия с R-квадрат

Сайтът R-квадрат числото показва колко тясно са свързани елементите на набора от данни и колко добре регресионната линия съответства на данните. Ще използваме множествения линеен регресионен анализ, при който ще определим влиянието на две или повече променливи върху основния фактор. Това се отнася до начина, по който зависимата променлива се променя при промяна на една от независимите променливи. диапазонът на този коефициент е от-1 до 1. Тук,

  • 1 означава близка положителна връзка
  • 0 означава, че няма връзки между променливите. С други думи, точките на данните са случайни.
  • -1 означава обратна или отрицателна връзка между променливите.

В резултатите, показани по-горе, многократната R-стойност на дадените набори от данни е o.7578( приблизително ), което показва силна връзка между променливите.

R квадрат

R квадрат В нашия случай стойността е 0,574 (приблизително), което може да се тълкува като сравнително добра връзка между променливите.

Коригиран R-квадрат

Това е просто алтернативна версия на R квадрат Това просто разбърква предиктор променливи при прогнозиране на отговор променлива. Тя се изчислява като

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Тук, R^2 : The R^2 стойността, която получихме от набора от данни.

n : броят на наблюденията.

K : броят на прогнозните променливи.

Значението на тази стойност възниква при регресионен анализ между две предиктор променливи. Ако има повече от една предиктор в набора от данни, тогава стойността на R square ще бъде завишена, което е крайно нежелателно. R квадрат стойност коригира тази инфлация и дава точна представа за променливите.

Стандартна грешка

Друга метрика за добро съответствие, която показва точността на регресионния анализ; колкото по-ниска е стойността, толкова по-сигурни можете да бъдете в регресионния си анализ.

Стандартна грешка е емпирична метрика, представяща средното разстояние, на което точките се отклоняват от линията на тенденцията, R2 представлява делът на вариацията на зависимата променлива. В този случай стойността на Стандартна грешка е 288,9 ( приблизително ), което означава, че нашите точки от данни се отдалечават средно на 288,9 от линията на тенденцията.

Наблюдения

Посочете броя на наблюденията или вписванията.

Определяне на значимата променлива

Сайтът Стойност на значимост показва надеждността (статистическата обоснованост) на нашия анализ. С други думи, тя обозначава вероятността нашата съвкупност от данни да е грешна. Тази стойност трябва да е под 5 %. Но в този случай нашата стойност на значимост е 0,00117, което означава 0,1 %, което е доста под 5 %. Така че нашият анализ е наред. В противен случай може да се наложи да изберем различни променливи за нашия анализ.

P-стойност в регресионния анализ

Тясно свързан със значима стойност, P-стойност обозначава вероятността стойността на коефициента да е грешна. Р-стойността обозначава връзката на нулевата хипотеза с променливите.

Ако вашият p-стойност < Значение число, има достатъчно доказателства за отхвърляне на хипотезата за нулевата стойност. Това означава, че между променливите има ненулева корелация.

Но ако p-стойност > Значение Това означава, че между променливите не може да има корелация.

Във всеки случай P-стойност на променливата Цена =0,000948 <0,00117 (стойност на значимост),

Така че тук няма нулева хипотеза и има достатъчно доказателства, за да се обяви корелация между променливите.

От друга страна, за променливата Продава се , (Р-стойност) 0,0038515 <0,0011723 (стойност на значимост)

Така че тук може да има нулева хипотеза и да няма достатъчно доказателства, за да се обяви, че между променливите има ненулева корелация.

В повечето случаи тази P-стойност определя дали дадена променлива ще бъде в набора от данни, или не. Продава се променлива, за да се запази устойчивостта на набора от данни.

Регресионно уравнение

Тъй като определяме линейния регресионен анализ в Excel, линията на тенденцията също трябва да е линейна. Общата форма е:

Y=mX+C.

Тук, Y е зависимата променлива.

А Х е независимата променлива тук, което означава, че ще определим ефекта от промяната на променливата Х върху променливата Y.

C ще бъде просто стойността на пресечната точка на линията по оста Y.

В този случай стойността на пресечната точка С е равна на 9502,109853

Стойността на m за двете променливи е -809,265 и 0,424818.

Така получаваме окончателното уравнение за двете отделни променливи.

Първият е:

Y=-809.265771X+9502.12

А уравнението за втората променлива е:

Y=0,4248X+9502,12

Коефициенти

Коефициентите, които получихме, са m1=-809.2655 и m2=04248 . И прихващач, C= 9502.12 .

  • Първо, стойността на интерцептора показва, че търсенето ще бъде 9502, когато цената е нула.
  • И стойностите на m Стойността на ценовия коефициент е -809,265, което означава, че увеличението на цената за единица ще намали търсенето с около 809 единици.
  • За втората променлива, Продадено, стойността m е 0,424. Това означава, че промяната на единица продадена стока ще доведе до 0424-кратно увеличение на единица продукт.

Остатъчни стойности

Сайтът Остатъчен разликата между оригиналния и изчисления запис от регресионната линия е разликата. Остатъчни стойности показват колко далече е действителната стойност от линията. Например, изчислената стойност от регресионния анализ за първия запис е 9497. А първата оригинална стойност е 9500. Така че остатъчната стойност е около 2,109.

T-статистика Стойност

Стойността на Т-статистиката е делението на коефициента на стандартната стойност. Колкото по-висока е стойността, толкова по-голяма надеждност показва коефициентът.

Тази стойност има и друго значение, което се изисква, за да изчисляване на P-стойността.

95% доверителен интервал

Тук доверителната вероятност на променливата, която зададохме в началото, е 95. Тя обаче може да се промени.

  • Тук стойността на коефициента за долните 95% се изчислява на 8496,84, а за горните 95% - на 10507,37,
  • Това означава, че макар основният ни коефициент да е около 9502,1, има голяма вероятност стойността да е под 8496 в 95 % от случаите и 5 % вероятност да е над 10507,37.

Прочетете още:

Нещата, които трябва да запомните

Методът на регресионния анализ оценява единствено връзката между разглежданите променливи. Той не установява причинно-следствената връзка. По друг начин се разглежда само аспектът на корелацията. Когато някакво действие причинява нещо, то се превръща в причинно-следствена връзка. Когато промяната на една променлива създава промени, това може да се счита за причинно-следствена връзка.

Регресионният анализ се затруднява силно от отклоненията. Всички видове отклонения трябва да бъдат отстранени, преди да се извърши анализът. За да анализирате и интерпретирате резултатите от регресионния анализ в Excel, трябва да вземете предвид тези точки.

Заключение

За да обобщим, отговорът на въпроса "как да интерпретираме резултатите от регресия в Excel" се дава чрез подробен анализ и последваща интерпретация. Анализът се извършва чрез Анализ на данните инструмент в Данни таб.

За тази задача е налична за изтегляне работна тетрадка, в която можете да упражните регресионния анализ и да го интерпретирате.

Чувствайте се свободни да задавате всякакви въпроси или обратна връзка чрез раздела за коментари. Всяко предложение за подобряване на Exceldemy общността ще бъде високо оценена.

Хю Уест е опитен обучител и анализатор на Excel с над 10 години опит в индустрията. Има бакалавърска степен по счетоводство и финанси и магистърска степен по бизнес администрация. Хю има страст към преподаването и е разработил уникален подход на преподаване, който е лесен за следване и разбиране. Неговите експертни познания по Excel са помогнали на хиляди студенти и професионалисти по целия свят да подобрят уменията си и да постигнат отлични резултати в кариерата си. Чрез своя блог Хю споделя знанията си със света, като предлага безплатни уроци за Excel и онлайн обучение, за да помогне на хората и фирмите да достигнат пълния си потенциал.