Множны рэгрэсійны аналіз з дапамогай Excel

  • Падзяліцца Гэтым
Hugh West

Просты рэгрэсійны аналіз звычайна выкарыстоўваецца для ацэнкі ўзаемасувязі паміж дзвюма зменнымі, напрыклад, сувязі паміж ураджайнасцю і колькасцю ападкаў або ўзаемасувязі паміж смакам хлеба і тэмпературай печы. Аднак часцей за ўсё нам трэба даследаваць сувязь паміж залежнай зменнай і дзвюма ці больш незалежнымі зменнымі. Напрыклад, агент па нерухомасці можа захацець ведаць, ці і як такія паказчыкі, як памер дома, колькасць спальняў і сярэдні даход у раёне, звязаны з цаной, за якую прадаецца дом. Такую праблему можна вырашыць шляхам прымянення множнага рэгрэсійнага аналізу. У гэтым артыкуле будзе апісана, як выкарыстоўваць множны рэгрэсійны аналіз з дапамогай Excel.

Праблема

Выкажам здагадку, што мы ўзялі 5 выпадкова выбраных прадаўцоў і сабралі інфармацыю, як паказана ў табліцы ніжэй. Ці ўплывае адукацыя ці матывацыя на гадавы аб'ём продажаў?

Самы высокі год заканчэння школы Матывацыя як Вымяраецца па шкале матывацыі Хігінса Гадавы аб'ём продажаў у доларах
12 32 350 000$
14 35 399 765$
15 45 429 000$
16 50 435 000$
18 65 $433 000

Ураўненне

Як правіла, некалькірэгрэсійны аналіз мяркуе, што існуе лінейная залежнасць паміж залежнай зменнай (y) і незалежнымі зменнымі (x1, x2, x3 … xn). І гэты від лінейнай залежнасці можна апісаць з дапамогай наступнай формулы:

Y = канстанта + β1*x1 + β2*x2+…+ βn*xn

Вось тлумачэнні канстант і каэфіцыентаў :

Y Прагназуемае значэнне Y
Канстанта Y- перахоп
β1 Змяненне Y кожнае 1 прырашчэнне змены ў x1
β2 The змяненне Y кожны 1 прырост змяненне x2
βn Змена у Y кожнае 1 змяненне кроку xn

Канстанта і β1, β2… βn могуць быць разлічаны на аснове даступных выбарачных даных. Пасля таго, як вы атрымаеце значэнні канстанты, β1, β2… βn, вы можаце выкарыстоўваць іх, каб рабіць прагнозы.

Што тычыцца нашай праблемы, ёсць толькі два фактары, якія нас цікавяць. Такім чынам, ураўненне будзе наступным:

Гадавы аб'ём продажаў = канстанта + β1*(Найвышэйшы год заканчэння школы) + β2*(Матывацыя, вымераная шкалай матывацыі Хігінса)

Мадэль наладжвання

Гадавы аб'ём продажаў, самы высокі год заканчэння школы і матывацыя былі ўведзены ў слупкі A, слупкі B і слупкі C, як паказана на малюнку 1. Лепш заўсёды ставіць залежную зменную (тут гадавы аб'ём продажаў) перад незалежнымі зменнымі .

Рысунак 1

Спампаваць Analysis ToolPak

Excelпрапануе нам функцыю аналізу даных, якая можа вяртаць значэнні канстант і каэфіцыентаў. Але перш чым выкарыстоўваць гэтую функцыю, вам трэба загрузіць Analysis ToolPak. Вось як вы можаце ўсталяваць яго.

Націсніце на ўкладку Файл -> Параметры , а затым націсніце на Надбудовы ў Дыялогавае акно Параметры Excel . Націсніце кнопку Перайсці ўнізе дыялогавага акна Параметры Excel , каб адкрыць дыялогавае акно Надбудовы . У дыялогавым акне Add-Ins пастаўце сцяжок Analysis TookPak і націсніце Ok .

Цяпер, калі вы націснеце на На ўкладцы Data вы ўбачыце Аналіз даных у групе Аналіз (правая панэль).

Малюнак 2 [пстрыкніце малюнак, каб атрымаць поўны выгляд]

Множны рэгрэсійны аналіз

Націсніце на Аналіз даных у групе Аналіз на ўкладцы Дадзеныя . Абярыце Рэгрэсія у дыялогавым акне Аналіз даных , якое адкрыецца. Вы таксама можаце зрабіць іншы статыстычны аналіз , напрыклад t-тэст, ANOVA і гэтак далей.

Малюнак 3.1

A Рэгрэсія дыялогавае акно будзе прапанавана пасля выбару Рэгрэсія . Запоўніце дыялогавае акно, як паказана на малюнку 3.2.

Дыяпазон уводу Y змяшчае залежную зменную і даныя, а дыяпазон уводу X змяшчае незалежныя зменныя і даныя. Тут я павінен нагадаць вам, што незалежныя зменныя павінны быць у суседніх слупках. А максімальная колькасць незалежных зменных роўная 15.

Паколькідыяпазон A1: C1 уключае меткі зменных, і таму сцяжок "Меткі" павінен быць усталяваны. Фактычна, я рэкамендую вам уключаць меткі кожны раз, калі вы запаўняеце дыяпазон уваходных Y і дыяпазон уваходных X. Гэтыя пазнакі карысныя, калі вы праглядаеце зводныя справаздачы, вернутыя Excel.

Малюнак 3.2

Выбраўшы сцяжок «Астаткі», вы можаце дазволіць Excel пералічваць рэшткі для кожнага назірання. Паглядзіце на малюнак 1, усяго 5 назіранняў, і вы атрымаеце 5 рэшткаў. Астаткавы - гэта тое, што застаецца, калі вы аднімеце прагназуемае значэнне з назіранага значэння. Стандартызаваны астатак - гэта астатак, падзелены на яго стандартнае адхіленне.

Вы таксама можаце паставіць сцяжок у полі "Астаткавы графік", які дазваляе Excel вяртаць графікі астатку. Колькасць рэшткавых графікаў роўная колькасці незалежных зменных. Дыяграма астатку - гэта графік, які паказвае рэшткі па восі Y і незалежныя зменныя па восі абс. Выпадковым чынам раскіданыя кропкі вакол восі х на графіку астатку азначаюць, што мадэль лінейнай рэгрэсіі падыходзіць. Напрыклад, на малюнку 3.3 паказаны тры тыповыя схемы рэшткавых участкаў. Толькі адзін на левай панэлі паказвае, што ён добра падыходзіць для лінейнай мадэлі. Астатнія два шаблоны прапануюць лепшае прыстасаванне для нелінейнай мадэлі.

Малюнак 3.3

Excel верне падагнаны лінейны графік, калі вы ўсталюеце сцяжок Line Fit Plots. Падабраная лінія ўчасткаможа пабудаваць залежнасць паміж адной залежнай зменнай і адной незалежнай зменнай. Іншымі словамі, Excel верне вам такую ​​ж колькасць падагнаных ліній, што і незалежная зменная. Напрыклад, вы атрымаеце 2 падагнаныя лінейныя графікі для нашай задачы.

Вынікі

Пасля таго, як вы націснеце кнопку Ok, Excel верне зводную справаздачу, як паказана ніжэй. Ячэйкі, вылучаныя зялёным і жоўтым колерам, з'яўляюцца найбольш важнай часткай, на якую варта звярнуць увагу.

Малюнак 3.4

Чым вышэй R-квадрат (ячэйка F5), існуе цесная ўзаемасувязь паміж залежнымі зменнымі і незалежнымі зменнымі. І каэфіцыенты (дыяпазон F17: F19) у трэцяй табліцы вярнулі вам значэнні канстант і каэфіцыентаў. Ураўненне павінна быць такім: гадавы аб'ём продажаў = 1589,2 + 19928,3*(Самы высокі год заканчэння школы) + 11,9*(Матывацыя, вымераная па шкале матывацыі Хігінса).

Аднак, каб убачыць, ці надзейныя вынікі, вам таксама трэба каб праверыць р-значэнні, вылучаныя жоўтым колерам. Толькі калі р-значэнне ў ячэйцы J12 менш за 0,05, усё ўраўненне рэгрэсіі з'яўляецца надзейным. Але вам таксама трэба праверыць р-значэнні ў дыяпазоне I17: I19, каб убачыць, ці карысныя пастаянныя і незалежныя зменныя для прагназавання залежнай зменнай. Што тычыцца нашай праблемы, нам лепш адмовіцца ад матывацыі пры разглядзе незалежных зменных.

Дадатковая інфармацыя: Як разлічыць значэнне P у лінейнай рэгрэсіі ў Excel (3Спосабы)

Выдаліць матывацыю з незалежных зменных

Пасля выдалення матывацыі як незалежнай зменнай я прымяніў той жа падыход і зрабіў просты рэгрэсійны аналіз. Вы бачыце, што ўсе значэнні цяпер менш за 0,05. Канчатковае ўраўненне павінна быць наступным:

Гадавы аб'ём продажаў = 1167,8 + 19993,3*(Найвышэйшы год заканчэння школы)

Малюнак 3.5 [націсніце на малюнак, каб атрымаць поўны выгляд]

Заўвага

Малюнак 4

Акрамя інструмента Add-Ins, вы таксама можаце выкарыстоўваць функцыю LINEST для выканання множнага рэгрэсійнага аналізу. Функцыя LINEST - гэта функцыя масіва, якая можа вяртаць вынік у адной ячэйцы або ў дыяпазоне ячэек. Перш за ўсё, абярыце дыяпазон A8: B12, а затым увядзіце формулу «= LINEST (A2: A6, B2: B6, TRUE, TRUE)» у першую ячэйку гэтага дыяпазону (A8). Пасля націску CTRL + SHIFT + ENTER Excel верне вынікі, як паказана ніжэй. Параўноўваючы малюнак 3.4, вы бачыце, што 19993,3 з'яўляецца каэфіцыентам найвышэйшага года заканчэння школы, а 1167,8 з'яўляецца пастаянным. У любым выпадку, я рэкамендую вам выкарыстоўваць інструмент надбудоў. Гэта нашмат прасцей.

Дадаткова...

Зваротны аналіз што-калі ў Excel

Як выкарыстоўваць падстаноўныя знакі ў Excel?

Спампуйце працоўны файл

Спампуйце працоўны файл па спасылцы ніжэй.

Множны рэгрэсійны аналіз. xlsx

Х'ю Уэст з'яўляецца вельмі дасведчаным трэнерам і аналітыкам Excel з больш чым 10-гадовым вопытам работы ў галіны. Ён мае ступень бакалаўра ў галіне бухгалтарскага ўліку і фінансаў і ступень магістра дзелавога адміністравання. Х'ю захапляецца навучаннем і распрацаваў унікальны падыход да навучання, які лёгка прытрымлівацца і зразумець. Яго экспертныя веды Excel дапамаглі тысячам студэнтаў і спецыялістаў па ўсім свеце палепшыць свае навыкі і атрымаць поспех у сваёй кар'еры. Праз свой блог Х'ю дзеліцца сваімі ведамі з усім светам, прапаноўваючы бясплатныя падручнікі па Excel і онлайн-трэнінгі, каб дапамагчы прыватным асобам і прадпрыемствам цалкам раскрыць свой патэнцыял.