Повеќекратна регресивна анализа со Excel

  • Споделете Го Ова
Hugh West
Анализата

Едноставна регресија најчесто се користи за да се процени врската помеѓу две променливи, на пример, врската помеѓу приносот на културите и врнежите или односот помеѓу вкусот на лебот и температурата на рерната. Сепак, треба почесто да ја истражиме врската помеѓу зависна променлива и две или повеќе независни променливи. На пример, агентот за недвижнини може да сака да знае дали и како мерките како што се големината на куќата, бројот на спални соби и просечниот приход на соседството се однесуваат на цената за која се продава куќа. Овој вид на проблем може да се реши со примена на повеќекратна регресивна анализа. И овој напис ќе ви даде резиме за тоа како да користите анализа на повеќекратна регресија користејќи Excel.

Проблем

Да претпоставиме дека земавме 5 случајно избрани продавачи и ги собравме информациите како што е прикажано во табелата подолу. Дали образованието или мотивацијата имаат влијание врз годишната продажба или не?

Највисоката година на училиште заврши Мотивацијата како Мерено со Хигинсова скала за мотивација Годишна продажба во долари
12 32 $350.000
14 35 $399.765
15 45 $429.000
16 50 435.000$
18 65 433.000$

Равенка

Општо, повеќекратнаРегресивната анализа претпоставува дека постои линеарна врска помеѓу зависната променлива (y) и независните променливи (x1, x2, x3 ... xn). И овој вид линеарна врска може да се опише со следнава формула:

Y = константа + β1*x1 + β2*x2+…+ βn*xn

Еве ги објаснувањата за константите и коефициентите :

Y Предвидената вредност на Y
Постојана На Y- пресретнете
β1 Промената во Y секој 1 инкремент се менува во x1
β2 На промена во Y секој 1 инкремент промена во x2
bn Промената во Y секоја 1 промена на зголемување на xn

Константа и β1, β2… βn може да се пресметаат врз основа на достапните податоци од примерокот. Откако ќе ги добиете вредностите на константата, β1, β2... βn, можете да ги користите за да ги правите предвидувањата.

Што се однесува до нашиот проблем, има само два фактори за кои имаме интерес. Според тоа, равенката ќе биде:

Годишна продажба = константна + β1*(Највисока година на училиште завршена) + β2*(Мотивација мерена со Хигинсова скала за мотивација)

Поставете модел

Годишната продажба, највисоката година на училиште и мотивацијата беа внесени во колона А, колона Б и колона C како што е прикажано на слика 1. Подобро е секогаш да се става зависната променлива (Тука годишна продажба) пред независните променливи .

Слика 1

Преземете го пакетот со алатки за анализа

Excelни нуди функција за анализа на податоци која може да врати вредности на константи и коефициенти. Но, пред да ја користите оваа функција, треба да го преземете Analysis ToolPak. Еве како можете да го инсталирате.

Кликнете на картичката Датотека -> Опции и потоа кликнете на Додатоци во Excel Options дијалог прозорец. Кликнете на копчето Оди на дното на дијалог прозорецот Опции на Excel за да го отворите полето за дијалог Додатоци . Во полето за дијалог Add-Ins , изберете го полето за избор Analysis TookPak и потоа кликнете на Ok .

Сега ако кликнете на табот Data , ќе видите дека Analysis на податоци се појавува во групата Analysis (десен панел).

Слика 2 [кликнете на сликата за да добијте целосен приказ]

Повеќекратна регресивна анализа

Кликнете на Анализа на податоци во групата Анализа на картичката Податоци . Изберете Регресија Во побараното поле за дијалог Анализа на податоци . Може да правите и други статистичка анализа како што се t-test, ANOVA и така натаму.

Слика 3.1

A Регресија Ќе се појави дијалог прозорец откако ќе изберете Регресија . Пополнете го полето за дијалог како што е прикажано на слика 3.2.

Влезниот опсег Y ги содржи зависната променлива и податоци додека Влезниот опсег X содржи независни променливи и податоци. Овде морам да ве потсетам дека независните променливи треба да бидат во соседните колони. А максималниот број на независни променливи е 15.

Одопсег A1: C1 вклучува променливи етикети и затоа треба да се избере полето за избор Labels. Всушност, ви препорачувам да вклучите етикети секој пат кога го пополнувате опсегот на влез Y и опсегот на влез X. Овие ознаки се корисни кога ги прегледувате збирните извештаи вратени од Excel.

Слика 3.2

Со избирање на полето за избор Остатоци, можете да овозможите Excel да ги набројува остатоците за секое набљудување. Погледнете ја сликата 1, има вкупно 5 набљудувања и ќе добиете 5 остатоци. Остатокот е нешто што останува кога ќе ја одземете предвидената вредност од набљудуваната вредност. Стандардизиран остаток е резидуалот поделен со неговата стандардна девијација.

Можете исто така да го изберете полето за избор Residual Plot што може да му овозможи на Excel да враќа преостанати графици. Бројот на преостанати парцели е еднаков на бројот на независни променливи. Резидуален график е график кој ги прикажува остатоците на оската Y и независните променливи на оската x. Случајно дисперзираните точки околу x-оската во резидуална шема имплицира дека моделот линеарна регресија е соодветен. На пример, Слика 3.3 покажува три типични обрасци на преостанати парцели. Само оној во левиот панел покажува дека е добро прилагоден за линеарен модел. Останатите две обрасци сугерираат подобро приспособување за нелинеарен модел.

Слика 3.3

Excel ќе врати монтирана линија ако го изберете полето Line Fit Plots. Парцела со вградена линијаможе да ја нацрта врската помеѓу една зависна променлива и една независна променлива. Со други зборови, Excel ќе ви го врати истиот број на вградени линии со оние на независната променлива. На пример, ќе добиете 2 вградени линии за нашиот проблем.

Резултати

Откако ќе кликнете на копчето Ok, Excel ќе ви врати збирен извештај како подолу. Ќелиите означени со зелена и жолта боја се најважниот дел на кој треба да обрнете внимание.

Слика 3.4

Колку е поголем R-квадрат (ќелија F5), постои тесна врска помеѓу зависни променливи и независни променливи. И коефициентите (опсег F17: F19) во третата табела ви ги вратија вредностите на константите и коефициентите. Равенката треба да биде Годишна продажба = 1589,2 + 19928,3*(Највисока година на училиште завршено) + 11,9* (Мотивација мерена со Хигинсова мотивациска скала).

Меѓутоа, за да видите дали резултатите се веродостојни, потребно е и за проверка на p-вредностите означени со жолто. Само ако p-вредноста во ќелијата J12 е помала од 0,05, целата регресивна равенка е сигурна. Но, исто така треба да ги проверите p-вредностите во опсегот I17: I19 за да видите дали константните и независните променливи се корисни за предвидување на зависната променлива. За нашиот проблем, подобро е да ја отфрлиме мотивацијата кога ги разгледуваме независните променливи.

Прочитајте повеќе: Како да се пресмета вредноста P во линеарна регресија во Excel (3Начини)

Отстрани Motivation од независни променливи

Откако ја избришав Motivation како независна променлива, го применив истиот пристап и направив едноставна регресивна анализа. Можете да видите дека сите вредности сега се помали од 0,05. Конечната равенка треба да биде:

Годишна продажба = 1167,8 + 19993,3*(Највисока година на училиште завршена)

Слика 3.5 [кликнете на сликата за да добиете целосен приказ]

Забелешка

Слика 4

Покрај алатката Add-Ins, можете да ја користите и функцијата LINEST за да направите повеќекратна регресивна анализа. Функцијата LINEST е функција на низа која може да го врати резултатот или во една ќелија или во опсег на ќелии. Прво, изберете опсег A8:B12 и потоа внесете ја формулата „=LINEST (A2:A6, B2:B6, TRUE, TRUE)“ во првата ќелија од овој опсег (A8). Откако ќе притиснете CTRL + SHIFT +ENTER, Excel ќе ги врати резултатите како подолу. Со споредба со слика 3.4, можете да видите дека 19993.3 е коефициент на Највисока година на училиште, додека 1167.8 е константна. Како и да е, ви препорачувам да ја користите алатката Add-Ins. Многу е полесно.

Прочитај повеќе…

Обратна анализа што е ако во Excel

Како да користите џокери во Excel?

Преземете работна датотека

Преземете ја работната датотека од врската подолу.

Повеќекратна регресивна-анализа. xlsx

Хју Вест е високо искусен тренер и аналитичар на Excel со повеќе од 10 години искуство во индустријата. Има диплома за сметководство и финансии и магистер по бизнис администрација. Хју има страст за предавање и има развиено уникатен пристап на наставата кој е лесен за следење и разбирање. Неговото стручно познавање на Excel им помогна на илјадници студенти и професионалци ширум светот да ги подобрат своите вештини и да се истакнат во нивните кариери. Преку својот блог, Хју го споделува своето знаење со светот, нудејќи бесплатни упатства за Excel и онлајн обука за да им помогне на поединците и бизнисите да го достигнат својот целосен потенцијал.