Преглед садржаја
Једноставна регресиона анализа се обично користи за процену односа између две варијабле, на пример, односа између приноса усева и падавина или односа између укуса хлеба и температуре рерне. Међутим, морамо чешће него не истраживати однос између зависне варијабле и две или више независних варијабли. На пример, агент за некретнине можда жели да зна да ли се и како мере као што су величина куће, број спаваћих соба и просечни приход у комшилуку односе на цену по којој се кућа продаје. Ова врста проблема се може решити применом анализе вишеструке регресије. Овај чланак ће вам дати резиме како да користите анализу вишеструке регресије користећи Екцел.
Проблем
Претпоставимо да смо узели 5 насумично одабраних продаваца и прикупили информације као што је приказано у табели испод. Да ли образовање или мотивација утичу на годишњу продају или не?
Највиша година завршене школе | Мотивација као Измерено Хигинсовом скалом мотивације | Годишња продаја у доларима |
12 | 32 | $350,000 |
14 | 35 | $399,765 |
15 | 45 | $429,000 |
16 | 50 | $435,000 |
18 | 65 | 433.000$ |
Једначина
Генерално, вишеструкорегресиона анализа претпоставља да постоји линеарна веза између зависне променљиве (и) и независних променљивих (к1, к2, к3 … кн). А ова врста линеарног односа се може описати следећом формулом:
И = константа + β1*к1 + β2*к2+…+ βн*кн
Ево објашњења за константе и коефицијенте :
И | Предвиђена вредност И |
Константа | И- интерцепт |
β1 | Промена у И сваки 1 прираст мења се у к1 |
β2 | Тхе промена И сваки 1 прираст промена к2 |
… | … |
βн | Промена у И свака промена прираста од 1 у кн |
константе и β1, β2… βн се могу израчунати на основу доступних података узорка. Након што добијете вредности константе, β1, β2… βн, можете их користити за предвиђање.
Што се тиче нашег проблема, постоје само два фактора за које смо заинтересовани. Према томе, једначина ће бити:
Годишња продаја = константа + β1*(Највиша завршена година школе) + β2*(Мотивација мерена Хигинсовом скалом мотивације)
Поставите модел
Годишња продаја, највиша завршена година школе и Мотивација је унета у колону А, колону Б и колону Ц као што је приказано на слици 1. Боље је увек ставити зависну варијаблу (овде годишња продаја) испред независних варијабли .
Слика 1
Преузми пакет алата за анализу
Екцелнуди нам функцију анализе података која може да врати вредности константи и коефицијената. Али пре коришћења ове функције, потребно је да преузмете Аналисис ТоолПак. Ево како можете да га инсталирате.
Кликните на картицу Датотека -&гт; Опције , а затим кликните на Додаци у Опције Екцел дијалог. Кликните на дугме Иди на дну дијалога Екцел опције да бисте отворили дијалог Додаци . У оквиру за дијалог Додаци , потврдите избор у пољу за потврду Аналисис ТоокПак , а затим кликните на У реду .
Сада ако кликнете на На картици Дата , видећете да се Анализа података појављује у групи Анализа (десни панел).
Слика 2 [кликните на слику да бисте добијте потпуни приказ]
Анализа вишеструке регресије
Кликните на Анализа података у групи Анализа на картици Подаци . Изаберите Регресија У прозору за дијалог Анализа података . Такође можете да урадите другу статистичку анализу као што је т-тест, АНОВА и тако даље.
Слика 3.1
А Регресија дијалог ће бити упитан након што изаберете Регресија . Попуните дијалошки оквир као што је приказано на слици 3.2.
Опсег уноса И садржи зависну променљиву и податке, док опсег уноса Кс садржи независне променљиве и податке. Овде морам да вас подсетим да независне променљиве треба да буду у суседним колонама. А максималан број независних променљивих је 15.
Поштоопсег А1: Ц1 укључује променљиве ознаке и стога треба означити поље за потврду Лабелс. У ствари, препоручујем вам да укључите ознаке сваки пут када попуњавате опсег уноса И и опсег уноса Кс. Ове ознаке су корисне када прегледате збирне извештаје које враћа Екцел.
Слика 3.2
Означавањем поља за потврду Остаци, можете омогућити Екцел-у да наведе остатке за свако посматрање. Погледајте слику 1, има укупно 5 запажања и добићете 5 резидуала. Остатак је нешто што остаје када одузмете предвиђену вредност од посматране вредности. Стандардизовани резидуал је резидуал подељен његовом стандардном девијацијом.
Можете и да изаберете поље за потврду Ресидуал Плот који може да омогући Екцел-у да врати графиконе резидуала. Број резидуалних дијаграма једнак је броју независних варијабли. Графикон остатка је график који приказује остатке на И-оси и независне варијабле на к-оси. Насумично дисперговане тачке око к-осе у резидуалном дијаграму имплицирају да је модел линеарне регресије одговарајући. На пример, слика 3.3 приказује три типична обрасца резидуалних дијаграма. Само онај на левом панелу указује да је добар за линеарни модел. Друга два обрасца сугеришу боље уклапање за нелинеарни модел.
Слика 3.3
Екцел ће вратити уграђени линијски графикон ако изаберете поље за потврду Лине Фит Плотс. Уграђена линијска парцеламоже нацртати однос између једне зависне променљиве и једне независне променљиве. Другим речима, Екцел ће вам вратити исти број постављених линија као и независна променљива. На пример, добићете 2 постављене линије за наш проблем.
Резултати
Након што кликнете на дугме У реду, Екцел ће вратити збирни извештај као у наставку. Ћелије означене зеленом и жутом бојом су најважнији део на који треба да обратите пажњу.
Слика 3.4
Што је већи Р-квадрат (ћелија Ф5), постоји чврста веза између зависних варијабли и независних варијабли. А коефицијенти (опсег Ф17: Ф19) у трећој табели су вам вратили вредности константи и коефицијената. Једначина би требало да буде Годишња продаја = 1589,2 + 19928,3*(Највиша завршена година школе) + 11,9*(Мотивација мерена Хигинсовом скалом мотивације).
Међутим, да бисте видели да ли су резултати поуздани, потребно је и да проверите п-вредности означене жутом бојом. Само ако је п-вредност у ћелији Ј12 мања од 0,05, цела једначина регресије је поуздана. Али такође морате да проверите п-вредности у опсегу И17: И19 да видите да ли су константне и независне променљиве корисне за предвиђање зависне променљиве. За наш проблем, боље је да одбацимо мотивацију када разматрамо независне варијабле.
Прочитајте више: Како израчунати П вредност у линеарној регресији у Екцел-у (3Начини)
Уклони мотивацију из независних променљивих
Након што сам избрисао Мотивацију као независну променљиву, применио сам исти приступ и урадио једноставну регресиону анализу. Сада можете видети да су све вредности мање од 0,05. Коначна једначина би требало да буде:
Годишња продаја = 1167,8 + 19993,3*(Највиша година завршене школе)
Слика 3.5 [кликните на слику да бисте добили пун приказ]
Напомена
Слика 4
Поред алата за додатке, можете користити и функцију ЛИНЕСТ за анализу вишеструке регресије. Функција ЛИНЕСТ је функција низа која може да врати резултат у једној ћелији или опсегу ћелија. Пре свега, изаберите опсег А8:Б12, а затим унесите формулу „=ЛИНЕСТ (А2:А6, Б2:Б6, ТРУЕ, ТРУЕ)“ у прву ћелију овог опсега (А8). Након што притиснете ЦТРЛ + СХИФТ + ЕНТЕР, Екцел ће вратити резултате као у наставку. Упоређивањем са сликом 3.4, можете видети да је 19993,3 коефицијент највише завршене школе док је 1167,8 константан. У сваком случају, препоручујем вам да користите алатку за додатке. Много је лакше.
Прочитајте више…
Обрните анализу шта ако у Екцел-у
Како користити замјенске знакове у Екцел-у?
Преузмите радну датотеку
Преузмите радну датотеку са доње везе.
Анализа вишеструке регресије. клск