Analiza regresji wielokrotnej w programie Excel

  • Udostępnij To
Hugh West

Prosta regresja Analiza jest powszechnie stosowana do oszacowania związku między dwiema zmiennymi, na przykład związku między plonami zbóż a opadami deszczu lub związku między smakiem chleba a temperaturą pieca. Jednak częściej musimy zbadać związek między zmienną zależną a dwiema lub więcej zmiennymi niezależnymi. Na przykład agent nieruchomości może chcieć poznaćczy i jak takie miary jak wielkość domu, liczba sypialni i średni dochód w sąsiedztwie odnoszą się do ceny, za którą sprzedawany jest dom. Tego rodzaju problem można rozwiązać stosując analiza regresji wielokrotnej. A ten artykuł da ci podsumowanie, jak korzystać z analizy regresji wielokrotnej za pomocą programu Excel.

Problem

Załóżmy, że wzięliśmy 5 losowo wybranych handlowców i zebraliśmy informacje jak w poniższej tabeli. Czy wykształcenie lub motywacja ma wpływ na roczną sprzedaż czy nie?

Najwyższy rok ukończonej szkoły Motywacja mierzona za pomocą Skali Motywacji Higginsa Roczna sprzedaż w dolarach
12 32 $350,000
14 35 $399,765
15 45 $429,000
16 50 $435,000
18 65 $433,000

Równanie

Ogólnie rzecz biorąc, analiza regresji wielokrotnej zakłada, że między zmienną zależną (y) a zmiennymi niezależnymi (x1, x2, x3 ... xn) istnieje zależność liniowa. I tego rodzaju zależność liniową można opisać za pomocą następującego wzoru:

Y = stała + β1*x1 + β2*x2+...+ βn*xn

Poniżej znajdują się wyjaśnienia dotyczące stałych i współczynników:

Y Przewidywana wartość Y
Stały Punkt przecięcia Y
β1 Zmiana w Y przy każdej zmianie o 1 przyrost w x1
β2 Zmiana w Y przy każdej zmianie o 1 przyrost w x2
... ...
βn Zmiana w Y przy każdej zmianie o 1 przyrost w xn

Stałą oraz β1, β2... βn można obliczyć na podstawie dostępnych danych z próby. Po uzyskaniu wartości stałej, β1, β2... βn można je wykorzystać do przeprowadzenia predykcji.

Jeśli chodzi o nasz problem, to istnieją tylko dwa czynniki, którymi jesteśmy zainteresowani, dlatego równanie będzie brzmiało:

Sprzedaż roczna = stała + β1*(najwyższy ukończony rok nauki) + β2*(motywacja mierzona skalą motywacji Higginsa)

Ustawienie Model

Roczna sprzedaż, najwyższy rok ukończonej szkoły i Motywacja zostały wpisane do kolumny A, kolumny B i kolumny C, jak pokazano na rysunku 1. Lepiej jest zawsze umieścić zmienną zależną (tutaj roczna sprzedaż) przed zmiennymi niezależnymi.

Rysunek 1

Pobierz Analysis ToolPak

Excel oferuje nam funkcję Analiza danych, która może zwracać wartości stałych i współczynników. Ale przed użyciem tej funkcji, musisz pobrać Analysis ToolPak. Oto jak możesz go zainstalować.

Kliknij na Plik tab -> Opcje a następnie kliknij na Add-Ins w Opcje programu Excel Kliknij na Wejdź na stronę przycisk na dole Opcje programu Excel aby otworzyć okno dialogowe Add-Ins okno dialogowe. w Add-Ins okno dialogowe, wybierz Analiza TookPak pole wyboru, a następnie kliknij na Ok .

Teraz, jeśli klikniesz na Dane zakładka, zobaczysz Analiza danych pojawia się w Analiza grupa (prawy panel).

Rysunek 2 [kliknij na obrazek, aby uzyskać pełny widok]

Analiza regresji wielokrotnej

Kliknij na Analiza danych w Analiza grupa na Dane tab. Wybierz Regresja W podpowiedzi Analiza danych Można również wykonać inne czynności analiza statystyczna takich jak t-test, ANOVA i tak dalej.

Rysunek 3.1

A Regresja okno dialogowe zostanie wyświetlone po wybraniu Regresja . Wypełnij okno dialogowe, jak pokazano na rysunku 3.2.

Zakres Input Y zawiera zmienną zależną i dane, natomiast zakres Input X zawiera zmienne niezależne i dane. Tutaj muszę przypomnieć, że zmienne niezależne powinny być w sąsiednich kolumnach. A maksymalna liczba zmiennych niezależnych to 15.

Ponieważ zakres A1: C1 zawiera zmienne etykiety, dlatego pole wyboru Etykiety powinno być zaznaczone. W rzeczywistości zalecam dołączanie etykiet za każdym razem, gdy wypełniasz Zakres wejściowy Y i Zakres wejściowy X. Etykiety te są pomocne podczas przeglądania raportów zbiorczych zwracanych przez Excel.

Rysunek 3.2

Zaznaczając pole wyboru Reszty, możesz umożliwić Excelowi wypisanie reszt dla każdej obserwacji. Spójrz na rysunek 1, jest tam w sumie 5 obserwacji i otrzymasz 5 reszt. Reszta to coś, co zostaje po odjęciu wartości przewidywanej od wartości obserwowanej. Standaryzowana reszta to reszta podzielona przez jej odchylenie standardowe.

Można również zaznaczyć pole wyboru Wykres reszt, co umożliwi programowi Excel zwrócenie wykresów reszt. Liczba wykresów reszt jest równa liczbie zmiennych niezależnych. Wykres reszt jest wykresem, który przedstawia reszty na osi Y i zmienne niezależne na osi x. Losowo rozrzucone punkty wokół osi x w wykresie reszt sugerują, że regresja liniowa Na przykład, Rysunek 3.3 pokazuje trzy typowe wzory wykresów reszt. Tylko ten w lewym panelu wskazuje, że jest to dobre dopasowanie do modelu liniowego. Pozostałe dwa wzory sugerują lepsze dopasowanie do modelu nieliniowego.

Rysunek 3.3

Excel zwróci dopasowany wykres liniowy, jeśli zaznaczysz pole wyboru Line Fit Plots. Dopasowany wykres liniowy może wykreślić związek pomiędzy jedną zmienną zależną i jedną zmienną niezależną. Innymi słowy, Excel zwróci Ci taką samą liczbę dopasowanych wykresów liniowych, jak w przypadku zmiennej niezależnej. Na przykład, otrzymasz 2 dopasowane wykresy liniowe dla naszego problemu.

Wyniki

Po kliknięciu przycisku Ok, Excel zwróci raport podsumowujący jak poniżej. Komórki wyróżnione na zielono i żółto są najważniejszą częścią, na którą należy zwrócić uwagę.

Rysunek 3.4

Im wyższy R-kwadrat (komórka F5), tym ścisły związek istnieje między zmiennymi zależnymi i niezależnymi. A współczynniki (zakres F17: F19) w trzeciej tabeli zwróciły Ci wartości stałych i współczynników. Równanie powinno brzmieć Roczna sprzedaż = 1589,2 + 19928,3*(Najwyższy ukończony rok szkoły) + 11,9*(Motywacja mierzona Skalą Motywacji Higginsa).

Jednak, aby sprawdzić, czy wyniki są wiarygodne, należy również sprawdzić p-wartości zaznaczone na żółto. Tylko jeśli p-wartość w komórce J12 jest mniejsza niż 0,05, całe równanie regresji jest wiarygodne. Ale należy również sprawdzić p-wartości w zakresie I17: I19, aby zobaczyć, czy stałe i zmienne niezależne są przydatne do przewidywania zmiennej zależnej. Dla naszego problemu, lepiej jest dla nas odrzucićmotywacji przy rozpatrywaniu zmiennych niezależnych.

Read More: Jak obliczyć wartość P w regresji liniowej w Excelu (3 sposoby)

Usunąć motywację ze zmiennych niezależnych

Po usunięciu Motywacji jako zmiennej niezależnej zastosowałem to samo podejście i wykonałem prostą analizę regresji. Widać, że wszystkie wartości są teraz mniejsze niż 0,05. Ostateczne równanie powinno brzmieć:

Sprzedaż roczna = 1167,8 + 19993,3*(Najwyższy ukończony rok szkolny)

Rysunek 3.5 [kliknij na obraz, aby uzyskać pełny widok]

Uwaga

Rysunek 4

Poza narzędziem Add-Ins, do analizy regresji wielorakiej można również użyć funkcji LINEST. Funkcja LINEST jest funkcją tablicową, która może zwrócić wynik w jednej komórce lub w zakresie komórek. W pierwszej kolejności należy wybrać zakres A8:B12, a następnie wpisać formułę "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" do pierwszej komórki tego zakresu (A8). Po naciśnięciu klawiszy CTRL + SHIFT +ENTER, Excel zwróci wyniki w postaciPoniżej. Porównując z rysunkiem 3.4, można zauważyć, że 19993.3 jest współczynnikiem Najwyższego roku ukończonej szkoły, podczas gdy 1167.8 jest stałą. Tak czy inaczej, polecam użycie narzędzia Add-Ins. Jest to znacznie łatwiejsze.

Read More...

Odwrotna analiza What-If w Excelu

Jak używać znaków wieloznacznych w programie Excel?

Pobierz plik roboczy

Pobierz plik roboczy z poniższego linku.

Multiple-Regression-Analysis.xlsx

Hugh West jest bardzo doświadczonym trenerem i analitykiem Excela z ponad 10-letnim doświadczeniem w branży. Posiada tytuł licencjata w dziedzinie rachunkowości i finansów oraz tytuł magistra administracji biznesowej. Hugh ma pasję do nauczania i opracował unikalne podejście do nauczania, które jest łatwe do naśladowania i zrozumienia. Jego specjalistyczna wiedza na temat programu Excel pomogła tysiącom studentów i profesjonalistów na całym świecie doskonalić swoje umiejętności i osiągać doskonałe wyniki w karierze. Za pośrednictwem swojego bloga Hugh dzieli się swoją wiedzą ze światem, oferując bezpłatne samouczki programu Excel i szkolenia online, aby pomóc osobom indywidualnym i firmom w pełni wykorzystać swój potencjał.