Jak interpretować wyniki regresji w Excelu (analiza szczegółowa)

  • Udostępnij To
Hugh West

Analiza regresji jest w prawie każdym rodzaju oprogramowania statystycznego np. SPSS , R, Regresja może dać nam pełny obraz zależności między zmiennymi. Regresję liniową można przeprowadzić dość szybko w Excelu, używając funkcji Analiza danych Ten artykuł pokaże, jak można interpretować wyniki regresji w programie Excel.

Pobierz Zeszyt ćwiczeń

Pobierz ten zeszyt ćwiczeń poniżej.

Interpretacja wyników regresji.xlsx

Co to jest regresja?

Analiza regresji jest często stosowana w analizie danych w celu określenia związków między wieloma zmiennymi. Analiza regresji pozwala wybrać, co stanie się ze zmienną zależną, jeśli zmieni się jedna ze zmiennych niezależnych. Pozwala również matematycznie określić, które zmienne niezależne mają wpływ.

Prosta regresja liniowa jest różna od a wielokrotna regresja liniowa w statystyce. Używając funkcji liniowej, prostej analizy regresji liniowej związek między zmiennymi a jedną zmienną niezależną. Wielokrotna regresja liniowa jest, gdy dwa lub więcej czynników objaśniających są używane do określenia zmiennych.Korzystanie z regresji nieliniowej zamiast zmiennej zależnej jest określany jako funkcja nieliniowa, ponieważ relacje danych nie są liniowe.Ten artykuł będzie koncentrować się na wielokrotna regresja liniowa aby pokazać, jak można interpretować wyniki regresji w programie Excel.

Kroki do wykonania regresji w Excelu

Dla celów regresji do analizy wykorzystamy poniższy zbiór danych.Tutaj zmienną niezależną będzie Cena kolumna i Sprzedane kolumna. niezależny kolumna będzie Popyt kolumna.

Kroki

  • Musimy iść do Dane i kliknij na Analiza danych dokonać regresji .

  • Pojawi się nowe okno; wybierz zakres danych zmiennej zależnej i zmiennej niezależnej.
  • Następnie należy zaznaczyć Etykiety skrzynia i Confidence pudełko.
  • Następnie kliknij w polu Zakres komórek wyjściowych, aby wybrać adres komórki wyjściowej
  • Następnie należy zaznaczyć Pozostałości do obliczenia resztek.
  • Następnie należy zaznaczyć Pozostałości działki i Pola Line Fit Plots
  • Kliknij OK po tym.

  • Po kliknięciu OK, podstawowe parametry wyjściowe analizy będą znajdować się w określonych komórkach.

  • Wówczas otrzymamy również kilka parametrów takich jak np. Znaczenie wartość itp. w ANOVA ( Analiza wariancji ) tabela.
  • Tutaj, df oznaczające stopień swobody związany ze źródłem wariancji.
  • SS oznacza sumę kwadratów. Twój model będzie lepiej odzwierciedlał dane, jeśli Pozostałości SS jest mniejszy niż Razem SS.
  • MS oznacza kwadrat.
  • F oznacza F -test dla hipotezy zerowej.
  • Znaczenie F oznacza P -wartość F .

  • Wtedy w tabeli otrzymasz również współczynniki zmiennej, wartość istotności itp.

  • Następnie otrzymasz końcową tabelę poniżej tabeli współczynników, która zawiera wartość rezydualną dla każdego wpisu.

  • Następnie otrzymasz Popyt vs Cena wykres regresji, z linią trendu.

  • Po tym, otrzymujesz Popyt vs Sprzedane wykres regresji z linią trendu.

  • Jest jeszcze jeden wykres pokazujący rozkład reszt dla każdego wpisu z. Sprzedane zmienny.

  • Jest jeszcze jeden wykres pokazujący rozkład reszt dla każdego wpisu z. Cena zmienny.

Następnie pokażemy, jak można interpretować te wyniki regresji w Excelu.

Read More: Jak zrobić regresję logistyczną w Excelu (z szybkimi krokami)

Jak interpretować wyniki regresji w programie Excel

Następną rzeczą, którą należy zrobić po wykonaniu analizy regresji i zinterpretować je. Wyniki są opisane i opracowane poniżej.

Analiza wartości regresji wielokrotnej R-Squared

Na stronie R-squared liczba wskazuje, jak ściśle powiązane są elementy zbioru danych i jak dobrze linia regresji pasuje do danych.Zamierzamy wykorzystać analizę regresji liniowej wielokrotnej, w której określimy wpływ dwóch lub więcej zmiennych na czynnik główny.Odnosi się to do tego, jak zmienia się zmienna zależna wraz ze zmianą jednej ze zmiennych niezależnych.Zakres tego współczynnika wynosi od-1 do 1. Tutaj,

  • 1 oznacza bliski pozytywny związek
  • 0 oznacza, że nie ma żadnych zależności między zmiennymi. Innymi słowy, punkty danych są przypadkowe.
  • -1 oznacza odwrotną lub negatywną zależność między zmiennymi.

W przedstawionych powyżej wynikach wyjściowych wartość wielokrotności R dla podanych zbiorów danych wynosi o.7578( ok. ), co wskazuje na silne związki między zmiennymi.

R Squared

R kwadrat Wartość ta wyjaśnia jak zmienia się odpowiedź zmiennych zależnych na zmienną niezależną. W naszym przypadku wartość ta wynosi 0,574(ok.), co można interpretować jako dość dobrą relację między zmiennymi.

Skorygowany wskaźnik R-Squared

To jest tylko alternatywna wersja R kwadrat To po prostu tasuje predyktor zmiennych przy prognozowaniu odpowiedź Zmienna. Oblicza się jako

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Tutaj, R^2 : The R^2 wartość, którą otrzymaliśmy ze zbioru danych.

n : liczba obserwacji.

K : liczba zmiennych predykcyjnych.

Znaczenie tej wartości pojawia się podczas wykonywania analizy regresji pomiędzy dwoma predyktor zmienne. Jeśli jest więcej niż jeden predyktor zmiennej w zbiorze danych, to wartość R kwadrat będzie zawyżona, co jest wysoce niepożądane.Skorygowana R kwadrat wartość koryguje tę inflację i daje dokładny obraz zmiennych.

Błąd standardowy

Inna metryka goodness-of-fit, która wskazuje dokładność twojej analizy regresji; im niższa wartość, tym bardziej możesz być pewny w swojej analizie regresji.

Błąd standardowy jest empiryczną metryką reprezentującą średnią odległość, na jaką punkty odchylają się od linii trendu. Dla porównania, R2 reprezentuje udział zmienności zmiennej zależnej. W tym przypadku wartość Błąd standardowy wynosi 288,9 ( ok. ), co oznacza, że nasze punkty danych, średnio rzecz biorąc, spadają o 288,9 od linii trendu.

Obserwacje

Podać liczbę obserwacji lub wpisów.

Ustalenie zmiennej znaczącej

Na stronie Wartość istotna wskazuje na wiarygodność (solidność statystyczną) naszej analizy. Innymi słowy, oznacza prawdopodobieństwo, że nasz zbiór danych jest błędny. Wartość ta powinna być niższa niż 5%. Ale w tym przypadku nasza wartość istotności wynosi 0,00117, co przekłada się na 0,1%, czyli znacznie poniżej 5%. Tak więc nasza analiza jest w porządku. W przeciwnym razie, być może będziemy musieli wybrać inne zmienne do naszej analizy.

P-value w analizie regresji

Ściśle związane z istotną wartością, tj. P-value oznacza prawdopodobieństwo, że wartość współczynnika jest błędna. Wartość P oznacza związek hipotezy zerowej ze zmiennymi.

Jeśli twój p-value <. Znaczenie liczba, istnieje wystarczająco dużo dowodów, aby odrzucić hipotezę o wartości zerowej. Oznacza to, że istnieje niezerowa korelacja między zmiennymi.

Ale jeśli p-value > Znaczenie Wartość ta oznacza, że nie ma wystarczających dowodów na odrzucenie hipotezy zerowej. Oznacza to, że między zmiennymi może nie być korelacji.

W takim przypadku P-value zmiennej Cena =0,000948 <0,00117 (wartość istotności),

Tak więc nie dzieje się tutaj hipoteza zerowa, a jest wystarczająco dużo dowodów, aby ogłosić korelację między zmiennymi.

Z drugiej strony, dla zmiennej Sprzedane , the (P-value) 0.0038515 <0.0011723 (Significance value)

Więc może tu chodzić o hipotezę zerową, a nie ma wystarczających dowodów, aby zadeklarować niezerową korelację między zmiennymi.

W większości przypadków ta wartość P określa, czy dana zmienna znajdzie się w zbiorze danych, czy nie. Na przykład powinniśmy usunąć Sprzedane zmiennej, aby zachować solidność zbioru danych.

Równanie regresji

Ponieważ w Excelu wyznaczamy analizę regresji liniowej, linia trendu również powinna być liniowa. Ogólna postać to:

Y=mX+C.

Tutaj, Y jest zmienną zależną.

A X jest tu zmienną niezależną, co oznacza, że będziemy określać wpływ zmiany zmiennej x na zmienną Y.

C będzie po prostu wartością punktu przecięcia osi Y z linią.

W tym przypadku wartość interceptu C jest równa 9502,109853

A wartość m dla dwóch zmiennych wynosi -809,265 i 0,424818.

Mamy więc ostateczne równanie dla dwóch osobnych zmiennych.

Pierwszy z nich to:

Y=-809.265771X+9502.12

A równanie dla drugiej zmiennej to:

Y=0,4248X+9502,12

Współczynniki

Współczynniki, które otrzymaliśmy to. m1=-809.2655 oraz m2=04248 . I przechwytywacz, C= 9502.12 .

  • Po pierwsze, wartość przechwytująca wskazuje, że popyt wyniesie 9502, gdy cena będzie równa zero.
  • A wartości m oznaczają tempo zmian popytu na jednostkę zmiany ceny. Wartość współczynnika cenowego wynosi -809,265, co oznacza, że jednostkowy wzrost ceny spowoduje spadek popytu o około 809 jednostek.
  • Dla drugiej zmiennej, Sold, wartość m wynosi 0,424. Oznacza to, że zmiana na jednostkę sprzedanej pozycji spowoduje wzrost produktu o 0424 razy.

Resztki

Na stronie Pozostałości różnica między zapisem oryginalnym a wyliczonym z linii regresji to różnica. Resztki wskazują, jak bardzo rzeczywista wartość jest oddalona od linii. Na przykład obliczony zapis z analizy regresji dla pierwszego wpisu wynosi 9497. A pierwsza wartość oryginalna to 9500. Zatem pozostałość wynosi około 2,109.

T-Statystyka Wartość

Wartość T-statyczna to podzielenie współczynnika przez wartość standardową. Im wyższa jest ta wartość, tym lepsza wiarygodność współczynnika wskazuje.

Istnieje jeszcze jedno znaczenie tej wartości, które jest wymagane do obliczyć wartość P.

95% przedział ufności

Tutaj pewność zmiennej, którą na początku ustawiliśmy jako 95. Może się ona jednak zmienić.

  • Tutaj wartość współczynnika dolnych 95% jest obliczona jako 8496,84 oznacza górne 95% jest obliczone jako 10507,37,
  • Oznacza to, że podczas gdy nasz główny współczynnik wynosi około, 9502.1.istnieje duża szansa, że wartość może być poniżej 8496 dla 95% przypadków i 5% szans na to, że jest ponad 10507.37

Read More:

Rzeczy do zapamiętania

Metoda analizy regresji ocenia wyłącznie związek między badanymi zmiennymi. Nie ustala związku przyczynowego. W innych aspektach rozważa tylko aspekt korelacji. Gdy jakiś akt powoduje coś, to staje się przyczynowością. Gdy zmiana jednej zmiennej powoduje zmiany, to można to uznać za przyczynowość.

Analiza regresji jest mocno utrudniona przez wartości odstające. Wszystkie rodzaje wartości odstających muszą być usunięte przed wykonaniem analizy. Aby analizować i interpretować wyniki analizy regresji w programie Excel, należy wziąć pod uwagę te punkty.

Wniosek

Podsumowując, na pytanie "jak interpretować wyniki regresji w Excelu" odpowiadamy poprzez rozbudowaną analizę, a później interpretację.Analiza odbywa się poprzez. Analiza danych narzędzie w Dane tab.

Dla tego problemu dostępny jest do pobrania zeszyt ćwiczeń, w którym można przećwiczyć analizę regresji i jej interpretację.

Zapraszamy do zadawania wszelkich pytań i opinii poprzez sekcję komentarzy. Wszelkie sugestie dotyczące ulepszenia Exceldemy społeczności będzie wysoko oceniana.

Hugh West jest bardzo doświadczonym trenerem i analitykiem Excela z ponad 10-letnim doświadczeniem w branży. Posiada tytuł licencjata w dziedzinie rachunkowości i finansów oraz tytuł magistra administracji biznesowej. Hugh ma pasję do nauczania i opracował unikalne podejście do nauczania, które jest łatwe do naśladowania i zrozumienia. Jego specjalistyczna wiedza na temat programu Excel pomogła tysiącom studentów i profesjonalistów na całym świecie doskonalić swoje umiejętności i osiągać doskonałe wyniki w karierze. Za pośrednictwem swojego bloga Hugh dzieli się swoją wiedzą ze światem, oferując bezpłatne samouczki programu Excel i szkolenia online, aby pomóc osobom indywidualnym i firmom w pełni wykorzystać swój potencjał.