Jak zrobić regresję logistyczną w Excelu (z szybkimi krokami)

  • Udostępnij To
Hugh West

Analiza regresji jest szeroko stosowaną metodą obliczeń statystycznych. Często wykonujemy tego typu obliczenia zgodnie z naszym życzeniem. W programie Excel możemy wykonać wiele rodzajów analizy regresji W tym artykule pokażemy jak wykonać regresję logistyczną w Excelu. Jeśli również jesteś zainteresowany nauką tej analizy, pobierz zeszyt ćwiczeń i śledź nas.

Pobierz Zeszyt ćwiczeń

Pobierz ten zeszyt ćwiczeń, aby ćwiczyć podczas czytania tego artykułu.

Logistic Regression.xlsx

Co to jest regresja logistyczna?

Analiza regresji logistycznej jest algorytmem uczenia statystycznego, który wykorzystuje do przewidywania wartości zmiennej zależnej w oparciu o pewne niezależne kryteria. Pomaga osobie uzyskać wynik z dużego zbioru danych w oparciu o jego pożądaną kategorię. Analiza regresji logistycznej głównie trzy typy:

  1. Binarna regresja logistyczna
  2. Wielomianowa regresja logistyczna
  3. Regresja logistyczna porządkowa

Binary Logistic Regression: W modelu analizy regresji binarnej definiujemy kategorię tylko przez dwa przypadki. Tak/Nie lub Pozytywny/Negatywny.

Multinomialna regresja logistyczna: Wielomianowa analiza logistyczna działa z trzema lub więcej klasyfikacjami. Jeśli mamy więcej niż dwie sklasyfikowane sekcje, aby skategoryzować nasze dane, wtedy możemy użyć tego modelu analizy regresji.

Ordinal Logistic Regression: Ten model analizy regresji działa dla więcej niż dwóch kategorii, jednak w tym modelu potrzebujemy z góry ustalonej kolejności ich kategoryzacji.

Procedura krok po kroku do wykonania regresji logistycznej w Excelu

W tym artykule przeprowadzimy analizę binarnej regresji logistycznej.Ten rodzaj analizy dostarcza nam wartości predykcyjnej pożądanej zmiennej.Aby przeprowadzić analizę, rozważamy zbiór danych 10 maszyn z pewnej branży.Dostępność maszyny może być dodatnia lub ujemna.Cyfry binarne 1=pozytywny oraz 0=ujemny , a wartości te są przedstawione w kolumnie B Wiek tych maszyn jest w kolumnie C a średni czas ich pracy w tygodniu znajduje się w kolumnie D Zatem nasz zbiór danych zawiera się w przedziale komórek B5:D14 Wartości zmiennej początkowej solwera regresji znajdują się w zakresie komórek C16:D18 Cała procedura analizy jest wyjaśniona poniżej krok po kroku:

Krok 1: Wprowadź swój zbiór danych

W tym kroku zajmiemy się importem zbioru danych:

  • Po pierwsze, wprowadź dokładnie swój zbiór danych do Excela. Dla naszej analizy wprowadzamy zbiór danych w zakresie komórek B5:D14 .

  • Następnie wprowadź swoje Solver Decision Varibles Wprowadzamy je do zakresu komórek D16:D18.
  • Przyjmujemy wartości wszystkich zmiennych jako 0.01 .

Read More: Wielokrotna regresja liniowa na zestawach danych w Excelu (2 metody)

Krok 2: Oszacowanie wartości logitu

W tym kroku będziemy obliczać Logit dla naszego zbioru danych. Definiujemy Logit wartość jako X w naszych obliczeniach. Wzór Logit wartość to:

Tutaj, b0, b1, oraz b2 są zmiennymi regresyjnymi.

  • Zapisz w komórce następującą formułę E5 Użyj znaku Absolute, aby zamrozić wartość komórki zmiennych. Jeśli nie wiesz, jak wprowadzić Bezwzględne odniesienie do komórki znak, można go wprowadzić na kilka sposobów.

=$D$16+$D$17*C5+$D$18*D5

  • Następnie naciśnij przycisk Wejdź na stronę na klawiaturze.

  • Po tym, kliknij dwukrotnie na stronie na Uchwyt do napełniania aby skopiować formułę do komórki E14 .

  • Otrzymasz wszystkie wartości X .

Read More: Jak zrobić prostą regresję liniową w Excelu (4 proste metody)

Krok 3: Określenie wykładnika logitu dla każdych danych

Tutaj obliczymy wartość wykładniczą wartości logitu, Do tego celu wykorzystamy funkcja EXP :

  • Aby wyznaczyć wartość wykładniczą X , zapisz w komórce następującą formułę F5 :

=EXP(E5)

  • Podobnie, kliknij dwukrotnie na stronie na Uchwyt do napełniania aby skopiować wzór jak w poprzednim kroku. Wszystkie wartości wykładnicze z X .

Krok 4: Obliczanie wartości prawdopodobieństwa

P(X) jest wartością prawdopodobieństwa wystąpienia X zdarzenie. prawdopodobieństwo zdarzenia X można określić jako:

  • Aby ją obliczyć, zapisz w komórce następujący wzór G5 .

=F5/(1+F5)

  • Naciśnij przycisk Wejdź na stronę klucz.
  • Teraz przeciągnij Uchwyt do napełniania ikona aż do G15 aby uzyskać wartość dla wszystkich wartości.

Read More: Jak obliczyć wartość P w regresji liniowej w Excelu (3 sposoby)

Krok 5: Oszacowanie sumy wartości log-Likelihood

W kolejnych krokach ocenimy wartość Log-Likelihood. Następnie użyjemy funkcja SUM aby dodać wszystkie dane:

  • Aby obliczyć Log-Likelihood wartość, użyjemy LN funkcja w naszym zestawie danych. W komórce H5 , zapisz dokonaj następującego wzoru:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Teraz naciśnij przycisk Wejdź na stronę klawisz na klawiaturze.

  • Następnie, kliknij dwukrotnie na stronie na Uchwyt do napełniania ikona, aby określić wszystkie wartości log-likelihood.

  • Następnie, w komórce H15 , zapisz następujący wzór na zsumowanie wszystkich wartości.

=SUM(H5:H14)

🔍 Rozbicie formuły

Robimy ten podział dla komórki H5 .

👉 LN(G5): Funkcja ta zwraca -0.384.

👉 LN(1-G5): Funkcja ta zwraca -1.144.

👉 (B5*LN(G5))+((1-B5)*LN(1-G5)): Funkcja ta zwraca -0.384.

Krok 6: Użyj narzędzia analitycznego Solver do analizy końcowej

Teraz przeprowadzimy ostateczną analizę regresji. Analizę przeprowadzimy poprzez. Solver Jeśli nie widzisz go w komendzie Dane zakładka, należy włączyć Solver od Dodatki do programu Excel .

  • Aby ją włączyć, należy wybrać Plik> Opcje .

  • W wyniku tego pojawi się okno dialogowe o nazwie Opcje programu Excel pojawi się.
  • W tym oknie dialogowym wybierz Dodatki opcja.
  • Teraz należy wybrać Dodatki do programu Excel opcja w Zarządzaj i kliknij Wejdź na stronę .

  • Pojawi się małe okno dialogowe zatytułowane Dodatki pojawi się.
  • Następnie należy sprawdzić Dodatek Solver i kliknąć OK .

  • Następnie należy przejść do Dane zakładka, w której znajdziesz Solver polecenie w Analiza grupa.

  • Teraz kliknij na Solver polecenie.
  • Pojawi się nowe okno dialogowe zatytułowane Parametry solwera pojawi się.
  • W Ustalenie celu wybierz komórkę $H$15 Możesz również napisać referencję do komórki na klawiaturze. Upewnij się, że używasz Bezwzględne odniesienie do komórki podpisz tutaj.
  • Następnie, w Poprzez zmianę komórek zmiennych opcja wyboru zakresu komórek $D$16:$D$18 .
  • Następnie usuń zaznaczenie Spraw, by zmienne nieobjęte ograniczeniami były nieujemne aby uzyskać wartości ujemne, jeśli jest już pokazany jako zaznaczony.
  • Na koniec kliknij przycisk Rozwiąż przycisk.

  • W związku z tym Solver Wynik pojawi się przed Tobą pole.
  • Teraz należy wybrać Keep Solver Solution To pole pokaże Ci również, czy Twoja analiza regresji była zbieżna czy rozbieżna.
  • Kliknij OK aby zamknąć skrzynkę.

  • W końcu zobaczysz wartości zmiennej w zakresie komórek D16:D18 Oprócz tego widać również wartości kolumn E, F, G oraz H wykazują również różnice w stosunku do poprzednich etapów.

🔍 Ilustracja wyników analizy regresji binarnej

Po zakończeniu analizy binarnej regresji logistycznej w Excelu widać, że nasza założona wartość zmiennej regresyjnej została zastąpiona nową wartością analizy i te wartości są poprawnymi wartościami zmiennej regresyjnej naszego zbioru danych. Możemy rozważyć wynik dowolnych konkretnych danych, jak np. maszyna, której wiek wynosi 68 miesiące i 4 średnio bez zmiany w tygodniu. Wartość P(X) jest 0.67 Ilustruje nam to, że jeśli szukamy maszyny w stanie roboczym to prawdopodobieństwo tego zdarzenia jest ok. 67% .

Możemy też pokazać ją osobno, wykorzystując końcowe wartości zmiennej regresyjnej.

Możemy więc powiedzieć, że nasza procedura robocza zadziałała pomyślnie i jesteśmy w stanie przeprowadzić binarną analizę regresji logistycznej.

Wniosek

To już koniec tego artykułu. Mam nadzieję, że ten artykuł będzie dla Ciebie pomocny i będziesz w stanie wykonać regresję logistyczną w Excelu. Proszę podziel się z nami wszelkimi dalszymi zapytaniami lub zaleceniami w sekcji komentarzy poniżej.

Nie zapomnij sprawdzić naszej strony internetowej ExcelWIKI dla kilku problemów i rozwiązań związanych z Excelem. Ucz się wciąż nowych metod i rozwijaj się!

Hugh West jest bardzo doświadczonym trenerem i analitykiem Excela z ponad 10-letnim doświadczeniem w branży. Posiada tytuł licencjata w dziedzinie rachunkowości i finansów oraz tytuł magistra administracji biznesowej. Hugh ma pasję do nauczania i opracował unikalne podejście do nauczania, które jest łatwe do naśladowania i zrozumienia. Jego specjalistyczna wiedza na temat programu Excel pomogła tysiącom studentów i profesjonalistów na całym świecie doskonalić swoje umiejętności i osiągać doskonałe wyniki w karierze. Za pośrednictwem swojego bloga Hugh dzieli się swoją wiedzą ze światem, oferując bezpłatne samouczki programu Excel i szkolenia online, aby pomóc osobom indywidualnym i firmom w pełni wykorzystać swój potencjał.