Cum se face regresia logistică în Excel (cu pași rapizi)

  • Imparte Asta
Hugh West

Analiza de regresie este un calcul statistic utilizat pe scară largă. Adesea facem acest tip de calcul în funcție de dorința noastră. În Excel, putem efectua tipuri multiple de analiză de regresie În acest articol, vom demonstra cum se face regresia logistică în Excel. Dacă și tu ești interesat să înveți această analiză, descarcă caietul de practică și urmărește-ne.

Descărcați caietul de practică

Descărcați acest caiet de exerciții pentru a exersa în timp ce citiți acest articol.

Regresie logistică.xlsx

Ce este regresia logistică?

Analiza de regresie logistică este un algoritm de învățare statistică care folosește pentru a prezice valoarea unei variabile dependente pe baza unor criterii independente. Aceasta ajută o persoană să obțină rezultatul dintr-un set mare de date pe baza categoriei dorite. Analiza de regresie logistică are în principal trei tipuri:

  1. Regresie logistică binară
  2. Regresie logistică multinomială
  3. Regresie logistică ordinară

Regresie logistică binară: În modelul de analiză prin regresie binară, definim o categorie prin doar două cazuri: Da/Nu sau Pozitiv/Negativ.

Regresie logistică multinomială: Analiza logistică multinominală funcționează cu trei sau mai multe clasificări. Dacă avem mai mult de două secțiuni clasificate pentru a clasifica datele noastre, atunci putem utiliza acest model de analiză de regresie.

Regresie logistică ordinală: Acest model de analiză de regresie funcționează pentru mai mult de două categorii. Cu toate acestea, în acest model, avem nevoie de o ordine prestabilită pentru a le clasifica.

Procedura pas cu pas pentru a face regresie logistică în Excel

În acest articol, vom efectua analiza de regresie logistică binară. Acest tip de analiză ne oferă o valoare de predicție a variabilei dorite. Pentru a efectua analiza, considerăm un set de date format din 10 utilaje dintr-o industrie. Disponibilitatea utilajului poate fi pozitivă sau negativă. Cifrele binare 1=pozitiv , și 0=negativ , iar aceste valori sunt prezentate în coloana B Vechimea acestor mașini este în coloană. C iar numărul mediu de ore de serviciu pe săptămână al acestora este în coloana D Așadar, setul nostru de date se află în intervalul de celule B5:D14 Valorile variabilei inițiale de rezolvare a regresiei sunt în intervalul de celule. C16:D18 Întreaga procedură de analiză este explicată mai jos, pas cu pas:

Pasul 1: Introduceți setul de date

În această etapă, vom importa setul de date:

  • În primul rând, introduceți cu exactitate setul de date în Excel. Pentru analiza noastră, am introdus setul de date în intervalul de celule B5:D14 .

  • Apoi, introduceți datele dvs. Rezolvarea deciziei Variabile Le introducem în intervalul de celule D16:D18.
  • Presupunem că toate valorile variabilelor sunt următoarele 0.01 .

Citește mai mult: Regresie liniară multiplă pe seturi de date Excel (2 metode)

Pasul 2: Evaluați valoarea Logit

În această etapă, vom calcula valoarea Logit pentru setul nostru de date. Definim valoarea Logit valoare ca X în calculele noastre. Formula de Logit valoarea este:

Aici, b0, b1, și b2 sunt variabile de regresie.

  • Scrieți următoarea formulă în celula E5 Folosiți semnul Absolut pentru a îngheța valoarea celulei variabilelor. Dacă nu știți cum să introduceți valoarea Referință absolută la celulă îl puteți introduce în mai multe moduri.

=$D$16+$D$17*C5+$D$18*D5

  • Apoi, apăsați butonul Introduceți de pe tastatura dumneavoastră.

  • După aceea, faceți dublu clic pe pe Mâner de umplere pentru a copia formula până la celula E14 .

  • Veți obține toate valorile din X .

Citește mai mult: Cum se face o regresie liniară simplă în Excel (4 metode simple)

Pasul 3: Determinați exponențialul sau Logit pentru fiecare dată

Aici, vom calcula valoarea exponențială a valorii logit, Pentru aceasta, vom folosi funcția EXP :

  • Pentru a determina valoarea exponențială a X , scrieți următoarea formulă în celula F5 :

=EXP(E5)

  • În mod similar, faceți dublu clic pe pe Mâner de umplere pentru a copia formula ca la pasul anterior. Veți obține toate valorile exponențiale ale lui X .

Pasul 4: Calculați valoarea probabilității

P(X) este valoarea probabilității de apariție a X probabilitatea de apariție a evenimentului X se poate defini ca:

  • Pentru a o calcula, scrieți următoarea formulă în celulă G5 .

=F5/(1+F5)

  • Apăsați butonul Introduceți cheie.
  • Acum, trageți de butonul Mâner de umplere pictograma până la G15 pentru a obține valoarea pentru toate valorile.

Citește mai mult: Cum să calculați valoarea P în regresia liniară în Excel (3 moduri)

Pasul 5: Evaluați suma valorilor logaritmilor de probabilitate

În următorii pași, vom evalua valoarea lui Log-Likelihood. După aceea vom folosi funcția SUM pentru a adăuga toate datele:

  • Pentru a calcula Log-Likelihood vom folosi valoarea LN funcția în setul nostru de date. În celula H5 , scrieți următoarea formulă:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Acum, apăsați butonul Introduceți de pe tastatură.

  • Apoi, faceți dublu clic pe pe Mâner de umplere pentru a determina toate valorile logaritmice ale verosimilitudinii.

  • După aceea, în celulă H15 , scrieți următoarea formulă pentru a aduna toate valorile.

=SUM(H5:H14)

🔍 Descompunerea formulei

Facem această defalcare pentru celule H5 .

👉 LN(G5): Această funcție returnează -0.384.

👉 LN(1-G5): Această funcție returnează -1.144.

👉 (B5*LN(G5))+((1-B5)*LN(1-G5)): Această funcție returnează -0.384.

Pasul 6: Utilizați instrumentul de analiză Solver pentru analiza finală

Acum, vom efectua analiza de regresie finală. Vom efectua analiza prin intermediul aplicației Solver Dacă nu o vedeți în lista de comandă Date trebuie să activați opțiunea Solver de la Suplimente Excel .

  • Pentru a o activa, selectați Fișier> Opțiuni .

  • Ca urmare, apare o casetă de dialog numită Opțiuni Excel va apărea.
  • În această casetă de dialog, selectați Completări opțiune.
  • Acum, alegeți Suplimente Excel din cadrul opțiunii Gestionați și faceți clic pe Du-te .

  • Apare o mică fereastră de dialog intitulată Completări va apărea.
  • Apoi, verificați Solver Add-in opțiune și faceți clic pe OK .

  • După aceea, mergeți la Date și veți găsi Solver în cadrul comenzii Analiză grup.

  • Acum, faceți clic pe butonul Solver comandă.
  • Apare o nouă casetă de dialog intitulată Parametrii de rezolvare va apărea.
  • În Stabilirea obiectivului caseta, alegeți celula $H$15 cu ajutorul mouse-ului. Puteți, de asemenea, să scrieți referința celulei la tastatură. Asigurați-vă că folosiți simbolul Referință absolută a celulei semnați aici.
  • În continuare, în secțiunea Prin schimbarea celulelor variabile opțiunea selectați intervalul de celule $D$16:$D$18 .
  • Apoi, debifați caseta Faceți variabilele neconstrânse non-negative pentru a obține valorile negative, în cazul în care este deja afișată ca fiind bifată.
  • În cele din urmă, faceți clic pe butonul Rezolvă buton.

  • Ca urmare, se va Rezultat Solver va apărea în fața dumneavoastră.
  • Acum, alegeți Păstrați Soluția Solver Această casetă vă va arăta, de asemenea, dacă analiza dvs. de regresie a fost convergentă sau divergentă.
  • Faceți clic pe OK pentru a închide caseta.

  • În cele din urmă, veți vedea valorile variabilei în intervalul de celule D16:D18 Pe lângă aceasta, veți vedea și valorile coloanelor E, F, G , și H prezintă, de asemenea, diferențe față de etapele anterioare.

🔍 Ilustrarea rezultatului analizei de regresie binară

După finalizarea analizei de regresie logistică binară în Excel, veți vedea că valoarea presupusă a variabilei noastre de regresie este înlocuită cu noua valoare a analizei, iar aceste valori reprezintă valoarea corectă a variabilei de regresie a setului nostru de date. Putem lua în considerare rezultatul oricăror date specifice, cum ar fi mașina care are o vârstă de 68 luni și 4 valoarea medie a numărului de ture pe săptămână. P(X) este 0.67 Aceasta ne ilustrează faptul că, dacă căutăm mașina în stare de funcționare, posibilitatea ca acest eveniment să se întâmple este de aproximativ 67% .

Putem, de asemenea, să o prezentăm separat, folosind valorile finale ale variabilei de regresie.

Astfel, putem spune că procedura noastră de lucru a funcționat cu succes și că suntem capabili să efectuăm analiza de regresie logistică binară.

Concluzie

Acesta este sfârșitul acestui articol. Sper că acest articol vă va fi de ajutor și că veți putea face regresie logistică în Excel. Vă rugăm să ne împărtășiți orice alte întrebări sau recomandări în secțiunea de comentarii de mai jos.

Nu uitați să verificați site-ul nostru ExcelWIKI pentru mai multe probleme și soluții legate de Excel. Continuați să învățați noi metode și continuați să vă dezvoltați!

Hugh West este un trainer și analist Excel cu o experiență de peste 10 ani în industrie. Deține o diplomă de licență în contabilitate și finanțe și un master în administrarea afacerilor. Hugh are o pasiune pentru predare și a dezvoltat o abordare unică de predare care este ușor de urmărit și de înțeles. Cunoștințele sale experte despre Excel au ajutat mii de studenți și profesioniști din întreaga lume să-și îmbunătățească abilitățile și să exceleze în cariera lor. Prin blogul său, Hugh își împărtășește cunoștințele lumii, oferind tutoriale gratuite Excel și instruire online pentru a ajuta persoanele și companiile să-și atingă întregul potențial.