Come eseguire la regressione logistica in Excel (con passaggi rapidi)

  • Condividi Questo
Hugh West

Analisi di regressione è un calcolo statistico molto diffuso. Spesso eseguiamo questo tipo di calcolo in base alle nostre esigenze. In Excel, possiamo eseguire tipi multipli di analisi di regressione In questo articolo vi mostreremo come eseguire la regressione logistica in Excel. Se anche voi siete interessati a imparare questa analisi, scaricate la cartella di lavoro pratica e seguiteci.

Scarica il quaderno di esercizi

Scaricate questo eserciziario per esercitarvi durante la lettura di questo articolo.

Regressione logistica.xlsx

Che cos'è la regressione logistica?

L'analisi di regressione logistica è un algoritmo di apprendimento statistico che utilizza per prevedere il valore di una variabile dipendente in base ad alcuni criteri indipendenti. Aiuta una persona a ottenere il risultato da un grande insieme di dati in base alla categoria desiderata. L'analisi di regressione logistica è principalmente di tre tipi:

  1. Regressione logistica binaria
  2. Regressione logistica multinomiale
  3. Regressione logistica ordinale

Regressione logistica binaria: Nel modello di analisi di regressione binaria, definiamo una categoria solo in due casi: Sì/No o Positivo/Negativo.

Regressione logistica multinomiale: L'analisi logistica multinominale funziona con tre o più classificazioni. Se abbiamo più di due sezioni classificate per categorizzare i nostri dati, allora possiamo usare questo modello di analisi di regressione.

Regressione logistica ordinale: Questo modello di analisi di regressione funziona per più di due categorie, ma in questo modello è necessario un ordine predeterminato per categorizzarle.

Procedura passo-passo per eseguire la regressione logistica in Excel

In questo articolo eseguiremo l'analisi di regressione logistica binaria. Questo tipo di analisi ci fornisce un valore di previsione della variabile desiderata. Per eseguire l'analisi, consideriamo un set di dati di 10 macchine di un'industria. La disponibilità della macchina può essere positiva o negativa. Le cifre binarie 1=positivo , e 0=negativo e questi valori sono riportati nella colonna B L'età di queste macchine è in colonna C e la media delle ore di lavoro settimanali è riportata nella colonna D Il nostro set di dati si trova quindi nell'intervallo di celle B5:D14 I valori iniziali delle variabili del solutore di regressione sono nell'intervallo di celle C16:D18 L'intera procedura di analisi è spiegata di seguito passo per passo:

Passo 1: inserimento del set di dati

In questa fase, importeremo il set di dati:

  • Prima di tutto, inserite con precisione il vostro set di dati in Excel. Per la nostra analisi, abbiamo inserito il set di dati nell'intervallo di celle B5:D14 .

  • Quindi, inserire il proprio Risolutore Decisione Varibles' Li inseriamo nell'intervallo di celle D16:D18.
  • Assumiamo i valori di tutte le variabili come 0.01 .

Per saperne di più: Regressione lineare multipla su set di dati Excel (2 metodi)

Fase 2: Valutazione del valore logico

In questa fase, calcoleremo il valore di Logit per il nostro set di dati. Definiamo il valore Logit valore come X La formula di Logit valore è:

Qui, b0, b1, e b2 sono variabili di regressione.

  • Scrivete la seguente formula nella cella E5 Usare il segno Assoluto per bloccare il valore delle celle delle variabili. Se non si sa come inserire il segno Riferimento assoluto alla cella è possibile inserirlo in diversi modi.

=$D$16+$D$17*C5+$D$18*D5

  • Quindi, premere il tasto Entrare sulla tastiera.

  • Dopo di che, doppio clic sul Maniglia di riempimento per copiare la formula fino alla cella E14 .

  • Si otterranno tutti i valori di X .

Per saperne di più: Come eseguire una semplice regressione lineare in Excel (4 semplici metodi)

Fase 3: Determinazione dell'esponenziale di Logit per ciascun dato

In questo caso, calcoleremo il valore esponenziale del valore del logit. la funzione EXP :

  • Per determinare il valore esponenziale di X scrivere la seguente formula nella cella F5 :

=EXP(E5)

  • Allo stesso modo, doppio clic sul Maniglia di riempimento per copiare la formula come nel passo precedente. Tutti i valori esponenziali di X .

Fase 4: Calcolo del valore di probabilità

P(X) è il valore della probabilità che si verifichi il X evento. La probabilità dell'evento X può essere definito come:

  • Per calcolarlo, scrivere la seguente formula nella cella G5 .

=F5/(1+F5)

  • Premere il tasto Entrare chiave.
  • A questo punto, trascinare l'elemento Maniglia di riempimento icona fino a G15 per ottenere il valore per tutti i valori.

Per saperne di più: Come calcolare il valore P nella regressione lineare in Excel (3 modi)

Fase 5: valutazione del valore della somma delle probabilità logiche

Nei passi successivi, valuteremo il valore di Log-Likelihood. Dopodiché si utilizzerà la funzione SOMMA per aggiungere tutti i dati:

  • Per calcolare il Probabilità logica utilizzeremo il valore l'LN funzione nel nostro set di dati. Nella cella H5 , scrivere la seguente formula:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • A questo punto, premere il tasto Entrare sulla tastiera.

  • Allora, doppio clic sul Maniglia di riempimento per determinare tutti i valori di verosimiglianza.

  • Successivamente, nella cella H15 scrivere la seguente formula per sommare tutti i valori.

=SOMMA(H5:H14)

🔍 Ripartizione della formula

Stiamo eseguendo questa ripartizione per le cellule H5 .

👉 LN(G5): Questa funzione restituisce -0.384.

👉 LN(1-G5): Questa funzione restituisce -1.144.

👉 (B5*LN(G5))+((1-B5)*LN(1-G5)): Questa funzione restituisce -0.384.

Fase 6: Utilizzo dello strumento di analisi Solver per l'analisi finale

A questo punto, si procederà con l'analisi di regressione finale, che verrà eseguita attraverso la funzione Risolutore Se non lo si vede nella finestra di dialogo Dati è necessario abilitare la scheda Risolutore dal Componenti aggiuntivi di Excel .

  • Per attivarla, selezionare File> Opzioni .

  • Di conseguenza, una finestra di dialogo chiamata Opzioni di Excel apparirà.
  • In questa finestra di dialogo, selezionare la voce Componenti aggiuntivi opzione.
  • A questo punto, scegliere l'opzione Componenti aggiuntivi di Excel nel file Gestire e fare clic su Vai .

  • Una piccola finestra di dialogo intitolata Componenti aggiuntivi apparirà.
  • Quindi, controllare il Solutore aggiuntivo e fare clic su OK .

  • Dopodiché, andare alla sezione Dati e troverete la scheda Risolutore nel comando Analisi gruppo.

  • A questo punto, fare clic sul pulsante Risolutore comando.
  • Una nuova finestra di dialogo intitolata Parametri del solutore apparirà.
  • Nel Impostare l'obiettivo scegliere la cella $H$15 Con il mouse è possibile scrivere il riferimento alla cella anche con la tastiera, assicurandosi di utilizzare il tasto Riferimento assoluto alla cella firmare qui.
  • Successivamente, nella Modificando le celle variabili selezionare l'intervallo di celle $D$16:$D$18 .
  • Quindi, deselezionare il campo Rendere non negative le variabili non vincolate per ottenere i valori negativi se sono già indicati come controllati.
  • Infine, fare clic sul pulsante Risolvere pulsante.

  • Di conseguenza, il Risultato del risolutore apparirà un riquadro di fronte all'utente.
  • A questo punto, scegliere l'opzione Soluzione Keep Solver Questo riquadro mostra anche se l'analisi di regressione è convergente o divergente.
  • Cliccare OK per chiudere il riquadro.

  • Infine, si vedranno i valori della variabile nell'intervallo di celle D16:D18 Oltre a questo, si vedranno anche i valori delle colonne E, F, G , e H mostrano differenze rispetto alle fasi precedenti.

🔍 Illustrazione del risultato dell'analisi di regressione binaria

Dopo aver completato l'analisi di regressione logistica binaria in Excel, si vedrà che il valore della variabile di regressione ipotizzata è stato sostituito con il nuovo valore dell'analisi e che questi valori sono il valore corretto della variabile di regressione del nostro set di dati. Possiamo considerare il risultato di qualsiasi dato specifico, come la macchina che ha un'età di 68 mesi e 4 mediamente nessun turno a settimana. Il valore di P(X) è 0.67 Questo ci fa capire che se cerchiamo la macchina in condizioni di lavoro, la possibilità che si verifichi questo evento è circa 67% .

Possiamo anche mostrarlo separatamente, utilizzando i valori finali della variabile di regressione.

Possiamo quindi affermare che la nostra procedura di lavoro ha funzionato con successo e siamo in grado di effettuare l'analisi di regressione logistica binaria.

Conclusione

Spero che questo articolo vi sia stato utile e che siate in grado di eseguire la regressione logistica in Excel. Vi invitiamo a condividere con noi ulteriori domande o consigli nella sezione commenti qui sotto.

Non dimenticate di consultare il nostro sito web ExcelWIKI per diversi problemi e soluzioni relativi a Excel. Continuate a imparare nuovi metodi e a crescere!

Hugh West è un istruttore e analista di Excel di grande esperienza con oltre 10 anni di esperienza nel settore. Ha conseguito una laurea in Contabilità e Finanza e un Master in Economia Aziendale. Hugh ha una passione per l'insegnamento e ha sviluppato un approccio didattico unico che è facile da seguire e capire. La sua conoscenza approfondita di Excel ha aiutato migliaia di studenti e professionisti in tutto il mondo a migliorare le proprie competenze ed eccellere nella propria carriera. Attraverso il suo blog, Hugh condivide le sue conoscenze con il mondo, offrendo esercitazioni gratuite su Excel e formazione online per aiutare le persone e le aziende a raggiungere il loro pieno potenziale.