Table des matières
Analyse de régression est un calcul statistique très utilisé. Nous faisons souvent ce type de calcul selon notre désir. Dans Excel, nous pouvons effectuer plusieurs types d'analyse de régression Dans cet article, nous allons vous montrer comment effectuer une régression logistique dans Excel. Si vous souhaitez également apprendre cette analyse, téléchargez le cahier d'exercices et suivez-nous.
Télécharger le cahier d'exercices
Téléchargez ce cahier d'exercices pour vous entraîner pendant que vous lisez cet article.
Logistic Regression.xlsx
Qu'est-ce que la régression logistique ?
L'analyse de régression logistique est un algorithme d'apprentissage statistique qui permet de prédire la valeur d'une variable dépendante en fonction de certains critères indépendants. Elle aide une personne à obtenir le résultat d'un grand ensemble de données en fonction de la catégorie qu'elle souhaite. L'analyse de régression logistique est principalement de trois types :
- Régression logistique binaire
- Régression logistique multinomiale
- Régression logistique ordinale
Régression logistique binaire : Dans le modèle d'analyse de régression binaire, nous définissons une catégorie par deux cas seulement : Oui/Non ou Positif/Négatif.
Régression logistique multinomiale : L'analyse logistique multinominale fonctionne avec trois classifications ou plus. Si nous avons plus de deux sections classées pour catégoriser nos données, nous pouvons utiliser ce modèle d'analyse de régression.
Régression logistique ordinale : Ce modèle d'analyse de régression fonctionne pour plus de deux catégories. Cependant, dans ce modèle, nous avons besoin d'un ordre prédéterminé pour les classer.
Procédure étape par étape pour effectuer une régression logistique dans Excel
Dans cet article, nous allons effectuer l'analyse de régression logistique binaire. Ce type d'analyse nous fournit une valeur de prédiction de la variable souhaitée. Pour effectuer l'analyse, nous considérons un ensemble de données de 10 machines d'une industrie. La disponibilité de la machine peut être positive ou négative. Les chiffres binaires 1=positif et 0=négatif et ces valeurs sont indiquées dans la colonne B L'âge de ces machines est en colonne C et la moyenne de leurs heures de service par semaine est dans la colonne D Ainsi, notre jeu de données est dans la gamme de cellules B5:D14 Les valeurs de la variable initiale du solveur de régression se situent dans la plage des cellules. C16:D18 L'ensemble de la procédure d'analyse est expliqué ci-dessous étape par étape :
Étape 1 : Saisissez votre ensemble de données
Dans cette étape, nous allons importer votre jeu de données :
- Tout d'abord, saisissez votre ensemble de données avec précision dans Excel. Pour notre analyse, nous avons saisi l'ensemble de données dans la plage de cellules suivantes B5:D14 .
- Ensuite, saisissez votre Solveur de décision "Varibles Nous les saisissons dans la plage de cellules D16:D18.
- Nous supposons que les valeurs de toutes les variables sont les suivantes 0.01 .
Lire la suite : Régression linéaire multiple sur des jeux de données Excel (2 méthodes)
Étape 2 : Évaluer la valeur du logit
Dans cette étape, nous allons calculer la Logit pour notre ensemble de données. Logit comme X dans notre calcul. La formule de Logit la valeur est :
Ici, b0, b1, et b2 sont des variables de régression.
- Inscrivez la formule suivante dans la cellule E5 Utilisez le signe Absolu pour figer la valeur des variables dans la cellule. Si vous ne savez pas comment saisir le signe Absolu, vous pouvez utiliser le signe Absolu. Référence absolue de cellule vous pouvez l'introduire de plusieurs manières.
=$D$16+$D$17*C5+$D$18*D5
- Ensuite, appuyez sur la touche Entrez de votre clavier.
- Après ça, double-cliquez sur sur le Poignée de remplissage pour copier la formule jusqu'à la cellule E14 .
- Vous obtiendrez toutes les valeurs de X .
Lire la suite : Comment effectuer une régression linéaire simple dans Excel (4 méthodes simples)
Étape 3 : Déterminer l'exponentiel ou le logit pour chaque donnée
Ici, nous allons calculer la valeur exponentielle de la valeur logit, Pour cela, nous allons utiliser la fonction EXP :
- Pour déterminer la valeur exponentielle de X écrivez la formule suivante dans la cellule F5 :
=EXP(E5)
- De même, double-cliquez sur sur le Poignée de remplissage pour copier la formule comme à l'étape précédente. Vous aurez toutes les valeurs exponentielles de X .
Étape 4 : Calculer la valeur de la probabilité
P(X) est la valeur de probabilité de l'occurrence de la X La probabilité de l'événement X peut se définir comme suit :
- Pour le calculer, écrivez la formule suivante dans la cellule G5 .
=F5/(1+F5)
- Appuyez sur le bouton Entrez clé.
- Maintenant, faites glisser le Poignée de remplissage l'icône jusqu'à G15 pour obtenir la valeur de toutes les valeurs.
Lire la suite : Comment calculer la valeur P dans une régression linéaire dans Excel (3 façons)
Étape 5 : Évaluation de la somme des valeurs de log-vraisemblance
Dans les étapes suivantes, nous allons évaluer la valeur de Log-vraisemblance. Après cela, nous utiliserons la fonction SUM pour ajouter toutes les données :
- Pour calculer le Log-vraisemblance nous allons utiliser la valeur le LN fonction dans notre ensemble de données. Dans la cellule H5 , écrire fait la formule suivante :
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Maintenant, appuyez sur le Entrez sur le clavier.
- Ensuite, double-cliquez sur sur le Poignée de remplissage pour déterminer toutes les valeurs de log-vraisemblance.
- Ensuite, dans la cellule H15 écrivez la formule suivante pour additionner toutes les valeurs.
=SUM(H5:H14)
🔍 Répartition de la formule
Nous faisons cette ventilation pour la cellule H5 .
👉
LN(G5) : Cette fonction renvoie -0.384.
👉
LN(1-G5) : Cette fonction renvoie -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Cette fonction renvoie -0.384.
Étape 6 : Utiliser l'outil d'analyse Solver pour l'analyse finale
Nous allons maintenant procéder à l'analyse de régression finale, en utilisant la méthode d'analyse suivante Solveur Si vous ne le voyez pas dans la fenêtre de l'outil de gestion de l'information, vous pouvez l'utiliser. Données vous devez activer l'option Solveur de la Compléments d'Excel .
- Pour l'activer, sélectionnez Fichier> ; Options .
- En conséquence, une boîte de dialogue appelée Options Excel apparaîtra.
- Dans cette boîte de dialogue, sélectionnez le Compléments d'information option.
- Maintenant, choisissez le Compléments d'Excel dans l'option Gérer et cliquez sur Allez sur .
- Une petite boîte de dialogue intitulée Compléments d'information apparaîtra.
- Ensuite, vérifiez le Solver Add-in et cliquez sur OK .
- Après cela, allez dans le Données et vous trouverez l'onglet Solveur dans le Analyse groupe.
- Maintenant, cliquez sur le Solveur commandement.
- Une nouvelle boîte de dialogue intitulée Paramètres du solveur apparaîtra.
- Dans le Fixer un objectif choisissez la cellule $H$15 avec votre souris. Vous pouvez également écrire la référence de la cellule sur votre clavier. Assurez-vous d'utiliser la touche Référence absolue de cellule signez ici.
- Ensuite, dans le En changeant les cellules variables option sélectionner la plage de cellules $D$16:$D$18 .
- Ensuite, décochez la case Rendre les variables non contraintes non négatives pour obtenir les valeurs négatives s'il est déjà affiché comme coché.
- Enfin, cliquez sur le bouton Résoudre bouton.
- Par conséquent, le Résultat du solveur apparaît devant vous.
- Maintenant, choisissez le Solution Keep Solver Cette boîte vous indiquera également si votre analyse de régression a convergé ou divergé.
- Cliquez sur OK pour fermer la boîte.
- Enfin, vous verrez les valeurs de la variable dans la plage de cellules D16:D18 est modifié. En plus de cela, vous verrez également les valeurs des colonnes E, F, G et H montrent également des différences par rapport aux étapes précédentes.
🔍 Illustration du résultat de l'analyse de régression binaire
Après l'achèvement de l'analyse de régression logistique binaire dans Excel, vous verrez que la valeur de notre variable de régression supposée est remplacée par la nouvelle valeur d'analyse et que ces valeurs sont la valeur correcte de la variable de régression de notre ensemble de données. Nous pouvons considérer le résultat de n'importe quelle donnée spécifique, comme la machine qui a un âge de 68 mois et 4 La valeur de l'indicateur est de 1,5 million d'euros. P(X) est 0.67 Cela nous montre que si nous cherchons une machine en état de marche, la probabilité de cet événement est d'environ 1,5 %. 67% .
Nous pouvons également le montrer séparément, en utilisant les valeurs finales de la variable de régression.
Ainsi, nous pouvons dire que notre procédure de travail a fonctionné avec succès et que nous sommes en mesure de faire une analyse de régression logistique binaire.
Conclusion
C'est la fin de cet article. J'espère que cet article vous sera utile et que vous serez en mesure d'effectuer une régression logistique dans Excel. Veuillez nous faire part de toute autre question ou recommandation dans la section des commentaires ci-dessous.
N'oubliez pas de consulter notre site web ExcelWIKI pour plusieurs problèmes et solutions liés à Excel. Continuez à apprendre de nouvelles méthodes et à progresser !