Table des matières
Il peut être nécessaire d'identifier les valeurs aberrantes afin d'effectuer des calculs statistiques sur les données d'un ensemble de données. Vous pouvez découvrir les valeurs aberrantes d'énormes ensembles de données à l'aide de Microsoft Excel de plusieurs façons. Dans cet article, nous allons vous montrer comment calculer les valeurs aberrantes dans Microsoft Excel de cinq façons différentes.
Télécharger le cahier d'exercices
Vous pouvez télécharger le classeur Excel gratuit à partir d'ici et vous entraîner par vous-même.
Trouver les valeurs aberrantes.xlsx5 méthodes pratiques pour calculer les valeurs aberrantes dans Excel
Outliers sont des valeurs de données qui sont significativement différentes du reste des valeurs de données dans l'ensemble de données. En d'autres termes, les valeurs aberrantes sont des valeurs extraordinaires. Elles sont soit exceptionnellement haut ou excessivement faible par rapport à d'autres valeurs dans un ensemble de données. Trouver les valeurs aberrantes sont essentiels dans les calculs statistiques car ils ont un impact sur les résultats de notre analyse des données.
Par exemple, vous disposez d'un ensemble de données indiquant le revenu quotidien de douze personnes. Vous devez maintenant calculer les valeurs aberrantes à l'aide de Microsoft Excel. Je vais vous montrer cinq méthodes simples pour y parvenir.
Utilisez le tri et le filtre pour calculer les valeurs aberrantes dans Excel.
Vous pouvez calculer les valeurs aberrantes d'un petit ensemble de données en utilisant la fonction Trier et filtrer Si vous souhaitez calculer les valeurs aberrantes à l'aide de la fonction de tri et de filtrage, vous pouvez le faire en suivant les étapes ci-dessous.
Étape 1 :
- Tout d'abord, sélectionnez l'en-tête de colonne dans votre ensemble de données Excel que vous souhaitez trier. Par exemple, dans l'ensemble de données donné, dans l'en-tête de colonne du fichier nommé Revenu quotidien (Cellule C40 est choisie).
Étape 2 :
- Ensuite, appuyez sur la touche Accueil sur le ruban et allez dans l'onglet Modification de groupe.
Étape 3 :
- Après cela, dans le Groupe d'édition cliquez sur le Trier et filtrer et cliquez sur la commande Personnalisé Trier .
Étape 4 :
- Ensuite, une nouvelle boîte de dialogue nommée Trier Dans la boîte de dialogue qui s'ouvre, sélectionnez Quotidiennement Revenu dans le Trier par et Du plus petit au plus grand dans la liste déroulante Ordre. Ensuite, cliquez sur OK .
Étape 5 :
- Enfin, le Revenu quotidien Après avoir exécuté la procédure, recherchez toute irrégularité dans la plage de données pour déterminer les valeurs aberrantes.
Par exemple, les deux premières valeurs de la colonne sont nettement inférieures et les deux dernières valeurs de la colonne sont nettement supérieures au reste des valeurs de l'ensemble de données, comme le montre le résultat ci-dessus.
Lire la suite : Comment trouver les valeurs aberrantes dans une analyse de régression en Excel (3 méthodes simples)
2. appliquer la fonction QUARTILE pour calculer les valeurs aberrantes dans Excel
La fonction QUARTILE est une méthode plus scientifique pour calculer les valeurs aberrantes dans Excel. Vous pouvez utiliser cette fonction pour diviser vos ensembles de données en quatre portions égales. Les valeurs suivantes seront renvoyées par la fonction la fonction QUARTILE :
- Le site minimum valeur.
- Le site 1er quartile (Q1- les 25% les plus bas d'un ensemble de données donné).
- Le site 2ème quartile (Q2 - les 25 % les plus bas de l'ensemble de données).
- Le site 3ème quartile (Q3- deuxième plus haut 25% de l'ensemble de données).
- Le site maximum valeur.
La syntaxe de la fonction QUARTILE dans Excel est :
=QUARTILE(tableau,quart)
La syntaxe contient les arguments suivants :
- a rray : la plage de cellules d'un ensemble de données donné pour lequel vous allez calculer la valeur du quartile.
- quart : Ceci spécifie la valeur qui doit être retournée.
Pour calculer les valeurs aberrantes pour l'ensemble de données ci-dessus en utilisant la fonction QUARTILE, suivez les étapes ci-dessous.
Étape 1 :
- Tout d'abord, tapez la formule suivante pour déterminer les 1er quartile ( Q1 ) est donné ci-dessous.
=QUARTILE($C$5:$C$16,1)
Étape 2 :
- Là encore, la formule permettant de calculer le 3ème quartile ( Q3 ) est donné ci-dessous.
=QUARTILE($C$5:$C$16,3)
Étape 3 :
- Troisièmement, vous devez déterminer le IQR, qui est le Fourchette interquartile (il représente 50% des données données données à partir d'une gamme de données qui tombent dans les premier et troisième quartiles) en soustrayant Q1 (en cellule G4 ) de Q3 (en cellule G5 ) Tapez la formule suivante pour calculer la soustraction.
=G5-G4
Étape 4 :
- Après avoir trouvé IQR, Ensuite, vous devez déterminer le supérieur et inférieur Parce que le supérieur et inférieur La limite supérieure contiendrait la plupart des données de l'ensemble de données. Rédigez la formule suivante pour calculer la limite supérieure.
=G5+(1.5*G6)
Étape 5 :
- Ensuite, pour calculer la limite inférieure, écrivez la formule suivante.
=G4-(1.5*G6)
Étape 6 :
- Enfin, après avoir terminé l'étape précédente, vous pouvez déterminer les valeurs aberrantes pour chaque valeur de données. Dans la feuille de calcul excel, tapez la formule suivante avec la fonction OR en cellule D5 .
=OR(C5$G$7)
- Cette formule permettra d'identifier les données qui ne se situent pas dans la limite de la plage mentionnée ci-dessus. Après traitement, la formule affichera une valeur de Déclaration VRAIE si les données spécifiques sont aberrantes et FAUX si ce n'est pas le cas. Double-cliquez sur sur le AutoFill outil dans la cellule C5 pour copier la formule au reste des cellules dans colonne C Ainsi, vous pouvez observer une valeur True à côté de toutes les valeurs aberrantes de votre ensemble de données.
Combinez les fonctions AVERAGE et STDEV.P pour calculer les valeurs aberrantes à partir de la moyenne et de l'écart-type.
A écart type (ou σ ) est une mesure qui permet de déterminer la distribution des données par rapport à la valeur moyenne de l'ensemble des données. Les données sont regroupées autour de la moyenne lorsque l'écart type est faible, tandis que les données sont plus dispersées lorsque l'écart type est élevé. Pour calculer les valeurs aberrantes à l'aide de la fonction Moyenne et Écart-type vous pouvez suivre les étapes suivantes.
Étape 1 :
- Tout d'abord, utilisez le même ensemble de données que celui présenté au début de cet article, puis calculez la moyenne et l'écart type. Pour calculer la moyenne, tapez la formule suivante avec la fonction MOYENNE en cellule G5 .
=MOYENNE(C5:C16)
Étape 2 :
- Pour calculer l'écart-type, insérez la formule suivante avec la fonction STDEV.P en cellule G6 .
=STDEV.P(C5:C16)
Étape 3 :
- Ensuite, vous calculerez la limite supérieure de l'avancement dans le processus. En cellule G7 calculer la limite inférieure à l'aide de la formule suivante.
=G5-(1.25*G6)
Étape 4 :
- Et dans la cellule G8 calculer la limite supérieure à partir de la formule suivante
=G5+(1.5*G6)
Étape 5 :
- Ensuite, pour calculer si des valeurs aberrantes existent ou non, tapez la formule suivante dans la cellule D5 .
=OR(C5$G$8)
- Ainsi, la formule renverra un VRAI si la donnée spécifique de la cellule souhaitée est une valeur aberrante et FAUX.
- Double-cliquez sur sur le AutoFill outil dans la cellule D5 pour copier la formule dans le reste des cellules de la base de données. colonne D Ainsi, vous pouvez trouver toutes les valeurs aberrantes restantes dans votre ensemble de données.
Lire la suite : Comment trouver les valeurs aberrantes avec l'écart-type dans Excel (avec des étapes rapides)
4. insérer le score Z pour calculer les valeurs aberrantes dans Excel
Le site Z-score est l'une des mesures les plus souvent utilisées pour identifier les valeurs aberrantes. Cette méthode montre à quel point une donnée spécifique est éloignée de la moyenne d'un ensemble de données par rapport à son écart type. Pour calculer les valeurs aberrantes à l'aide de la fonction Z-score dans Excel, vous pouvez voir les étapes décrites ci-dessous.
Étape 1 :
- Tout d'abord, prenez l'ensemble des données souhaitées.
Étape 2 :
- Deuxièmement, dans la cellule H5, tapez la formule suivante pour calculer le moyenne pour les données fournies.
=MOYENNE(C5:C16)
Étape 3 :
- Troisièmement, calculez le écart type de l'ensemble de données donné dans la cellule H6 en utilisant la formule suivante.
=STDEV.P(C5:C16)
Étape 4 :
- Après cela, vous devez déterminer le Z -score pour chaque valeur de données. Pour ce faire, vous utilisez la formule ci-dessous.
=(C5-$H$5)/$H$6
Étape 5 :
- Après avoir calculé tous les Valeurs Z, vous verrez que la gamme de Valeurs Z est entre -1.44 et 13 Ainsi, nous considérons les valeurs de Z-score inférieur à -1,2 ou supérieur à +1.8 pour les limites aberrantes.
- Ensuite, tapez la formule suivante dans la cellule E 5 .
=OR((D51.8))
- Enfin, la formule renverra un VRAI si la donnée spécifique est une aberration et retournera FAUX
- Double-cliquez sur sur la cellule E5 pour utiliser le AutoFill pour copier la formule dans le reste des cellules du tableau. colonne E Ainsi, vous pouvez trouver toutes les valeurs aberrantes restantes dans votre ensemble de données.
Lire la suite : Comment trouver les valeurs aberrantes à l'aide du score Z dans Excel (avec des étapes rapides)
5. fusionner les fonctions LARGE et SMALL pour trouver les valeurs aberrantes dans Excel
La fonction LARGE et la fonction SMALL dans Excel ont des opérations opposées. Nous allons l'utiliser pour trouver les plus grandes et les plus petites données ou valeurs dans un ensemble de données, respectivement. Cette fonction va extraire toutes les données dans un ensemble de données, en trouvant les plus petits et les plus grands nombres. Ils sont capables de trouver le deuxième plus petit ou plus grand, le troisième plus grand ou plus petit, et ainsi de suite.
Étape 1 :
- Tout d'abord, utilisez la formule suivante dans la cellule E5 avec la fonction LARGE .
=LARGE($C$5:$C$16,1)
- Ainsi, de 12 vous pouvez voir la première plus grande valeur qui est 780 .
Étape 2 :
- Ensuite, dans la cellule G5 , écrivez la formule suivante pour trouver la plus petite valeur.
=SMALL($C$5:$C$16,1)
- Enfin, de 12 vous pouvez voir les valeurs 1er la plus petite valeur 110 .
- Une fois que vous avez trouvé toutes les valeurs requises, vous pouvez facilement identifier les valeurs aberrantes dans l'ensemble de données.
Conclusion
C'est la fin de cet article. J'espère que vous avez trouvé cet article utile. Après avoir lu cet article, vous serez en mesure de calculer les valeurs aberrantes dans Excel en utilisant l'une des méthodes. S'il vous plaît partager toute autre question ou recommandations avec nous dans la section des commentaires ci-dessous.