Inhaltsverzeichnis
Um statistische Berechnungen mit den Daten eines Datensatzes durchführen zu können, müssen möglicherweise Ausreißer identifiziert werden. Sie können Ausreißer in großen Datensätzen mit Microsoft Excel auf verschiedene Weise ermitteln. In diesem Beitrag zeigen wir Ihnen, wie Sie Ausreißer in Microsoft Excel auf fünf verschiedene Arten berechnen können.
Download Arbeitsbuch Praxis
Sie können die kostenlose Excel-Arbeitsmappe hier herunterladen und selbständig üben.
Ausreißer finden.xlsx5 praktische Ansätze zur Berechnung von Ausreißern in Excel
Ausreißer sind Datenwerte, die sich signifikant von den übrigen Datenwerten des Datensatzes unterscheiden. Ausreißer sind also außergewöhnliche Werte. Sie sind entweder außergewöhnlich hoch oder übermäßig niedrig im Vergleich zu anderen Werten in einem Datensatz. Ausreißer aufspüren ist bei statistischen Berechnungen von entscheidender Bedeutung, da sie sich auf die Ergebnisse unserer Datenanalyse auswirkt.
Sie haben z.B. einen Datensatz mit den Tageseinnahmen von zwölf Personen. Nun müssen Sie die Ausreißer mit Microsoft Excel berechnen. Hier zeige ich Ihnen fünf einfache Methoden, um dies zu tun.
1 Verwenden Sie Sortieren & Filtern, um Ausreißer in Excel zu berechnen.
Sie können Ausreißer aus einem kleinen Datensatz berechnen, indem Sie die Sortieren & Filtern Wenn Sie Ausreißer mit Hilfe der Sortier- und Filterfunktion berechnen möchten, können Sie die folgenden Schritte ausführen.
Schritt 1:
- Wählen Sie zunächst die Spaltenüberschrift in Ihrem Excel-Datensatz aus, die Sie sortieren möchten, z. B. in dem angegebenen Datensatz die Spaltenüberschrift mit dem Namen Tägliches Einkommen (Zelle C40 gewählt wird).
Schritt 2:
- Drücken Sie dann die Startseite in der Multifunktionsleiste und gehen Sie zum Menüpunkt Bearbeitung von Gruppe.
Schritt 3:
- Danach, in der Gruppe bearbeiten klicken Sie auf den Sortieren & Filtern und klicken Sie auf den Befehl Benutzerdefiniert Sortieren .
Schritt 4:
- Dann wird ein neues Dialogfeld mit dem Namen Sortieren In dem sich öffnenden Dialogfenster wählen Sie Täglich Einkommen im Sortieren nach Dropdown und Kleinste bis Größte in der Dropdown-Liste Bestellung. Danach klicken Sie auf OK .
Schritt 5:
- Schließlich ist die Tägliches Einkommen Spalte in der angegebenen Weise sortiert werden, wobei die niedrigsten Werte oben und die größten Werte unten stehen. Nach der Ausführung der Prozedur sollten Sie nach Unregelmäßigkeiten im Datenbereich suchen, um Ausreißer zu ermitteln.
So sind beispielsweise die ersten beiden Werte in der Spalte deutlich niedriger und die letzten beiden Werte in der Spalte deutlich höher als die übrigen Werte im Datensatz, wie das obige Ergebnis zeigt.
Lesen Sie mehr: Wie man Ausreißer in der Regressionsanalyse in Excel findet (3 einfache Methoden)
2. die Funktion QUARTILE zur Berechnung von Ausreißern in Excel anwenden
Die Funktion QUARTILE ist eine wissenschaftlichere Methode zur Berechnung von Ausreißern in Excel. Sie können diese Funktion verwenden, um Ihre Datensätze in vier gleiche Teile zu unterteilen. Die folgenden Werte werden von die Funktion QUARTILE :
- Die Minimum Wert.
- Die 1. Quartil (Q1- unterste 25% eines bestimmten Datensatzes).
- Die 2. Quartil (Q2 - die nächstniedrigeren 25% des Datensatzes).
- Die 3. Quartil (Q3 - zweithöchste 25% des Datensatzes).
- Die maximal Wert.
Die Syntax von die Funktion QUARTILE in Excel ist:
=QUARTILE(array,quart)
Die Syntax enthält die folgenden Argumente:
- a rray : den Zellbereich eines bestimmten Datensatzes, für den Sie den Quartilswert berechnen wollen.
- quart: Hier wird angegeben, welcher Wert zurückgegeben werden soll.
Zur Berechnung der Ausreißer für den oben genannten Datensatz mit die Funktion QUARTILE, folgen Sie den nachstehenden Schritten.
Schritt 1:
- Geben Sie zunächst die folgende Formel zur Bestimmung der 1. Quartil ( Q1 ) ist unten angegeben.
=QUARTIL($C$5:$C$16,1)
Schritt 2:
- Auch hier wird die Formel zur Berechnung der 3. Quartil ( Q3 ) ist unten angegeben.
=QUARTIL($C$5:$C$16,3)
Schritt 3:
- Drittens: Sie müssen die IQR, die die Inter-Quartil-Spanne (es stellt 50% der gegebenen Daten aus einer Reihe von Datensätzen, die in das erste und dritte Quartil fallen) durch Subtraktion Q1 (in Zelle G4 ) von Q3 (in Zelle G5 Geben Sie die folgende Formel ein, um die Subtraktion zu berechnen.
=G5-G4
Schritt 4:
- Nach dem Fund IQR, Als nächstes müssen Sie die obere und unter Weil die obere und unter Grenze würde die meisten Daten des Datensatzes enthalten. Schreiben Sie die folgende Formel auf, um die obere Grenze zu berechnen.
=G5+(1,5*G6)
Schritt 5:
- Um die Untergrenze zu berechnen, schreiben Sie die folgende Formel auf.
=G4-(1,5*G6)
Schritt 6:
- Nachdem Sie den vorherigen Schritt abgeschlossen haben, können Sie die Ausreißer für jeden Datenwert bestimmen. Geben Sie in das Excel-Arbeitsblatt die folgende Formel mit die ODER-Funktion in der Zelle D5 .
=OR(C5$G$7)
- Diese Formel hilft, die Daten zu identifizieren, die nicht in den oben genannten Bereich fallen. Nach der Verarbeitung zeigt die Formel eine TRUE Aussage wenn die spezifischen Daten ein Ausreißer sind und FALSCH wenn dies nicht der Fall ist. Doppelklicken Sie auf . über die AutoFill Werkzeug in Zelle C5 zum Kopieren die Formel auf die übrigen Zellen in Spalte C So können Sie neben allen Ausreißern in Ihrem Datensatz den Wert Wahr feststellen.
3 Kombinieren Sie die Funktionen AVERAGE und STDEV.P zur Berechnung von Ausreißern aus Mittelwert und Standardabweichung
A Standardabweichung (oder σ ) ist eine Metrik zur Bestimmung der Verteilung der Daten in Bezug auf den Mittelwert des gesamten Datensatzes. Die Daten sind um den Mittelwert herum gruppiert, wenn die Standardabweichung niedrig ist, während die Daten weiter gestreut sind, wenn die Standardabweichung hoch ist. Zur Berechnung von Ausreißern mit Hilfe der Mittlere und Standardabweichung können Sie die folgenden Schritte ausführen.
Schritt 1:
- Verwenden Sie zunächst denselben Datensatz wie zu Beginn dieses Artikels und berechnen Sie dann den Mittelwert und die Standardabweichung. Um den Mittelwert zu berechnen, geben Sie folgende Formel mit die Funktion AVERAGE in der Zelle G5 .
=DURCHSCHNITT(C5:C16)
Schritt 2:
- Um die Standardabweichung zu berechnen, setzen Sie die folgende Formel mit die Funktion STDEV.P in der Zelle G6 .
=STDEV.P(C5:C16)
Schritt 3:
- Als Nächstes berechnen Sie die Obergrenze für das weitere Fortschreiten des Prozesses. In Zelle G7 berechnen Sie die untere Grenze anhand der folgenden Formel.
=G5-(1,25*G6)
Schritt 4:
- Und in der Zelle G8 berechnen Sie die Obergrenze nach folgender Formel
=G5+(1,5*G6)
Schritt 5:
- Um anschließend zu berechnen, ob es Ausreißer gibt oder nicht, geben Sie die folgende Formel in die Zelle ein D5 .
=OR(C5$G$8)
- Die Formel gibt also einen WAHR Wert, wenn die spezifischen Daten in der gewünschten Zelle ein Ausreißer sind und FALSCH.
- Doppelklicken Sie auf . über die AutoFill Werkzeug in Zelle D5 um die Formel auf die übrigen Zellen in Spalte D So können Sie alle verbleibenden Ausreißer in Ihrem Datensatz herausfinden.
Lesen Sie mehr: Ausreißer mit Standardabweichung in Excel finden (mit schnellen Schritten)
4. z-Score zur Berechnung von Ausreißern in Excel einfügen
Die Z-Score ist eine der am häufigsten verwendeten Metriken zur Identifizierung von Ausreißern. Diese Methode zeigt, wie weit ein bestimmter Wert vom Mittelwert eines Datensatzes in Bezug auf seine Standardabweichung entfernt ist. Zur Berechnung von Ausreißern mit Z-Score in Excel können Sie die unten beschriebenen Schritte sehen.
Schritt 1:
- Nehmen Sie zunächst den gewünschten Datensatz.
Schritt 2:
- Zweitens, in der Zelle H5, geben Sie die folgende Formel zur Berechnung der mittlere für die gegebenen Daten.
=DURCHSCHNITT(C5:C16)
Schritt 3:
- Drittens: Berechnen Sie die Standardabweichung des angegebenen Datensatzes in der Zelle H6 mit Hilfe der folgenden Formel.
=STDEV.P(C5:C16)
Schritt 4:
- Danach müssen Sie die Z -Wertung Dazu verwenden Sie die unten stehende Formel.
=(C5-$H$5)/$H$6
Schritt 5:
- Nach der Berechnung aller Z-Werte, werden Sie sehen, dass der Bereich der Z-Werte liegt zwischen -1.44 und 13 Wir betrachten also Werte von Z-Score kleiner als -1,2 oder größer als +1.8 für die Ausreißergrenzen.
- Geben Sie dann die folgende Formel in die Zelle E 5 .
=OR((D51.8))
- Schließlich gibt die Formel eine WAHR Wert, wenn die spezifischen Daten ein Ausreißer sind, und gibt FALSCH
- Doppelklicken Sie auf . auf Zelle E5 zur Nutzung der AutoFill Füllgriff, um die Formel auf die übrigen Zellen in Spalte E So können Sie alle verbleibenden Ausreißer in Ihrem Datensatz finden.
Lesen Sie mehr: Ausreißer mit Z-Score in Excel finden (mit schnellen Schritten)
5. die Funktionen LARGE und SMALL zusammenführen, um Ausreißer in Excel zu finden
Die Funktion LARGE und die Funktion SMALL in Excel haben entgegengesetzte Operationen. Wir werden sie verwenden, um die größten und kleinsten Daten bzw. Werte in einem Datensatz zu finden. Diese Funktion zieht alle Daten innerhalb eines Datensatzes und findet die kleinsten und größten Zahlen. Sie sind in der Lage, die zweitkleinsten oder größten, die drittgrößten oder kleinsten usw. zu finden.
Schritt 1:
- Verwenden Sie zunächst die folgende Formel in der Zelle E5 mit die Funktion LARGE .
=LARGE($C$5:$C$16,1)
- So wird aus 12 Werte können Sie den 1. größten Wert sehen, der 780 .
Schritt 2:
- Danach, in Zelle G5 schreiben Sie die folgende Formel auf, um den kleinsten Wert zu finden.
=KLEIN($C$5:$C$16,1)
- Schließlich, von 12 Werte, können Sie die 1. kleinster Wert 110 .
- Wenn Sie alle erforderlichen Werte herausgefunden haben, können Sie leicht auf Ausreißer im Datensatz hinweisen.
Schlussfolgerung
Das ist das Ende dieses Artikels. Ich hoffe, Sie finden diesen Artikel hilfreich. Nach der Lektüre dieses Artikels werden Sie in der Lage sein, Ausreißer in Excel mit einer der Methoden zu berechnen. Bitte teilen Sie uns weitere Fragen oder Empfehlungen in den unten stehenden Kommentaren mit.