Inhaltsverzeichnis
Ausreißer zu finden und zu entfernen ist eine sehr häufige Aufgabe bei der Analyse von Daten in den Bereichen Statistik, Data Mining, maschinelles Lernen usw. Es gibt so viele Möglichkeiten, Ausreißer in Ihrem Datensatz zu finden, aber der Prozess, sie zu entfernen, ist nicht so einfach zu finden. In diesem Artikel zeigen wir Ihnen, wie man Ausreißer in Excel entfernen .
Arbeitsbuch herunterladen
Sie können die kostenlose Excel-Arbeitsmappe für die Praxis hier herunterladen.
Ausreißer entfernen.xlsxWas sind Ausreißer in Excel?
Eine Ausreißer ist ein Wert, der weit vom Mittelwert oder Median eines Datensatzes abweicht. Mit anderen Worten: Ausreißer sind Werte, die deutlich höher oder niedriger sind als der Rest der Werte in einem Datensatz.
Stellen Sie sich ein Kricketspiel vor, bei dem alle Schlagmänner um die 50 Punkte erzielt haben, aber nur ein Schlagmann ein Jahrhundert (100) erreicht hat und ein anderer Schlagmann mit 0 Punkten ausgeschieden ist. 100 und 0 Punkte sind die Ausreißer in diesem Spiel.
Ausreißer sind problematisch, da sie das Ergebnis der Datenanalyse verfälschen und zu irreführenden Ergebnissen führen können. Daher ist es besser, Ausreißer zu finden und zu entfernen, um einen glatten Datensatz zu erhalten.
3 Möglichkeiten zum Entfernen von Ausreißern in Excel
In diesem Abschnitt erfahren Sie, wie Sie Ausreißer löschen Das Entfernen von Ausreißern ist ein komplizierter Prozess, daher sollten Sie den gesamten Artikel sorgfältig lesen.
1. die Verwendung der Excel-Funktion zur Berechnung des Durchschnitts ohne Ausreißer
Excel TRIMMEAN-Funktion kann verwendet werden, um den Durchschnitt eines gegebenen Datensatzes unter Ausschluss von Ausreißern zu berechnen. Die auszuschließenden Datenpunkte werden als Prozentsatz angegeben. Der Prozentwert kann im Dezimalformat oder im Prozentformat eingegeben werden.
Die Syntax zur Berechnung des Mittelwerts ohne Ausreißer lautet,
=TRIMMEAN(array, Prozent)Hier,
- Array = Bereich der zu trimmenden Daten und Berechnung des Durchschnittsergebnisses
- Prozent = Die Anzahl der auszuschließenden Datenpunkte
Schauen wir uns an, wie man diese Funktion implementiert, um Ergebnisse mit entfernten Ausreißern zu berechnen.
Betrachten wir das obige Bild: Wir haben Daten von Zelle B5 bis B14 Hier liegen die meisten Zahlen zwischen 20 und 27, aber zwei Werte - 0 und 100 - sind weit von diesen Werten entfernt. Dies sind also die Ausreißer in unserem Datensatz.
Für unseren Datensatz lautet die Formel zur Berechnung des Mittelwerts (Durchschnitts) ohne die Ausreißerwerte mit Excel TRIMMEAN Funktion ist,
=TRIMMEAN(B5:B14,0.2)
Hier,
- B5:B14 = Bereich der zu trimmenden Daten und Berechnung des Durchschnittsergebnisses
- 0.2 (oder 20%) = Die Anzahl der auszuschließenden Datenpunkte
Wenn eine Zahl im Datensatz um 20 % vom Rest des Datensatzes abweicht, dann wird diese Zahl als Ausreißer bezeichnet.
Wenn Sie die Formel entsprechend Ihrem Datensatz schreiben und auf Eingabe erhalten Sie die berechneter Mittelwert ohne Ausreißer für Ihren Datensatz. In unserem Fall, Zelle E6 enthält den berechneten Mittelwert, der 23.50 .
Um zu überprüfen, ob die Antwort richtig ist oder nicht, führen wir die Funktion AVERAGE in Zelle E5 die den Durchschnitt ( 28.80 ) aller Werte im Bereich B5:B14 . und in Zelle E7 führen wir eine weitere DURCHSCHNITT Funktion durch manuelle Eingabe aller Zellen mit Ausnahme derjenigen, die Ausreißerwerte enthalten, und erhielt den Wert 23.50 als Ergebnis.
Wir können also sagen, dass die TRIMMEAN Funktion kann Ausreißer aus einem gegebenen Datensatz erfolgreich entfernen, während der Durchschnitt in Excel berechnet wird.
Lesen Sie mehr: Wie man eine Formel in Excel löscht (7+ Methoden)
2 Ausreißer aus Datensatz und Liniendiagramm in Excel entfernen
Beachten Sie das folgende Bild. Wir haben einige Daten, auf deren Grundlage wir ein Liniendiagramm erstellt haben. Aus dem Liniendiagramm können wir leicht erkennen, dass in Die Datenpunkte 4 und 8 sind unsere Ausreißer .
Jetzt werden wir sehen, wie wir das Liniendiagramm glätten können, indem wir die abweichenden Werte aus dem Datensatz entfernen.
In einer anderen Zelle (in unserem Fall ist es Zelle H6 ), schreiben Sie die folgende Formel,
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Hier,
- C6 = Zelle, die die ersten Daten im Datensatz enthält
- C5 = Zelle oberhalb der ersten Datenzelle
- C7 = Zelle unterhalb der ersten Datenzelle
- $E$6 = Differenz zwischen Datenpunkten.
Betrachtet man unsere Daten, so scheint es, dass wenn ein Datenpunkt 10 Einheiten unterscheiden von anderen, wird als ein Ausreißer Wir setzen also 10 in Zelle E6 und machen es zu einem Absoluter Zellbezug so dass diese Zelle beim Scannen und Berechnen des gesamten Datensatzes fixiert wird.
Nach dem Drücken von Eingabe können Sie sehen, dass die ersten Daten immer noch in der Ergebniszelle angezeigt werden H6 Alles, was Sie hier tun müssen, ist, die Formel so zu konstruieren, dass wir die Füllen Griff um die Formel auf den Rest der Zellen anzuwenden.
Ziehen Sie nun die Zeile nach unten mit Füllen Griff und Sie werden sehen, dass die Zellen, in denen sich die Ausreißer befanden, nun mit #N/A .
Schauen Sie sich das Liniendiagramm an. Es ist jetzt ein abgeflachtes Diagramm ohne abweichende Werte darin.
Formel Aufschlüsselung
=IF(
Da wir Werte vergleichen werden, auf deren Grundlage wir das Ergebnis extrahieren werden, beginnen wir die Formel mit der IF Zustand.
=IF(AND(
Wir werden den aktuellen Datenpunkt mit der Zelle darüber und der Zelle darunter vergleichen. Und nur wenn beide Vergleiche zutreffen, zeigen wir den Datenpunkt als Ergebnis an. Da wir also mit "Beiden" Vergleichen umgehen müssen, sollten wir die UND-Funktion .
=IF(AND(ABS(
Wenn wir Datenpunkte subtrahieren, können einige Daten negative Werte ergeben. Und wir wollen nicht mit negativen Werten umgehen, da negative Werte immer der Bedingung "Daten entfernen, wenn die Differenz 10 ist" widersprechen. Um also sicherzustellen, dass wir immer positive Ergebnisse erhalten, müssen wir die Vergleiche in eine Funktion des absoluten Werts .
=IF(AND(ABS(C6-C5)>$E$6
Hier starten wir unseren ersten Vergleich: Wir subtrahieren einfach den aktuellen Wert von dem darüber liegenden Wert und prüfen, ob das Ergebnis größer ist als die Differenz, die in Zelle E6 und machte die Zelle zu einem Absolute Referenz um den Wert der Zelle gesperrt zu halten.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)
Dann folgt der zweite Teil des Vergleichs, der durch ein Komma getrennt ist und den aktuellen Datenpunkt mit dem nächsten Datenpunkt vergleicht.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
Jetzt setzen wir ein Komma und bestimmen, dass wir NA-Funktion dort, wenn sowohl die UND Funktionen wahr sind.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Und wenn die UND Funktion nicht wahr ist, wollen wir den aktuellen Datenpunkt als IF Wir geben also ein Komma ein und übergeben die Zellreferenznummer C6 da drin.
Lesen Sie mehr: Entfernen der Datenüberprüfung in Excel (5 Möglichkeiten)
Ähnliche Lektüre
- Wie man eine Kopfzeile in Excel entfernt (4 Methoden)
- Gestrichelte Linien in Excel entfernen (5 schnelle Wege)
- Wie man Gitter aus Excel entfernt (6 einfache Methoden)
- Rahmen in Excel entfernen (4 schnelle Wege)
- Wie man den Kompatibilitätsmodus in Excel entfernt (2 einfache Methoden)
3. manuelles Entfernen von Ausreißern in Excel
Eine weitere einfache Möglichkeit, Ausreißer in Excel zu eliminieren, besteht darin, die Werte Ihres Datensatzes zu sortieren und die oberen und unteren Werte manuell zu löschen.
Zum Sortieren der Daten,
- Wählen Sie den Datensatz.
- Gehe zu Sortieren & Filtern im Bearbeitung von Gruppe und wählen Sie entweder Sortieren von Kleinst nach Größt oder Größte bis kleinste Sortierung .
- In unserem Fall haben wir ausgewählt Sortieren von Kleinst nach Größt Es sortiert die Zahlen in unserem Datensatz in aufsteigender Reihenfolge, wobei die kleinsten Zahlen ganz oben und die größten ganz unten stehen.
Löschen Sie diese Daten nun einfach manuell, um den Datensatz frei von Ausreißern zu machen.
Wir raten davon ab, dieses Verfahren anzuwenden, wenn Sie mit einem großen Datensatz arbeiten. Wenn Ihr Datensatz klein und übersichtlich ist, können Sie dieses Verfahren nur anwenden, andernfalls sollten Sie es nicht anwenden.
Lesen Sie mehr: Wie man die Sortierung in Excel aufhebt (3 einfache Methoden)
Schlussfolgerung
Dieser Artikel zeigt Ihnen, wie Sie Ausreißer entfernen Ich hoffe, dass dieser Artikel für Sie von Nutzen war. Wenn Sie Fragen zu diesem Thema haben, können Sie sich gerne an mich wenden.