Daftar Isi
Menemukan outlier dan menghapusnya adalah tugas yang sangat umum untuk menganalisis data dalam statistik, data mining, pembelajaran mesin, dll. Ada begitu banyak cara untuk menemukan outlier dalam dataset Anda, tetapi proses untuk menghapusnya tidak mudah ditemukan. hapus outlier di Excel .
Unduh Buku Kerja
Anda bisa mengunduh buku kerja Excel latihan gratis dari sini.
Hapus Outliers.xlsxApa itu Outlier di Excel?
An pencilan Dengan kata lain, outlier adalah nilai yang secara signifikan lebih tinggi atau lebih rendah dari nilai lainnya dalam dataset.
Bayangkan sebuah pertandingan kriket di mana semua pemukul mencetak skor sekitar 50, tetapi hanya satu pemukul yang mencetak skor satu abad (100) dan pemukul lainnya keluar pada skor 0. Skor 100 dan 0 itu adalah outlier dalam pertandingan ini.
Outlier menjadi masalah karena mereka dapat memiringkan hasil analisis data dan terjadi hasil yang menyesatkan. Jadi lebih baik untuk menemukan outlier dan menghapusnya untuk mendapatkan dataset yang halus.
3 Cara untuk Menghapus Pencilan di Excel
Dalam bagian ini, Anda akan belajar cara hapus pencilan Menghapus outlier adalah proses yang rumit, jadi bacalah seluruh artikel dengan cermat.
1. Memanfaatkan Fungsi Excel untuk Menghitung Rata-rata tanpa Outlier
Excel Fungsi TRIMMEAN dapat digunakan untuk menghitung rata-rata dataset yang diberikan sambil mengecualikan outlier. Poin data yang akan dikecualikan diberikan sebagai persentase. Nilai persentase dapat dimasukkan sebagai format desimal atau format persen.
Sintaks untuk menghitung mean tanpa outlier adalah,
=TRIMMEAN(array, persen)Di sini,
- array = Rentang data untuk memangkas dan menghitung hasil rata-rata
- persen = Jumlah titik data yang akan dikecualikan
Mari kita lihat bagaimana menerapkan fungsi ini untuk menghitung hasil dengan outlier yang dihapus.
Perhatikan gambar di atas. Kita memiliki data dari Sel B5 hingga B14 . Di sini sebagian besar angka berada di antara 20 hingga 27, tetapi dua nilai - 0 dan 100 - jauh dari nilai-nilai itu. Jadi ini adalah pencilan dalam dataset kami.
Untuk dataset kami, rumus untuk menghitung mean (rata-rata) tanpa nilai outlier dengan Excel TRIMMEAN fungsinya adalah,
=TRIMMEAN(B5:B14,0.2)
Di sini,
- B5:B14 = Rentang data untuk memangkas dan menghitung hasil rata-rata
- 0.2 (atau 20%) = Jumlah titik data yang akan dikecualikan
Jika ada angka dalam dataset yang jatuh 20% jauh dari sisa dataset, maka angka itu akan disebut outlier.
Jika Anda menulis rumus sesuai dengan dataset Anda dan menekan Masuk , Anda akan mendapatkan rata-rata yang dihitung tanpa outlier untuk dataset Anda. Dalam kasus kami, Sel E6 memegang rata-rata yang dihitung yaitu 23.50 .
Untuk mengecek apakah jawabannya benar atau tidak, kita jalankan perintah Fungsi RATA-RATA di Sel E5 yang mengembalikan rata-rata ( 28.80 ) dari semua nilai dalam rentang B5:B14 . dan di Sel E7 , kami menjalankan yang lain RATA-RATA dengan memasukkan semua sel secara manual kecuali yang menyimpan nilai outlier, dan mendapatkan pengembalian dari 23.50 sebagai hasilnya.
Jadi kita bisa mengatakan bahwa TRIMMEAN fungsi dapat berhasil menghapus outlier dari kumpulan data yang diberikan saat menghitung rata-rata di Excel.
Baca selengkapnya: Cara Menghapus Rumus di Excel (7+ Metode)
2. Hapus Outlier dari Dataset dan Bagan Garis di Excel
Perhatikan gambar berikut ini. Kita memiliki beberapa data berdasarkan data yang kita buat grafik garisnya. Dari grafik garis tersebut, kita bisa dengan mudah melihat bahwa dalam titik data 4 dan 8 kita memiliki pencilan kita .
Sekarang kita akan melihat bagaimana kita dapat memperhalus grafik garis dengan menghapus nilai-nilai yang tidak penting dari dataset.
Di sel lain (dalam kasus kita adalah Sel H6 ), tulis rumus berikut ini,
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Di sini,
- C6 = Sel yang menampung data pertama dalam dataset
- C5 = Sel di atas sel data pertama
- C7 = Sel di bawah sel data pertama
- $E$6 = Perbedaan antara titik data.
Melihat data kami, tampaknya ketika sebuah titik data berbeda 10 unit dari orang lain, ditetapkan sebagai pencilan Jadi kami menempatkan 10 di Sel E6 dan menjadikannya sebagai Referensi Sel Absolut sehingga sel ini akan diperbaiki saat memindai dan menghitung melalui seluruh dataset.
Setelah menekan Masuk , Anda dapat melihat data pertama masih muncul di sel hasil H6 Yang harus Anda lakukan di sini adalah, hanya untuk membuat rumus sehingga kita bisa menyeret Isi Gagang untuk menerapkan rumus ke sel lainnya.
Sekarang seret baris ke bawah dengan Isi Gagang dan Anda akan melihat sel yang tadinya menyimpan outlier sekarang terisi dengan #N/A .
Dan lihatlah grafik garis sekarang, sekarang ini adalah grafik yang diratakan tanpa nilai outlying di dalamnya.
Rincian Formula
=IF(
Karena kita akan membandingkan nilai berdasarkan yang akan kita ekstrak hasilnya, kita memulai rumus dengan JIKA kondisi.
=IF(AND(
Kita akan membandingkan titik data saat ini dan sel di atas dan sel di bawahnya. Dan jika kedua perbandingan itu benar, baru kita akan menampilkan titik data sebagai hasilnya. Jadi, karena kita perlu berurusan dengan perbandingan "Keduanya", jadi kita harus menggunakan DAN fungsi .
=IF(AND(ABS(
Ketika kita mengurangi titik data, beberapa data mungkin bernilai negatif. Dan kita tidak ingin berurusan dengan nilai negatif karena nilai negatif akan selalu bertentangan dengan kondisi "menghapus data ketika selisihnya 10". Jadi untuk memastikan bahwa kita selalu memiliki hasil positif, kita perlu membungkus perbandingan dalam sebuah Fungsi nilai absolut .
=IF(AND(ABS(C6-C5)>$E$6
Di sini kita memulai perbandingan pertama kita. Kita cukup mengurangi nilai saat ini dengan nilai di atas dan melihat apakah hasilnya lebih besar dari tingkat perbedaan yang tersimpan dalam Sel E6 dan membuat sel menjadi Referensi Mutlak untuk menjaga nilai sel tetap terkunci.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)
Selanjutnya, bagian kedua dari perbandingan yang dipisahkan oleh koma, akan membandingkan titik data saat ini dengan titik data berikutnya.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
Sekarang kita menaruh koma dan menentukan untuk menaruh Fungsi NA di sana jika kedua DAN fungsi-fungsi yang benar.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Dan jika DAN tidak benar maka kita ingin mengembalikan titik data aktual sebagai fungsi JIKA Nilai salah. Jadi kita mengetikkan koma dan meneruskan nomor referensi sel C6 di sana.
Baca lebih lanjut: Cara Menghapus Validasi Data di Excel (5 Cara)
Bacaan Serupa
- Cara Menghapus Header di Excel (4 Metode)
- Hapus Garis Bertitik di Excel (5 Cara Cepat)
- Cara Menghapus Kisi dari Excel (6 Metode Mudah)
- Hapus Batas di Excel (4 Cara Cepat)
- Cara Menghapus Mode Kompatibilitas di Excel (2 Cara Mudah)
3. Hapus Pencilan Secara Manual di Excel
Cara mudah lain untuk menghilangkan pencilan di Excel adalah, cukup urutkan nilai dataset Anda dan hapus nilai atas dan bawah secara manual darinya.
Untuk menyortir data,
- Pilih dataset.
- Pergi ke Urutkan &; Saring di Penyuntingan kelompok dan memilih salah satu Urutkan dari yang terkecil ke terbesar atau Urutkan Terbesar ke Terkecil .
- Dalam kasus kami, kami memilih Urutkan dari yang terkecil ke terbesar Ini mengurutkan angka-angka dalam dataset kami dalam urutan menaik, menempatkan angka terkecil di bagian atas dan angka terbesar di bagian bawah.
Sekarang hapus saja secara manual data tersebut untuk membuat nilai outlying dataset bebas.
Kami tidak menyarankan untuk mengikuti proses ini saat bekerja dengan dataset yang besar. Ketika dataset Anda kecil dan lebih mudah dilihat, barulah Anda dapat menerapkan prosedur ini, jika tidak, jangan terapkan ini.
Baca lebih lanjut: Cara Menghapus Urutan di Excel (3 Metode Mudah)
Kesimpulan
Artikel ini menunjukkan kepada Anda cara hapus pencilan Saya harap artikel ini sangat bermanfaat bagi Anda. Jangan ragu untuk bertanya jika Anda memiliki pertanyaan tentang topik tersebut.