Cara Mengeluarkan Outlier dalam Excel (3 Cara)

  • Berkongsi Ini
Hugh West

Mencari outlier dan mengalih keluarnya ialah tugas yang sangat biasa untuk menganalisis data dalam statistik, perlombongan data, pembelajaran mesin dsb. Terdapat begitu banyak cara yang anda boleh mencari outlier dalam set data anda tetapi proses untuk mengalih keluarnya tidak begitu mudah untuk cari. Dalam artikel ini, kami akan menunjukkan kepada anda cara mengalih keluar outlier dalam Excel .

Muat turun Buku Kerja

Anda boleh memuat turun buku kerja Excel amalan percuma daripada di sini.

Alih keluar Outliers.xlsx

Apakah Outliers dalam Excel?

Sebuah outlier ialah nilai yang jauh dari nilai min atau median set data. Dalam erti kata lain, outlier ialah nilai yang jauh lebih tinggi atau lebih rendah daripada nilai lain dalam set data.

Fikirkan perlawanan kriket di mana semua pemukul menjaringkan kira-kira 50 tetapi hanya seorang pemukul menjaringkan satu abad (100 ) dan seorang lagi pemukul keluar pada 0. Markah 100 dan 0 itu adalah outlier dalam perlawanan ini.

Outlier bermasalah kerana mereka boleh memesongkan keputusan analisis data dan menghasilkan keputusan yang mengelirukan. Jadi adalah lebih baik untuk mencari outlier dan mengalih keluarnya untuk mempunyai set data yang lancar.

3 Cara untuk Mengalih keluar Outlier dalam Excel

Dalam bahagian ini, anda akan belajar cara untuk padam outliers daripada set data anda dalam 3 cara berbeza. Mengalih keluar outlier ialah proses yang rumit, jadi baca keseluruhan artikel dengan teliti.

1. Menggunakan Fungsi Excel untuk Mengira Purata tanpaOutliers

Excel Fungsi TRIMMEAN boleh digunakan untuk mengira purata set data yang diberikan sambil mengecualikan outlier. Mata data untuk dikecualikan dibekalkan sebagai peratusan. Nilai peratusan boleh dimasukkan sebagai format perpuluhan atau format peratus.

Sintaks untuk mengira min tanpa outlier ialah,

=TRIMMEAN(array, percent)

Di sini,

  • tatasusunan = Julat data untuk memangkas dan mengira hasil purata
  • peratus = bilangan titik data untuk dikecualikan

Mari kita lihat cara melaksanakan fungsi ini untuk mengira hasil dengan outlier yang dialih keluar.

Pertimbangkan gambar di atas. Kami mempunyai data daripada Sel B5 hingga B14 . Di sini kebanyakan nombor adalah antara 20 hingga 27, tetapi dua nilai – 0 dan 100 – adalah jauh daripada nilai tersebut. Jadi ini ialah outlier dalam set data kami.

Untuk set data kami, formula untuk mengira min (purata) tanpa nilai outlier dengan fungsi Excel TRIMMEAN ialah,

=TRIMMEAN(B5:B14,0.2)

Di sini,

  • B5:B14 = Julat data untuk memangkas dan mengira hasil purata
  • 0.2 (atau 20%) = Bilangan titik data untuk dikecualikan

Jika mana-mana nombor dalam set data jatuh 20% jauh daripada set data yang lain , maka nombor itu akan dipanggil outlier.

Jika anda menulis formula mengikut set data anda dan tekan Enter , anda akan mendapat min yang dikira tanpa outlier untuk set data anda. Dalam kes kami, Sel E6 memegang min yang dikira iaitu 23.50 .

Untuk menyemak sama ada jawapan itu betul atau tidak, kami menjalankan fungsi PURATA dalam Sel E5 yang mengembalikan purata ( 28.80 ) semua nilai dalam julat B5:B14 . Dan dalam Cell E7 , kami menjalankan fungsi AVERAGE yang lain dengan memasukkan semua sel secara manual kecuali sel yang memegang nilai outlier dan mendapat pulangan 23.50 sebagai hasilnya.

Jadi, kita boleh katakan bahawa fungsi TRIMMEAN berjaya mengalih keluar outlier daripada set data tertentu sambil mengira purata dalam Excel.

Baca Lagi: Cara Mengosongkan Formula dalam Excel (7+ Kaedah)

2. Keluarkan Outlier daripada Set Data dan Carta Baris dalam Excel

Perhatikan gambar berikut. Kami mempunyai beberapa data berdasarkan yang kami buat graf garis. Daripada graf garis, kita boleh melihat dengan mudah bahawa dalam titik data 4 dan 8 kita mempunyai outlier kami .

Sekarang kita akan melihat bagaimana kita boleh melicinkan keluarkan carta garis dengan mengalih keluar nilai terpencil daripada set data.

Dalam sel lain (dalam kes kami ialah Sel H6 ), tulis formula berikut,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Di sini,

  • C6 = Sel yang menyimpan data pertama dalam set data
  • C5 = Sel di atas sel data pertama
  • C7 = Sel di bawah sel data pertama
  • $E$6 = Perbezaan antara titik data .

Melihatdata kami, nampaknya apabila titik data berbeza 10 unit daripada yang lain, ditetapkan sebagai outlier . Jadi kami meletakkan 10 dalam Sel E6 dan menjadikannya Rujukan Sel Mutlak supaya sel ini akan dibetulkan semasa mengimbas dan mengira melalui keseluruhan set data.

Selepas menekan Enter , anda boleh melihat data pertama masih muncul dalam sel hasil H6 . Apa yang anda perlu lakukan di sini ialah, hanya untuk membina formula supaya kami boleh menyeret Pemegang Isi untuk menggunakan formula ke seluruh sel.

Sekarang seret baris ke bawah dengan Pengendalian Isi dan anda akan melihat sel yang menahan outlier kini diisi dengan #N/A .

Dan lihat pada carta garis sekarang, ini ialah graf yang diratakan tanpa sebarang nilai terpencil di dalamnya.

Pecahan Formula

=IF(

Ketika kita akan membandingkan nilai berdasarkan yang kita akan mengekstrak hasilnya, kita memulakan formula dengan keadaan JIKA .

=IF(DAN(

Kami akan membandingkan titik data semasa dan sel di atas dan sel di bawah . Dan jika kedua-dua perbandingan adalah benar, barulah kita akan menunjukkan titik data sebagai hasilnya. Oleh itu, memandangkan kita perlu menangani perbandingan "Kedua-duanya", jadi kita harus menggunakan fungsi DAN .

=IF(AND(ABS(

Apabila kami menolak titik data, sesetengah data mungkin membuang nilai negatif. Dan kami melakukannya tidakmahu berurusan dengan nilai negatif kerana nilai negatif akan sentiasa bercanggah dengan syarat "mengalih keluar data apabila perbezaan adalah 10". Jadi untuk memastikan kita sentiasa mendapat hasil yang positif, kita perlu membalut perbandingan dalam fungsi nilai mutlak .

=IF(AND(ABS(C6-C5)> ;$E$6

Di sini kami memulakan perbandingan pertama kami. Kami hanya menolak nilai semasa dengan nilai di atas dan melihat sama ada hasilnya lebih besar daripada tahap perbezaan yang disimpan dalam Sel E6 dan menjadikan sel itu Rujukan Mutlak untuk memastikan nilai sel dikunci.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

Seterusnya, bahagian kedua perbandingan yang dipisahkan dengan koma. Ia akan membandingkan titik data semasa dengan titik data seterusnya.

=IF(DAN(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Sekarang kami meletakkan koma dan tentukan untuk meletakkan fungsi NA di sana jika kedua-dua fungsi DAN adalah benar.

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Dan jika fungsi DAN tidak benar maka kita mahu mengembalikan titik data sebenar sebagai nilai IF False. Jadi kami menaip e dalam koma dan hantar nombor rujukan sel C6 di sana.

Baca Lagi: Cara Mengalih Keluar Pengesahan Data dalam Excel (5 Cara)

Bacaan Serupa

  • Cara Mengalih Keluar Pengepala dalam Excel (4 Kaedah)
  • Alih keluar Garisan Bertitik masukExcel (5 Cara Pantas)
  • Cara Mengalih Keluar Grid daripada Excel (6 Kaedah Mudah)
  • Alih Keluar Sempadan dalam Excel (4 Cara Pantas)
  • Cara Mengalih Keluar Mod Keserasian dalam Excel (2 Cara Mudah)

3. Alih Keluar Outlier Secara Manual dalam Excel

Satu lagi cara mudah untuk menghapuskan outlier dalam Excel ialah, cuma susun nilai set data anda dan padamkan nilai atas dan bawah secara manual daripadanya.

Untuk mengisih data,

  • Pilih set data.
  • Pergi ke Isih & Tapis dalam kumpulan Edit dan pilih sama ada Isih Terkecil kepada Terbesar atau Isih Terbesar kepada Terkecil .

  • Dalam kes kami, kami memilih Isih Terkecil kepada Terbesar . Ia mengisih nombor dalam set data kami dalam tertib menaik, meletakkan yang terkecil di bahagian atas dan yang terbesar di bahagian bawah.

Sekarang hanya padamkan data tersebut secara manual untuk menjadikan nilai terpencil set data percuma.

Kami tidak mengesyorkan mengikuti proses ini semasa bekerja dengan set data yang besar. Apabila set data anda kecil dan lebih mudah dilihat, barulah anda boleh menggunakan prosedur ini, jika tidak, jangan laksanakan ini.

Baca Lagi: Cara Alih Keluar Isih dalam Excel ( 3 Kaedah Mudah)

Kesimpulan

Artikel ini menunjukkan kepada anda cara mengalih keluar outlier dalam Excel. Saya harap artikel ini banyak memberi manfaat kepada anda. Jangan ragu untuk bertanya jika anda mempunyai sebarang soalan mengenaitopik.

Hugh West ialah jurulatih dan penganalisis Excel yang sangat berpengalaman dengan lebih 10 tahun pengalaman dalam industri. Beliau memiliki Ijazah Sarjana Muda Perakaunan dan Kewangan serta Ijazah Sarjana dalam Pentadbiran Perniagaan. Hugh mempunyai minat untuk mengajar dan telah membangunkan pendekatan pengajaran yang unik yang mudah diikuti dan difahami. Pengetahuan pakar Excel beliau telah membantu beribu-ribu pelajar dan profesional di seluruh dunia meningkatkan kemahiran mereka dan cemerlang dalam kerjaya mereka. Melalui blognya, Hugh berkongsi pengetahuannya dengan dunia, menawarkan tutorial Excel percuma dan latihan dalam talian untuk membantu individu dan perniagaan mencapai potensi penuh mereka.