Isi kandungan
Outlier mungkin perlu dikenal pasti untuk melakukan pengiraan statistik pada data daripada set data. Anda boleh menemui pencilan daripada set data yang besar menggunakan Microsoft Excel dalam pelbagai cara. Dalam siaran ini, kami akan menunjukkan kepada anda cara mengira outlier dalam Microsoft Excel menggunakan lima cara yang berbeza.
Muat turun Buku Kerja Amalan
Anda boleh memuat turun buku kerja Excel percuma dari sini dan berlatih sendiri .
Cari Outliers.xlsx
5 Pendekatan Berguna untuk Mengira Outliers dalam Excel
Outliers adalah nilai data yang berbeza dengan ketara daripada nilai data yang lain dalam set data. Outliers, dengan kata lain, adalah nilai yang luar biasa. Nilai tersebut sama ada sangat tinggi atau terlalu rendah berbanding dengan nilai lain dalam set data. Mencari outlier adalah penting dalam pengiraan statistik kerana ia mempunyai kesan ke atas penemuan analisis data kami.
Sebagai contoh, anda mempunyai set data yang menunjukkan pendapatan harian dua belas orang. Sekarang, anda perlu mengira outlier menggunakan Microsoft Excel. Di sini, saya akan menunjukkan kepada anda lima pendekatan mudah untuk berbuat demikian.
1. Gunakan Isih & Tapis untuk Mengira Outlier dalam Excel
Anda boleh mengira outlier daripada set data kecil dengan menggunakan Isih & Perintah penapis dalam Excel. Jika anda ingin mengira outlier menggunakan fungsi isihan dan penapis, anda boleh melakukannya dengan mengikutilangkah di bawah.
Langkah 1:
- Pertama sekali, pilih pengepala lajur dalam set data excel anda yang ingin diisih. Contohnya, dalam set data yang diberikan, dalam pengepala lajur fail bernama Pendapatan Harian (Sel C40 dipilih).
Langkah 2:
- Kemudian, tekan Home tab pada reben dan pergi ke kumpulan Mengedit .
Langkah 3:
- Selepas itu, dalam kumpulan Pengeditan klik pada Isih & Tapis perintah dan klik pada Tersuai Isih .
Langkah 4:
- Kemudian, kotak dialog baharu bernama Isih akan dibuka. Dalam kotak dialog yang timbul, pilih Harian Pendapatan dalam Isih mengikut lungsur turun dan Terkecil hingga Terbesar dalam lungsur turun Pesanan. Selepas itu, klik OK .
Langkah 5:
- Akhir sekali, lajur Pendapatan Harian akan diisih mengikut cara yang dinyatakan, dengan nilai terendah di bahagian atas dan nilai terbesar di bahagian bawah. Selepas menjalankan prosedur, cari sebarang penyelewengan dalam julat data untuk menentukan outlier.
Sebagai contoh, dua nilai pertama dalam lajur adalah jauh lebih rendah dan dua nilai terakhir dalam lajur adalah jauh lebih tinggi daripada nilai lain dalam set data, seperti yang ditunjukkan dalamhasil di atas.
Baca Lagi: Cara Mencari Outlier dalam Analisis Regresi dalam Excel (3 Cara Mudah)
2. Gunakan Fungsi QUARTIL untuk Kira Outliers dalam Excel
Fungsi QUARTILE pendekatan ialah cara yang lebih saintifik untuk mengira outlier dalam Excel. Anda boleh menggunakan fungsi ini untuk membahagikan set data anda kepada empat bahagian yang sama. Nilai berikut akan dikembalikan oleh fungsi QUARTILE :
- Nilai minimum .
- 1 kuartil (Q1- terendah 25% set data yang diberikan).
- Kuartil 2 (Q2-seterusnya 25% terendah daripada set data).
- Kuartil 3 (Q3- kedua tertinggi 25% daripada set data).
- nilai maksimum.
Sintaks fungsi QUARTILE dalam Excel ialah:
=QUARTILE( tatasusunan,kuar)
Sintaks mengandungi argumen berikut:
- a rray : julat sel bagi sesuatu set data yang mana anda akan mengira nilai kuartil.
- kuar: Ini menentukan nilai yang harus dikembalikan.
Untuk mengira outlier bagi set data di atas menggunakan fungsi QUARTIL, ikut langkah di bawah.
Langkah 1:
- Pertama sekali, taipkan formula berikut untuk menentukan 1 kuartil ( Q1 ) diberikan di bawah.
=QUARTILE($C$5:$C$16,1)
Langkah 2:
- Di sinisekali lagi, formula untuk mengira kuartil 3 ( Q3 ) diberikan di bawah.
=QUARTILE($C$5:$C$16,3)
Langkah 3:
- Ketiga, anda perlu menentukan IQR, yang Julat Antara Kuartil (ia mewakili 50% data yang diberikan daripada julat set data yang termasuk dalam kuartil pertama dan ketiga) dengan menolak Q1 (dalam sel G4 ) daripada Q3 (dalam sel G5 ). Taip formula berikut untuk mengira penolakan.
=G5-G4
Langkah 4:
- Selepas mencari IQR, seterusnya anda perlu menentukan atas dan rendah Kerana atas dan bawah had akan mengandungi kebanyakan data dalam set data. Tulis formula berikut untuk mengira had atas.
=G5+(1.5*G6)
Langkah 5:
- Kemudian, untuk mengira had bawah, tulis formula berikut.
=G4-(1.5*G6)
Langkah 6:
- Akhir sekali, selepas menamatkan langkah sebelumnya, anda boleh menentukan outlier untuk setiap data nilai. Dalam lembaran kerja excel, taip formula berikut dengan fungsi OR dalam sel D5 .
=OR(C5$G$7)
- Formula ini akan membantu mengenal pasti data yang tidak termasuk dalam had julat yang dinyatakan di atas. Selepas memprosesformula akan menunjukkan Pernyataan BENAR jika data khusus adalah outlier dan PALSU jika tidak. Klik dua kali pada alat AutoIsi dalam sel C5 untuk menyalin formula ke seluruh sel dalam lajur C . Oleh itu, anda boleh melihat nilai True di sebelah semua outlier dalam set data anda.
3. Gabungkan Fungsi AVERAGE dan STDEV.P untuk Mengira Outlier daripada Min dan Sisihan Piawai
A sisihan piawai (atau σ ) ialah metrik untuk menentukan cara taburan data berkenaan nilai min keseluruhan set data. Data dikumpulkan di sekitar min apabila sisihan piawai rendah, manakala data lebih tersebar apabila sisihan piawai tinggi. Untuk mengira outlier menggunakan Min dan Sisihan Piawai anda boleh mengikuti langkah berikut.
Langkah 1:
- Pertama, gunakan set data yang sama yang ditunjukkan pada permulaan artikel ini dan kemudian hitung min dan sisihan piawai. Untuk mengira min, taip formula berikut dengan fungsi AVERAGE dalam sel G5 .
=AVERAGE(C5:C16)
Langkah 2:
- Untuk mengira sisihan piawai, masukkan formula berikut dengan STDEV Fungsi .P dalam sel G6 .
=STDEV.P(C5:C16)
Langkah 3:
- Seterusnya, anda akan mengirahad atas untuk kemajuan selanjutnya dalam proses. Dalam sel G7 , hitung had bawah menggunakan formula berikut.
=G5-(1.25*G6)
Langkah 4:
- Dan dalam sel G8 kira had atas daripada formula berikut
=G5+(1.5*G6)
Langkah 5:
- Selepas itu , untuk mengira sama ada sebarang outlier wujud atau tidak, taip formula berikut dalam sel D5 .
=OR(C5$G$8)
- Oleh itu, formula akan mengembalikan nilai TRUE jika data khusus dalam sel yang dikehendaki adalah outlier dan SALAH.
- Klik dua kali pada alat AutoIsi dalam sel D5 untuk menyalin formula ke seluruh sel dalam lajur D . Oleh itu, anda boleh mengetahui semua outlier yang tinggal dalam set data anda.
Baca Lagi: Cara Mencari Outlier dengan Sisihan Piawai dalam Excel (dengan Langkah Pantas)
4. Sisipkan Z-Score untuk Mengira Outlier dalam Excel
Z-skor ialah salah satu metrik yang paling kerap digunakan untuk mengenal pasti outliers. Kaedah ini menunjukkan sejauh mana data tertentu daripada min set data berkenaan dengan sisihan piawainya. Untuk mengira outlier menggunakan Z-skor dalam Excel, anda boleh melihat langkah yang diterangkan di bawah.
Langkah 1:
- Pertama sekali, ambil set data yang diingini.
Langkah2:
- Kedua, dalam sel H5, taip formula berikut untuk mengira min untuk data yang diberikan.
=AVERAGE(C5:C16)
Langkah 3:
- Ketiga, hitung sisihan piawai set data yang diberikan dalam sel H6 dengan menggunakan formula berikut.
=STDEV.P(C5:C16)
Langkah 4:
- Selepas itu , anda perlu menentukan Z -skor untuk setiap nilai data. Untuk melakukan ini, anda menggunakan formula yang diberikan di bawah.
=(C5-$H$5)/$H$6
Langkah 5:
- Selepas mengira semua nilai-Z, anda akan melihat bahawa julat nilai-Z adalah antara -1.44 dan 13 . Jadi, kami menganggap nilai Z-skor kurang daripada -1.2 atau lebih daripada +1.8 untuk had terpencil.
- Kemudian, taipkan formula berikut ke dalam sel E 5 .
=OR((D51.8))
- Akhir sekali, formula akan mengembalikan nilai TRUE jika data khusus adalah outlier dan akan mengembalikan FALSE
- Klik dua kali pada sel E5 untuk menggunakan AutoIsi pemegang isi alat untuk menyalin formula ke seluruh sel dalam lajur E . Oleh itu, anda boleh menemui semua outlier yang tinggal dalam set data anda.
Baca Lagi: Cara Mencari Outlier Menggunakan Skor Z dalam Excel (dengan PantasLangkah)
5. Gabungkan Fungsi BESAR dan KECIL untuk Mencari Outlier dalam Excel
Fungsi BESAR dan fungsi KECIL dalam Excel mempunyai operasi yang bertentangan. Kami akan menggunakannya untuk mencari data atau nilai terbesar dan terkecil dalam set data, masing-masing. Fungsi ini akan menarik semua data dalam set data, mencari nombor terkecil dan terbesar. Mereka dapat mencari kedua terkecil atau terbesar, ketiga terbesar atau terkecil, dan seterusnya.
Langkah 1:
- Pertama sekali, gunakan formula berikut dalam sel E5 dengan fungsi LARGE .
=LARGE($C$5:$C$16,1)
-
- Oleh itu, daripada 12 nilai, anda boleh melihat nilai pertama terbesar iaitu 780 .
Langkah 2:
- Selepas itu, dalam sel G5 , tulis formula berikut untuk mencari nilai terkecil.
=SMALL($C$5:$C$16,1)
- Akhir sekali, daripada 12 nilai, anda boleh melihat 1 nilai terkecil 110 .
- Setelah anda mengetahui semua nilai yang diperlukan, maka anda boleh dengan mudah menunjukkan sebarang outlier dalam set data.
Kesimpulan
Itulah penghujung artikel ini. Saya harap anda dapati artikel ini membantu. Selepas membaca artikel ini, anda akan dapat mengira outlier dalam Excel menggunakan mana-mana kaedah. Sila kongsi sebarang pertanyaan atau cadangan lanjut dengankami di bahagian komen di bawah.