İçindekiler
Aykırı değerleri bulmak ve bunları kaldırmak, istatistik, veri madenciliği, makine öğrenimi vb. alanlarda verileri analiz etmek için çok yaygın bir görevdir. Veri kümenizdeki aykırı değerleri bulmanın pek çok yolu vardır, ancak bunları kaldırma işlemini bulmak o kadar kolay değildir. Bu makalede, size nasıl yapılacağını göstereceğiz Excel'de aykırı değerleri kaldırma .
Çalışma Kitabını İndirin
Ücretsiz alıştırma Excel çalışma kitabını buradan indirebilirsiniz.
Aykırı Değerleri Kaldır.xlsxExcel'de Outliers nedir?
Bir aykırı değer bir veri kümesinin ortalama veya medyan değerinden çok uzakta olan bir değerdir. Başka bir deyişle, aykırı değerler, bir veri kümesindeki diğer değerlerden önemli ölçüde daha yüksek veya daha düşük olan değerlerdir.
Tüm vurucuların 50 civarında skor yaptığı ancak sadece bir vurucunun yüzyıl skoru (100) yaptığı ve diğer vurucunun 0'da dışarıda kaldığı bir kriket maçı düşünün. 100 ve 0 skorları bu maçtaki aykırı değerlerdir.
Aykırı değerler, veri analizinin sonucunu çarpıtabilecekleri ve yanıltıcı sonuçlar ortaya çıkarabilecekleri için sorunludur. Bu nedenle, düzgün bir veri kümesine sahip olmak için aykırı değerleri bulmak ve bunları kaldırmak daha iyidir.
Excel'de Aykırı Değerleri Kaldırmanın 3 Yolu
Bu bölümde, aşağıdakileri nasıl yapacağınızı öğreneceksiniz aykırı değerleri silme Aykırı değerleri veri kümenizden 3 farklı şekilde çıkarın. Aykırı değerleri kaldırmak zor bir süreçtir, bu nedenle makalenin tamamını dikkatlice okuyun.
1. Aykırı Değerler Olmadan Ortalama Hesaplamak için Excel Fonksiyonunun Kullanılması
Excel TRIMMEAN işlevi aykırı değerleri hariç tutarak belirli bir veri kümesinin ortalamasını hesaplamak için kullanılabilir. Hariç tutulacak veri noktaları yüzde olarak sağlanır. Yüzde değeri ondalık biçiminde veya yüzde biçiminde girilebilir.
Aykırı değerler olmadan ortalamayı hesaplamak için sözdizimi şöyledir,
=TRIMMEAN(dizi, yüzde)İşte,
- dizi = Kırpılacak ve ortalama sonucu hesaplanacak veri aralığı
- yüzde = Hariç tutulacak veri noktası sayısı
Aykırı değerleri kaldırılmış sonuçları hesaplamak için bu fonksiyonun nasıl uygulanacağını görelim.
Yukarıdaki resmi düşünün. Hücre B5 - B14 . Burada sayıların çoğu 20 ila 27 arasındadır, ancak iki değer - 0 ve 100 - bu değerlerden çok uzakta. Yani bunlar aykırı değerler veri setimizde.
Veri setimiz için, Excel ile aykırı değerler olmadan ortalamayı (ortalama) hesaplamak için formül TRIMMEAN işlevidir,
=TRIMMEAN(B5:B14,0.2)
İşte,
- B5:B14 = Kırpılacak ve ortalama sonucu hesaplanacak veri aralığı
- 0.2 (veya %20) = Hariç tutulacak veri noktası sayısı
Veri kümesindeki herhangi bir sayı, veri kümesinin geri kalanından %20 oranında farklıysa, bu sayı aykırı değer olarak adlandırılacaktır.
Formülü veri kümenize göre yazıp Girin , sen alacaksın aykırı değerler olmadan hesaplanan ortalama veri kümeniz için. Bizim durumumuzda, Hücre E6 hesaplanan ortalamayı tutar ki bu da 23.50 .
Cevabın doğru olup olmadığını kontrol etmek için ORTALAMA işlevi içinde Hücre E5 ortalamasını döndüren ( 28.80 ) aralığındaki tüm değerlerin B5:B14 . Ve içinde Hücre E7 , bir tane daha çalıştırıyoruz ORTALAMA işlevini, aykırı değerleri tutanlar hariç tüm hücreleri manuel olarak girerek çalıştırdım ve 23.50 Sonuç olarak.
Yani diyebiliriz ki TRIMMEAN işlevi, Excel'de ortalama hesaplanırken belirli bir veri kümesinden aykırı değerleri başarıyla kaldırabilir.
Daha fazlasını okuyun: Excel'de Formül Nasıl Temizlenir (7+ Yöntem)
2. Excel'de Veri Kümesinden ve Çizgi Grafikten Aykırı Değerleri Kaldırma
Aşağıdaki resme dikkat edin. Bir çizgi grafiği oluşturduğumuz bazı verilere sahibiz. Çizgi grafiğinden, aşağıdakileri kolayca görebiliriz 4 ve 8 numaralı veri noktalarında aykırı değerlerimiz var .
Şimdi, veri kümesindeki uç değerleri kaldırarak çizgi grafiği nasıl düzeltebileceğimizi göreceğiz.
Başka bir hücrede (bizim durumumuzda Hücre H6 ), aşağıdaki formülü yazınız,
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
İşte,
- C6 = Veri kümesindeki ilk veriyi tutan hücre
- C5 = İlk veri hücresinin üzerindeki hücre
- C7 = İlk veri hücresinin altındaki hücre
- $E$6 = Veri noktaları arasındaki fark.
Verilerimize baktığımızda, bir veri noktası 10 birim farklılık gösterir olarak belirlenmiştir. aykırı değer Bu yüzden 10 içinde Hücre E6 ve onu bir Mutlak Hücre Referansı böylece bu hücre tüm veri kümesi boyunca taranırken ve hesaplanırken sabitlenecektir.
Tuşuna bastıktan sonra Girin 'de, ilk verinin hala sonuç hücresinde göründüğünü görebilirsiniz H6 Burada yapmanız gereken tek şey, sadece formülü oluşturmaktır, böylece Doldurma Kolu Formülü hücrelerin geri kalanına uygulamak için.
ile satırı aşağı sürükleyin. Doldurma Kolu ve aykırı değerleri tutan hücrelerin artık aşağıdakilerle dolu olduğunu göreceksiniz #N/A .
Ve şimdi çizgi grafiğe bakın, bu artık içinde herhangi bir uç değer olmayan düzleştirilmiş bir grafiktir.
Formül Dağılımı
=IF(
Sonucu çıkaracağımız değerleri karşılaştıracağımız için, formülü EĞER Durum.
=IF(VE(
Mevcut veri noktası ile yukarıdaki hücreyi ve aşağıdaki hücreyi karşılaştıracağız. Ve her iki karşılaştırma da doğruysa, ancak o zaman veri noktasını sonuç olarak göstereceğiz. Bu nedenle, "Her iki" karşılaştırma ile uğraşmamız gerektiğinden, bu nedenle VE işlevi .
=IF(AND(ABS(
Veri noktalarını çıkardığımızda, bazı veriler negatif değerler atabilir. Negatif değerler her zaman "fark 10 olduğunda verileri çıkarma" koşuluyla çelişeceğinden, negatif değerlerle uğraşmak istemeyiz. Bu nedenle, her zaman pozitif sonuçlar elde ettiğimizden emin olmak için, karşılaştırmaları bir Mutlak değer fonksiyonu .
=IF(AND(ABS(C6-C5)>$E$6
Burada ilk karşılaştırmamıza başladık. Basitçe mevcut değeri yukarıdaki değerden çıkarıyoruz ve sonucun aşağıdakinde depolanan fark seviyesinden büyük olup olmadığına bakıyoruz Hücre E6 ve hücreyi bir Mutlak Referans hücre değerini kilitli tutmak için.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)
Ardından, karşılaştırmanın virgülle ayrılmış ikinci kısmı gelir. Mevcut veri noktasını bir sonraki veri noktasıyla karşılaştırır.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
Şimdi bir virgül koyuyoruz ve NA fonksiyon eğer her ikisi de VE fonksiyonları doğrudur.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Ve eğer VE fonksiyonu doğru değilse, gerçek veri noktasını EĞER Yanlış değer. Bu yüzden virgül yazıyoruz ve hücre referans numarasını geçiyoruz C6 Orada.
Daha fazlasını okuyun: Excel'de Veri Doğrulama Nasıl Kaldırılır (5 Yol)
Benzer Okumalar
- Excel'de Üstbilgi Nasıl Kaldırılır (4 Yöntem)
- Excel'de Noktalı Çizgileri Kaldırma (5 Hızlı Yol)
- Excel'den Izgara Nasıl Kaldırılır (6 Kolay Yöntem)
- Excel'de Kenarlıkları Kaldırma (4 Hızlı Yol)
- Excel'de Uyumluluk Modu Nasıl Kaldırılır (2 Kolay Yol)
3. Excel'de Aykırı Değerleri Manuel Olarak Kaldırın
Excel'de aykırı değerleri ortadan kaldırmanın bir başka kolay yolu da, veri kümenizin değerlerini sıralamak ve en üst ve en alt değerleri manuel olarak silmektir.
Verileri sıralamak için,
- Seçiniz veri kümesi.
- Gitmek Sırala ve Filtrele içinde Düzenleme grubunu seçin ve En Küçükten En Büyüğe Sırala veya En Büyükten En Küçüğe Sırala .
- Bizim durumumuzda, şunları seçtik En Küçükten En Büyüğe Sırala Veri setimizdeki sayıları, en küçükleri en üste ve en büyükleri en alta yerleştirerek artan sırada sıraladı.
Şimdi, veri kümesini uç değerlerden arındırmak için bu verileri manuel olarak silin.
Büyük bir veri kümesiyle çalışırken bu işlemi uygulamanızı önermiyoruz. Veri kümeniz küçük ve görüntülenmesi daha kolay olduğunda, ancak o zaman bu prosedürü uygulayabilirsiniz, aksi takdirde bunu uygulamayın.
Daha fazlasını okuyun: Excel'de Sıralama Nasıl Kaldırılır (3 Kolay Yöntem)
Sonuç
Bu makale size aşağıdakileri nasıl yapacağınızı gösterdi aykırı değerleri kaldırın Umarım bu makale sizin için çok faydalı olmuştur. Konuyla ilgili herhangi bir sorunuz varsa sormaktan çekinmeyin.