Სარჩევი
შეიძლება დასჭირდეს ამორტიზატორების იდენტიფიცირება მონაცემთა ნაკრებიდან მონაცემებზე სტატისტიკური გამოთვლების გასაკეთებლად. თქვენ შეგიძლიათ აღმოაჩინოთ ამომწურავი მონაცემები უზარმაზარი მონაცემთა ნაკრებიდან Microsoft Excel-ის გამოყენებით მრავალი გზით. ამ პოსტში ჩვენ გაჩვენებთ, თუ როგორ გამოვთვალოთ outliers Microsoft Excel-ში ხუთი განსხვავებული გზით.
ჩამოტვირთეთ პრაქტიკის სამუშაო წიგნი
შეგიძლიათ ჩამოტვირთოთ Excel-ის უფასო სამუშაო წიგნი აქედან და ივარჯიშოთ დამოუკიდებლად .
იპოვნეთ Outliers.xlsx
5 მოსახერხებელი მიდგომა Excel-ში მაჩვენებლების გამოსათვლელად
Outliers მონაცემთა მნიშვნელობებია რომლებიც მნიშვნელოვნად განსხვავდება მონაცემთა ნაკრების დანარჩენი მნიშვნელობებისაგან. სხვა სიტყვებით რომ ვთქვათ, გამოკვეთები არაჩვეულებრივი ღირებულებებია. ისინი ან განსაკუთრებულად მაღალია ან ზედმეტად დაბალი მონაცემთა ნაკრების სხვა მნიშვნელობებთან შედარებით. აღკვეთილების პოვნა სასიცოცხლოდ მნიშვნელოვანია სტატისტიკურ გამოთვლებში, რადგან ისინი გავლენას ახდენენ ჩვენი მონაცემთა ანალიზის შედეგებზე.
მაგალითად, თქვენ გაქვთ მონაცემთა ნაკრები, რომელიც აჩვენებს თორმეტი ადამიანის დღიურ შემოსავალს. ახლა, თქვენ უნდა გამოთვალოთ outliers გამოყენებით Microsoft Excel. აქ მე გაჩვენებთ ხუთ მარტივ მიდგომას ამის გასაკეთებლად.
1. გამოიყენეთ Sort & გაფილტვრა ექსელში გამოსათვლელად
შეგიძლიათ გამოთვალოთ უკიდეგანოები მცირე მონაცემთა ნაკრებიდან სორტირების და amp; Filter ბრძანება Excel-ში. თუ გსურთ გამოთვალოთ outliers დალაგების და ფილტრის ფუნქციის გამოყენებით, შეგიძლიათ ამის გაკეთება შემდეგნაირადნაბიჯები ქვემოთ.
ნაბიჯი 1:
- პირველ რიგში, აირჩიეთ სვეტის სათაური Excel-ის მონაცემთა ბაზაში, რომლის დახარისხებაც გსურთ. მაგალითად, მოცემულ მონაცემთა ნაკრებში, ფაილის სვეტის სათაურში, სახელად დღიური შემოსავალი (არჩეულია უჯრედი C40 ).
ნაბიჯი 2:
- შემდეგ დააჭირეთ მთავარი ჩანართი ლენტზე და გადადით რედაქტირების ჯგუფში.
ნაბიჯი 3:
- ამის შემდეგ, რედაქტირების ჯგუფში დააწკაპუნეთ დახარისხება & amp; გაფილტრეთ ბრძანება და დააწკაპუნეთ Custom Sort .
ნაბიჯი 4:
- შემდეგ, გაიხსნება ახალი დიალოგური ფანჯარა სახელად Sort . ამოსულ დიალოგურ ფანჯარაში აირჩიეთ ყოველდღიური შემოსავალი სორტირება ჩამოსაშლელი და პატარადან დიდამდე შეკვეთის ჩამოსაშლელ სიაში. ამის შემდეგ დააჭირეთ OK .
ნაბიჯი 5:
- ბოლოს, დღიური შემოსავალი სვეტი დალაგდება მითითებული წესით, ყველაზე დაბალი მნიშვნელობებით ზემოთ და უდიდესი მნიშვნელობებით ბოლოში. პროცედურის გაშვების შემდეგ, მოძებნეთ ნებისმიერი დარღვევები მონაცემთა დიაპაზონში, რათა დაადგინოთ უკიდეგანოები.
მაგალითად, სვეტის პირველი ორი მნიშვნელობა მნიშვნელოვნად დაბალია და ბოლო ორი მნიშვნელობა სვეტში არსებითად უფრო მაღალია, ვიდრე დანარჩენი მნიშვნელობები მონაცემთა ნაკრების, როგორც ნაჩვენებიაზემოთ შედეგი.
წაიკითხეთ მეტი: როგორ მოვძებნოთ დაშორებები რეგრესიის ანალიზში Excel-ში (3 მარტივი გზა)
2. QUARTILE ფუნქციის გამოყენება Outliers-ის გამოთვლა Excel-ში
QUARTILE ფუნქციის მიდგომა არის უფრო მეცნიერული გზა Excel-ში მაჩვენებლების გამოსათვლელად. თქვენ შეგიძლიათ გამოიყენოთ ეს ფუნქცია თქვენი მონაცემთა ნაკრების ოთხ თანაბარ ნაწილად გასაყოფად. შემდეგი მნიშვნელობები დაბრუნდება QUARTILE ფუნქციით :
- მინიმალური მნიშვნელობა.
- 1-ლი კვარტლი (Q1 - მოცემული მონაცემთა ნაკრების ყველაზე დაბალი 25%).
- მეორე კვარტლი (Q2-შემდეგი მონაცემთა ნაკრების ყველაზე დაბალი 25%).
- მე-3 კვარტლი (მე-3-მეორე ყველაზე მაღალი 25% მონაცემთა ბაზის).
- მაქსიმალური მნიშვნელობა.
QUARTILE ფუნქციის სინტაქსი Excel-ში არის:
=QUARTILE( მასივი, quart)
სინტაქსი შეიცავს შემდეგ არგუმენტებს:
- a ray : მოცემულის უჯრედების დიაპაზონი მონაცემთა ნაკრები, რომლისთვისაც თქვენ გამოთვლით კვარტლის მნიშვნელობას.
- quart: ეს განსაზღვრავს რომელი მნიშვნელობა უნდა დაბრუნდეს.
ზემოხსენებული მონაცემთა ნაკრებისთვის outliers გამოსათვლელად QUARTILE ფუნქციის გამოყენებით, მიჰყევით ქვემოთ მოცემულ ნაბიჯებს.
ნაბიჯი 1:
- პირველ რიგში, აკრიფეთ შემდეგი ფორმულა 1-ლი კვარტილის ( Q1 ) დასადგენად ქვემოთ მოცემულია.
=QUARTILE($C$5:$C$16,1)
ნაბიჯი 2:
- აქისევ, მე-3 კვარტილის ( Q3 ) გამოთვლის ფორმულა მოცემულია ქვემოთ.
=QUARTILE($C$5:$C$16,3)
ნაბიჯი 3:
- მესამე, თქვენ უნდა განსაზღვროთ IQR, რომელიც არის კვარტილთაშორის დიაპაზონი (ის წარმოადგენს მოცემული მონაცემების 50% მონაცემთა ნაკრების დიაპაზონიდან, რომელიც შედის პირველ და მესამე მეოთხედში) Q1 გამოკლებით. (უჯრედში G4 ) Q3 -დან (უჯრედში G5 ). ჩაწერეთ შემდეგი ფორმულა გამოკლების გამოსათვლელად.
=G5-G4
ნაბიჯი 4:
- IQR-ის პოვნის შემდეგ, შემდეგ თქვენ უნდა განსაზღვროთ ზედა და ქვედა რადგან ზედა და ქვედა ლიმიტი შეიცავს მონაცემთა უმეტესობას მონაცემთა ნაკრები. ზედა ზღვარის გამოსათვლელად ჩამოწერეთ შემდეგი ფორმულა.
=G5+(1.5*G6)
ნაბიჯი 5:
- შემდეგ ქვედა ლიმიტის გამოსათვლელად ჩაწერეთ შემდეგი ფორმულა.
=G4-(1.5*G6)
ნაბიჯი 6:
- საბოლოოდ, წინა საფეხურის დასრულების შემდეგ, თქვენ შეგიძლიათ დაადგინოთ outliers თითოეული მონაცემისთვის ღირებულება. Excel-ის სამუშაო ფურცელში ჩაწერეთ შემდეგი ფორმულა OR ფუნქციით უჯრედში D5 .
=OR(C5$G$7)
- ეს ფორმულა დაგეხმარებათ იმ მონაცემების იდენტიფიცირებაში, რომლებიც არ შედის ზემოაღნიშნულ დიაპაზონში. დამუშავების შემდეგფორმულა აჩვენებს TRUE დებულებას თუ კონკრეტული მონაცემები არის გარე და FALSE თუ ეს არ არის. ორჯერ დააწკაპუნეთ AutoFill ინსტრუმენტზე უჯრედში C5 რათა დააკოპიროთ ფორმულა დანარჩენ უჯრედებში C სვეტში . ამგვარად, თქვენ შეგიძლიათ დააკვირდეთ ჭეშმარიტ მნიშვნელობას თქვენს მონაცემთა ბაზაში არსებული ყველა გამონაკლისის გვერდით.
3. შეუთავსეთ AVERAGE და STDEV.P ფუნქციები საშუალოდან და სტანდარტული გადახრებიდან გამოსათვლელად
A სტანდარტული გადახრა (ან σ ) არის მეტრიკა იმის დასადგენად, თუ როგორ არის განაწილებული მონაცემები მონაცემთა მთლიანი ნაკრების საშუალო მნიშვნელობის მიხედვით. მონაცემები დაჯგუფებულია საშუალოზე, როდესაც სტანდარტული გადახრა დაბალია, ხოლო მონაცემები უფრო გავრცელებულია, როდესაც სტანდარტული გადახრა მაღალია. outliers გამოსათვლელად საშუალო და სტანდარტული გადახრის გამოყენებით შეგიძლიათ მიჰყვეთ შემდეგ ნაბიჯებს.
ნაბიჯი 1:
- პირველ რიგში, გამოიყენეთ იგივე მონაცემთა ნაკრები, რომელიც ნაჩვენებია ამ სტატიის დასაწყისში და შემდეგ გამოთვალეთ საშუალო და სტანდარტული გადახრა. საშუალოს გამოსათვლელად, ჩაწერეთ შემდეგი ფორმულა AVERAGE ფუნქციით უჯრედში G5 .
=AVERAGE(C5:C16)
ნაბიჯი 2:
- სტანდარტული გადახრის გამოსათვლელად ჩასვით შემდეგი ფორმულა STDEV-ით .P ფუნქცია უჯრედში G6 .
=STDEV.P(C5:C16)
ნაბიჯი 3:
- შემდეგი, თქვენ გამოთვალეთზედა ზღვარი პროცესის შემდგომი წინსვლისთვის. უჯრედში G7 გამოთვალეთ ქვედა ზღვარი შემდეგი ფორმულის გამოყენებით.
=G5-(1.25*G6)
ნაბიჯი 4:
- და უჯრედში G8 გამოთვალეთ ზედა ზღვარი შემდეგი ფორმულიდან
=G5+(1.5*G6)
ნაბიჯი 5:
- ამის შემდეგ , იმის გამოსათვლელად, არსებობს თუ არა რაიმე გამონაკლისი, ჩაწერეთ შემდეგი ფორმულა უჯრედში D5 .
=OR(C5$G$8)
- ამგვარად, ფორმულა დააბრუნებს TRUE მნიშვნელობას, თუ სასურველ უჯრედში კონკრეტული მონაცემები არის გარე და FALSE.
- ორჯერ დააწკაპუნეთ AutoFill ინსტრუმენტზე უჯრედში D5 ფორმულის კოპირება დანარჩენ უჯრედებში სვეტა D . ამგვარად, თქვენ შეგიძლიათ გაიგოთ ყველა დარჩენილი outliers თქვენს მონაცემთა ბაზაში.
წაიკითხეთ მეტი: როგორ მოვძებნოთ outliers სტანდარტული გადახრით Excel-ში (სწრაფი ნაბიჯებით)
4. ჩადეთ Z-Score Outliers-ის გამოსათვლელად Excel-ში
Z-ქულა არის ერთ-ერთი ყველაზე ხშირად გამოყენებული მეტრიკა. გამოკვეთის იდენტიფიცირება. ეს მეთოდი აჩვენებს, თუ რამდენად შორს არის კონკრეტული მონაცემი მონაცემთა ნაკრების საშუალოდან მისი სტანდარტული გადახრის მიმართ. ექსელში Z-ქულის გამოსათვლელად შეგიძლიათ იხილოთ ქვემოთ აღწერილი ნაბიჯები.
ნაბიჯი 1:
- პირველ რიგში, აიღეთ სასურველი მონაცემთა ნაკრები.
ნაბიჯი2:
- მეორე, უჯრედში H5, აკრიფეთ შემდეგი ფორმულა საშუალო გამოსათვლელად 7>მოცემული მონაცემებისთვის.
=AVERAGE(C5:C16)
ნაბიჯი 3:
- მესამე, გამოთვალეთ სტანდარტული გადახრა მოცემული ნაკრების უჯრედში H6 შემდეგი ფორმულის გამოყენებით.
=STDEV.P(C5:C16)
ნაბიჯი 4:
- ამის შემდეგ , თქვენ უნდა განსაზღვროთ Z -ქულა თითოეული მონაცემთა მნიშვნელობისთვის. ამისათვის გამოიყენეთ ქვემოთ მოცემული ფორმულა.
=(C5-$H$5)/$H$6
ნაბიჯი 5:
- ყველა Z-მნიშვნელობების გამოთვლის შემდეგ, ნახავთ, რომ Z-მნიშვნელობების დიაპაზონი არის -1.44 და 13 შორის. ასე რომ, ჩვენ განვიხილავთ Z-ქულის მნიშვნელობებს -1,2-ზე ნაკლები ან +1,8 -ზე მეტის გარე ზღვრებისთვის.
- შემდეგ, ჩაწერეთ შემდეგი ფორმულა უჯრედში E 5 .
=OR((D51.8))
- საბოლოოდ, ფორმულა დააბრუნებს TRUE მნიშვნელობას, თუ კონკრეტული მონაცემები არის გარე და დააბრუნებს FALSE
- ორჯერ დააწკაპუნეთ უჯრედზე E5 გამოიყენოთ ავტომატური შევსება ინსტრუმენტების შევსების სახელური ფორმულის დასაკოპირებლად სვეტა E დანარჩენ უჯრედებში. ამგვარად, თქვენ შეგიძლიათ იპოვოთ ყველა დარჩენილი გამონაკლისი თქვენს მონაცემთა ბაზაში.
წაიკითხეთ მეტი: როგორ მოვძებნოთ outliers გამოყენებით Z Score Excel-ში (სწრაფისაფეხურები)
5. LARGE და SMALL ფუნქციების შერწყმა Excel-ში დაშორების საპოვნელად
LARGE ფუნქცია და SMALL ფუნქცია Excel-ში აქვს საპირისპირო ოპერაციები. ჩვენ მას გამოვიყენებთ მონაცემთა ნაკრების უდიდესი და უმცირესი მონაცემების ან მნიშვნელობების მოსაძებნად. ეს ფუნქცია ამოიყვანს ყველა მონაცემს მონაცემთა ნაკრების ფარგლებში, იპოვის უმცირეს და უდიდეს რიცხვებს. მათ შეუძლიათ იპოვონ მეორე უმცირესი ან უდიდესი, მესამე უდიდესი ან ყველაზე პატარა და ასე შემდეგ.
ნაბიჯი 1:
- პირველ რიგში, გამოიყენეთ შემდეგი ფორმულა უჯრედში E5 LARGE ფუნქციით .
=LARGE($C$5:$C$16,1)
-
- ამგვარად, 12 მნიშვნელობებიდან შეგიძლიათ იხილოთ პირველი უდიდესი მნიშვნელობა, რომელიც არის 780 .
ნაბიჯი 2:
- ამის შემდეგ, უჯრედში G5 ჩაწერეთ შემდეგი ფორმულა უმცირესი მნიშვნელობის საპოვნელად.
=SMALL($C$5:$C$16,1)
- და ბოლოს, 12 მნიშვნელობებიდან შეგიძლიათ იხილოთ 1-ლი უმცირესი მნიშვნელობა 110 .
- როგორც კი გაიგებთ ყველა საჭირო მნიშვნელობას, მაშინ თქვენ შეგიძლიათ მარტივად მიუთითოთ ნებისმიერი გამონაკლისი მონაცემთა ნაკრებში.
დასკვნა
ეს სტატიის დასასრულია. იმედი მაქვს, რომ ეს სტატია თქვენთვის სასარგებლო იქნება. ამ სტატიის წაკითხვის შემდეგ თქვენ შეძლებთ გამოთვალოთ outliers Excel-ში ნებისმიერი მეთოდის გამოყენებით. გთხოვთ გაუზიაროთ ნებისმიერი დამატებითი შეკითხვა ან რეკომენდაციამოგვწერეთ კომენტარების განყოფილებაში ქვემოთ.