কিভাবে এক্সেলে বহিরাগতদের সরাতে হয় (3 উপায়)

  • এই শেয়ার করুন
Hugh West
0 অনুসন্ধান. এই নিবন্ধে, আমরা আপনাকে দেখাব কিভাবে Excel-এ বহিরাগতদের সরাতে হয়

ওয়ার্কবুক ডাউনলোড করুন

আপনি বিনামূল্যে অনুশীলন এক্সেল ওয়ার্কবুক ডাউনলোড করতে পারেন এখানে।

Outliers.xlsx সরান

Excel এ Outliers কি?

একটি outlier এমন একটি মান যা একটি ডেটাসেটের গড় বা মাঝারি মান থেকে অনেক দূরে পড়ে যায়। অন্য কথায়, আউটলায়ার হল এমন মান যা ডেটাসেটের বাকি মানের থেকে উল্লেখযোগ্যভাবে বেশি বা কম।

একটি ক্রিকেট ম্যাচের কথা ভাবুন যেখানে সব ব্যাটসম্যান ৫০ এর কাছাকাছি রান করেছিল কিন্তু মাত্র একজন ব্যাটসম্যান সেঞ্চুরি করেছিলেন (100) ) এবং অন্য একজন ব্যাটসম্যান 0-এ আউট হন। এই ম্যাচে 100 এবং 0 স্কোরই আউটলায়ার।

আউটলাররা সমস্যাযুক্ত কারণ তারা ডেটা বিশ্লেষণের ফলাফলকে বিভ্রান্ত করতে পারে এবং বিভ্রান্তিকর ফলাফল ঘটাতে পারে। সুতরাং একটি মসৃণ ডেটাসেট পেতে আউটলিয়ারদের খুঁজে বের করা এবং তাদের অপসারণ করা ভাল।

Excel এ আউটলায়ারদের অপসারণের 3 উপায়

এই বিভাগে, আপনি শিখবেন কিভাবে আপনার ডেটাসেট থেকে 3টি ভিন্ন উপায়ে আউটলার মুছুন । বহিরাগতদের অপসারণ করা একটি জটিল প্রক্রিয়া, তাই পুরো নিবন্ধটি মনোযোগ সহকারে পড়ুন।

1. এক্সেল ফাংশন ব্যবহার করা ছাড়াই গড় গণনা করাOutliers

Excel TRIMMEAN ফাংশন outliers বাদ দিয়ে একটি প্রদত্ত ডেটাসেটের গড় গণনা করতে ব্যবহার করা যেতে পারে। বাদ দেওয়ার জন্য ডেটা পয়েন্টগুলি শতাংশ হিসাবে সরবরাহ করা হয়। শতাংশের মান দশমিক বিন্যাস বা শতাংশ বিন্যাস হিসাবে ইনপুট হতে পারে।

আউটলার ছাড়া গড় গণনা করার জন্য সিনট্যাক্স হল,

=TRIMMEAN(অ্যারে, শতাংশ)

এখানে,

  • অ্যারে = গড় ফলাফল ছাঁটাই এবং গণনা করার জন্য ডেটার পরিসর
  • শতাংশ = The বাদ দেওয়ার জন্য ডেটা পয়েন্টের সংখ্যা

আসুন দেখে নেওয়া যাক কীভাবে এই ফাংশনটি সরানো আউটলারের সাথে ফলাফল গণনা করতে হয়৷

উপরের চিত্রটি বিবেচনা করুন৷ আমাদের কাছে সেল B5 থেকে B14 পর্যন্ত ডেটা আছে। এখানে বেশিরভাগ সংখ্যা 20 থেকে 27 এর মধ্যে, কিন্তু দুটি মান - 0 এবং 100 - সেই মানগুলি থেকে অনেক দূরে। সুতরাং এগুলি হল আমাদের ডেটাসেটে আউটলিয়ার

আমাদের ডেটাসেটের জন্য, এক্সেল TRIMMEAN ফাংশন সহ আউটলিয়ার মান ছাড়া গড় (গড়) গণনা করার সূত্র হল,

=TRIMMEAN(B5:B14,0.2)

এখানে,

  • B5:B14 = গড় ফলাফল ছাঁটা এবং গণনা করার জন্য ডেটার পরিসর
  • 0.2 (বা 20%) = বাদ দেওয়ার জন্য ডেটা পয়েন্টের সংখ্যা

যদি ডেটাসেটের কোনো সংখ্যা বাকি ডেটাসেটের থেকে 20% দূরে পড়ে , তাহলে সেই সংখ্যাটিকে আউটলায়ার্স বলা হবে।

আপনি যদি আপনার ডেটাসেট অনুযায়ী সূত্রটি লিখে এন্টার চাপেন, তাহলে আপনি আউটলায়ার ছাড়াই গণনা করা গড় পাবেন। আপনার ডেটাসেটের জন্য। আমাদের ক্ষেত্রে, সেল E6 গণনা করা গড় ধারণ করে যা হল 23.50

উত্তরটি সঠিক কিনা তা পরীক্ষা করার জন্য, আমরা AVERAGE ফাংশন চালাই। সেলে E5 যা B5:B14 রেঞ্জের সমস্ত মানের গড় ( 28.80 ) প্রদান করে। এবং সেল E7 -এ, আমরা অন্য একটি AVERAGE ফাংশন ম্যানুয়ালি ইনপুট করে সমস্ত সেলগুলি চালাই যেগুলিতে আউটলায়ার্সের মান রয়েছে, এবং ফলাফল হিসাবে 23.50 রিটার্ন পেয়েছি।

সুতরাং আমরা বলতে পারি যে TRIMMEAN ফাংশন এক্সেলের গড় গণনা করার সময় একটি প্রদত্ত ডেটাসেট থেকে সফলভাবে আউটলায়ারগুলিকে সরিয়ে দিতে পারে৷

আরো পড়ুন: এক্সেলে কিভাবে সূত্র সাফ করবেন (7+ পদ্ধতি)

2. এক্সেলের ডেটাসেট এবং লাইন চার্ট থেকে আউটলায়ারগুলি সরান

নিম্নলিখিত ছবিটি লক্ষ্য করুন। আমাদের কাছে কিছু ডেটা আছে যার ভিত্তিতে আমরা একটি লাইন গ্রাফ তৈরি করেছি। লাইন গ্রাফ থেকে, আমরা সহজেই দেখতে পাচ্ছি যে ডেটা পয়েন্ট 4 এবং 8 এ আমাদের আউটলায়ার আছে

এখন আমরা দেখব কিভাবে আমরা মসৃণ করতে পারি ডেটাসেট থেকে বহির্মুখী মানগুলি সরিয়ে লাইন চার্ট বের করুন।

অন্য একটি ঘরে (আমাদের ক্ষেত্রে এটি সেল H6 ), নিম্নলিখিত সূত্রটি লিখুন,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

এখানে,

  • C6 = যে সেল ডেটাসেটে প্রথম ডেটা ধারণ করে
  • C5 = প্রথম ডেটা সেলের উপরের সেল
  • C7 = প্রথম ডেটা সেলের নীচের সেল
  • $E$6 = ডেটা পয়েন্টের মধ্যে পার্থক্য .

দেখছিআমাদের ডেটা, মনে হয় যে যখন একটি ডেটা পয়েন্ট অন্যদের থেকে 10 ইউনিট আলাদা হয়, তখন একটি আউটলিয়ার হিসাবে মনোনীত হয়। তাই আমরা সেল E6 10 রাখি এবং এটিকে একটি এবসোলুট সেল রেফারেন্স এ পরিণত করি যাতে পুরো ডেটাসেটের মাধ্যমে স্ক্যান এবং গণনা করার সময় এই সেলটি ঠিক করা হয়৷<3

এন্টার চাপার পরে, আপনি দেখতে পাবেন যে প্রথম ডেটা এখনও ফলাফলের ঘরে প্রদর্শিত হচ্ছে H6 । এখানে আপনাকে যা করতে হবে তা হল, শুধুমাত্র সূত্রটি তৈরি করা যাতে আমরা বাকি কক্ষগুলিতে সূত্রটি প্রয়োগ করতে ফিল হ্যান্ডেল টেনে আনতে পারি।

এখন ফিল হ্যান্ডেল দিয়ে সারিটি নীচে টেনে আনুন এবং আপনি দেখতে পাবেন যে ঘরগুলি আউটলায়ারগুলি ধরে রেখেছিল সেগুলি এখন #N/A দিয়ে পূর্ণ হয়েছে৷

এবং এখন লাইন চার্টটি দেখুন, এটি এখন একটি চ্যাপ্টা গ্রাফ এটিতে কোনও বহির্মুখী মান ছাড়াই৷

1 IF শর্ত।

=IF(AND(

আমরা বর্তমান ডেটা পয়েন্ট এবং উপরের সেল এবং নীচের সেলের তুলনা করতে যাচ্ছি) এবং যদি উভয় তুলনাই সত্য হয়, তবেই আমরা ফলাফল হিসাবে ডেটা পয়েন্ট দেখাব। সুতরাং, যেহেতু আমাদের "উভয়" তুলনার সাথে মোকাবিলা করতে হবে তাই আমাদের AND ফাংশন ব্যবহার করা উচিত।

=IF(AND(ABS(

যখন আমরা ডেটা পয়েন্ট বিয়োগ করি, তখন কিছু ডেটা নেতিবাচক মান ফেলে দিতে পারে৷ এবং আমরা করি) নানেতিবাচক মানগুলির সাথে মোকাবিলা করতে চান কারণ নেতিবাচক মানগুলি সর্বদা "পার্থক্য 10 হলে ডেটা অপসারণ" এর শর্তের বিরোধিতা করবে। তাই আমাদের সর্বদা ইতিবাচক ফলাফল আছে তা নিশ্চিত করার জন্য, আমাদের একটি পরম মান ফাংশন মধ্যে তুলনাগুলি মোড়ানো দরকার।

=IF(AND(ABS(C6-C5)> ;$E$6

এখানে আমরা আমাদের প্রথম তুলনা শুরু করেছি৷ আমরা উপরের মানের সাথে বর্তমান মানটি বিয়োগ করি এবং দেখুন ফলাফলটি সেল E6<2-এ সংরক্ষিত পার্থক্য স্তরের চেয়ে বেশি কিনা।> এবং সেলটিকে একটি পরম রেফারেন্স বানিয়েছে ঘরের মান লক রাখতে।

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

পরবর্তী, তুলনার দ্বিতীয় অংশ যা একটি কমা দ্বারা পৃথক করা হয়েছে। এটি বর্তমান ডেটা পয়েন্টের সাথে পরবর্তী ডেটা পয়েন্টের তুলনা করবে।

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

এখন আমরা রাখি একটি কমা এবং AND ফাংশন উভয়ই সত্য হলে সেখানে NA ফাংশন রাখতে নির্ধারণ করুন।

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

এবং যদি AND ফাংশনটি সত্য না হয় তাহলে আমরা প্রকৃত ডাটা পয়েন্টটিকে IF False মান হিসাবে ফেরত দিতে চাই। তাই আমরা টাইপ করি e একটি কমা দিয়ে এবং সেখানে সেল রেফারেন্স নম্বর C6 পাস করুন।

আরও পড়ুন: এক্সেলে ডেটা যাচাইকরণ কীভাবে সরানো যায় (5 উপায়)

একই রকম রিডিং

  • এক্সেল এ একটি হেডার কিভাবে সরাতে হয় (4 পদ্ধতি)
  • মধ্যে ডটেড লাইন সরানএক্সেল (৫টি দ্রুত উপায়)
  • এক্সেল থেকে কীভাবে গ্রিড সরাতে হয় (6 সহজ পদ্ধতি)
  • এক্সেলের বর্ডারগুলি সরান (4টি দ্রুত উপায়)
  • এক্সেলে সামঞ্জস্য মোড কিভাবে সরাতে হয় (2 সহজ উপায়)

3. এক্সেল-এ ম্যানুয়ালি আউটলায়ারদের সরান

এক্সেলে আউটলায়ারদের নির্মূল করার আরেকটি সহজ উপায় হল, শুধু আপনার ডেটাসেটের মানগুলি সাজান এবং এটি থেকে উপরের এবং নীচের মানগুলি ম্যানুয়ালি মুছে দিন৷

বাছাই করা ডেটা,

  • নির্বাচন ডেটাসেট৷
  • এ যান বাছাই করুন & সম্পাদনা গোষ্ঠীতে ফিল্টার করুন এবং সবচেয়ে ছোট থেকে সবচেয়ে বড় বাছাই করুন বা সবচেয়ে ছোট থেকে ছোট বাছাই করুন।

  • আমাদের ক্ষেত্রে, আমরা ছোট থেকে বড় সাজান নির্বাচন করেছি। এটি আমাদের ডেটাসেটের সংখ্যাগুলিকে ক্রমবর্ধমান ক্রমে সাজিয়েছে, সবচেয়ে ছোটগুলিকে উপরে এবং বৃহত্তমগুলিকে নীচে রেখে৷

এখন শুধুমাত্র সেই ডেটাগুলিকে ম্যানুয়ালি মুছে ফেলুন৷ ডেটাসেট আউটলাইং মানগুলিকে বিনামূল্যে করতে৷

একটি বড় ডেটাসেটের সাথে কাজ করার সময় আমরা এই প্রক্রিয়াটি অনুসরণ করার পরামর্শ দিই না৷ যখন আপনার ডেটাসেট ছোট হয় এবং সহজে দেখা যায়, তখনই আপনি এই পদ্ধতিটি প্রয়োগ করতে পারেন, অন্যথায় এটি বাস্তবায়ন করবেন না।

আরো পড়ুন: এক্সেলে কীভাবে সাজানো সরান ( 3 সহজ পদ্ধতি)

উপসংহার

এই নিবন্ধটি আপনাকে দেখিয়েছে কিভাবে এক্সেল-এ আউটলাইয়ারগুলি সরাতে হয় । আমি আশা করি এই নিবন্ধটি আপনার জন্য খুব উপকারী হয়েছে. সম্পর্কে কোন প্রশ্ন থাকলে নির্দ্বিধায় জিজ্ঞাসা করুনবিষয়।

Hugh West একজন অত্যন্ত অভিজ্ঞ এক্সেল প্রশিক্ষক এবং শিল্পে 10 বছরেরও বেশি অভিজ্ঞতা সহ বিশ্লেষক। তিনি অ্যাকাউন্টিং এবং ফিন্যান্সে স্নাতক ডিগ্রি এবং ব্যবসায় প্রশাসনে স্নাতকোত্তর ডিগ্রি অর্জন করেছেন। Hugh শিক্ষাদানের জন্য একটি আবেগ আছে এবং একটি অনন্য শিক্ষণ পদ্ধতি তৈরি করেছে যা অনুসরণ করা এবং বোঝা সহজ। এক্সেল সম্পর্কে তার বিশেষজ্ঞ জ্ঞান বিশ্বব্যাপী হাজার হাজার ছাত্র এবং পেশাদারদের তাদের দক্ষতা উন্নত করতে এবং তাদের কর্মজীবনে শ্রেষ্ঠত্ব অর্জন করতে সাহায্য করেছে। তার ব্লগের মাধ্যমে, Hugh তার জ্ঞান বিশ্বের সাথে ভাগ করে নেয়, বিনামূল্যে এক্সেল টিউটোরিয়াল এবং অনলাইন প্রশিক্ষণ প্রদান করে ব্যক্তি এবং ব্যবসায়িকদের তাদের পূর্ণ সম্ভাবনায় পৌঁছাতে সহায়তা করার জন্য।