কিভাবে এক্সেলে আউটলিয়ার গণনা করবেন (5টি সহজ উপায়)

  • এই শেয়ার করুন
Hugh West

একটি ডেটা সেট থেকে ডেটাতে পরিসংখ্যানগত গণনা করার জন্য বহিরাগতদের সনাক্ত করা প্রয়োজন হতে পারে। আপনি মাইক্রোসফ্ট এক্সেল ব্যবহার করে বিশাল ডেটাসেট থেকে বিভিন্ন উপায়ে আউটলায়ার আবিষ্কার করতে পারেন। এই পোস্টে, আমরা আপনাকে দেখাব কিভাবে মাইক্রোসফট এক্সেলে পাঁচটি স্বতন্ত্র উপায় ব্যবহার করে আউটলিয়ার গণনা করা যায়।

অনুশীলন ওয়ার্কবুক ডাউনলোড করুন

আপনি এখান থেকে বিনামূল্যে এক্সেল ওয়ার্কবুক ডাউনলোড করতে পারেন এবং নিজে অনুশীলন করতে পারেন। .

Find Outliers.xlsx

5 এক্সেলে আউটলায়ার্স গণনা করার সহজ উপায়

আউটলায়ার্স ডেটা মান যেগুলি ডেটাসেটের বাকি ডেটা মানগুলির থেকে উল্লেখযোগ্যভাবে আলাদা৷ Outliers, অন্য কথায়, অসাধারণ মান. একটি ডেটা সেটের অন্যান্য মানের তুলনায় সেগুলি হয় ব্যতিক্রমীভাবে উচ্চ অথবা অত্যধিক নিম্ন আউটলাইর খোঁজা পরিসংখ্যানগত গণনার ক্ষেত্রে গুরুত্বপূর্ণ কারণ তারা আমাদের ডেটা বিশ্লেষণের ফলাফলের উপর প্রভাব ফেলে।

উদাহরণস্বরূপ, আপনার কাছে একটি ডেটা সেট রয়েছে যা বারো জনের দৈনিক আয় দেখায়। এখন, আপনাকে মাইক্রোসফ্ট এক্সেল ব্যবহার করে আউটলিয়ার গণনা করতে হবে। এখানে, আমি আপনাকে এটি করার জন্য পাঁচটি সহজ পন্থা দেখাব৷

1. Sort & এক্সেলে আউটলার গণনা করতে ফিল্টার করুন

আপনি বাছাই & এক্সেলে কমান্ড ফিল্টার করুন। আপনি যদি সাজানোর এবং ফিল্টার ফাংশন ব্যবহার করে আউটলিয়ার গণনা করতে চান তবে আপনি এটি অনুসরণ করে এটি করতে পারেননিচের ধাপ।

ধাপ 1:

  • প্রথমে, আপনার এক্সেলের ডেটাসেটে যে কলাম হেডারটি আপনি সাজাতে চান সেটি নির্বাচন করুন। উদাহরণস্বরূপ, প্রদত্ত ডেটা সেটে, দৈনিক আয় নামের ফাইল কলামের শিরোনামে (সেল C40 নির্বাচিত হয়েছে)।

ধাপ 2:

  • তারপর, হোম <7 টিপুন> রিবনে ট্যাব করুন এবং এডিটিং গ্রুপে যান৷

ধাপ ৩:

  • এর পর, এডিটিং গ্রুপে ক্লিক করুন Sort & কমান্ড ফিল্টার করুন এবং কাস্টম সর্ট এ ক্লিক করুন।

পদক্ষেপ 4:

  • তারপর, Sort নামে একটি নতুন ডায়ালগ বক্স খুলবে। পপ-আপ ডায়ালগ বক্সে, বাছাই করুন <7 এ প্রতিদিন আয় নির্বাচন করুন> ড্রপ-ডাউন এবং অর্ডার ড্রপ-ডাউনে সবচেয়ে ছোট থেকে বড় । তারপরে, ঠিক আছে ক্লিক করুন।

ধাপ 5:

<13
  • অবশেষে, দৈনিক আয় কলামটি উল্লিখিত পদ্ধতিতে সাজানো হবে, শীর্ষে সর্বনিম্ন মান এবং নীচে সর্বশ্রেষ্ঠ মান। পদ্ধতিটি চালানোর পরে, আউটলিয়ার নির্ধারণ করতে ডেটা পরিসরে কোনো অনিয়ম দেখুন৷
  • উদাহরণস্বরূপ, কলামের প্রথম দুটি মান উল্লেখযোগ্যভাবে কম এবং কলামের শেষ দুটি মান ডেটা সেটের বাকি মানের তুলনায় যথেষ্ট বেশি, যেমনটি দেখানো হয়েছেউপরের ফলাফল।

    আরো পড়ুন: এক্সেলে রিগ্রেশন অ্যানালাইসিসে আউটলায়ারদের কীভাবে খুঁজে পাবেন (৩টি সহজ উপায়)

    2. এতে QUARTILE ফাংশন প্রয়োগ করুন এক্সেলে আউটলায়ার গণনা করুন

    চতুর্থ ফাংশন পদ্ধতি হল এক্সেলে আউটলায়ার গণনা করার একটি আরও বৈজ্ঞানিক উপায়। আপনি আপনার ডেটা সেটগুলিকে চারটি সমান অংশে ভাগ করতে এই ফাংশনটি ব্যবহার করতে পারেন। নিম্নলিখিত মানগুলি QUARTILE ফাংশন দ্বারা ফেরত দেওয়া হবে:

    • সর্বনিম্ন মান।
    • 1ম চতুর্থাংশ (Q1- একটি প্রদত্ত ডেটাসেটের সর্বনিম্ন 25%)।
    • The 2য় চতুর্থাংশ (Q2-পরবর্তী ডেটাসেটের সর্বনিম্ন 25%)।
    • 3য় চতুর্থাংশ (Q3- দ্বিতীয় সর্বোচ্চ 25% ডেটাসেট)।
    • <6 সর্বোচ্চ মান।

    এক্সেলের QUARTILE ফাংশন এর সিনট্যাক্স হল:

    =QUARTILE( array,quart)

    সিনট্যাক্সে নিম্নলিখিত আর্গুমেন্ট থাকে:

    • a রে : প্রদত্ত ঘরের পরিসর ডেটা সেট যার জন্য আপনি কোয়ার্টাইল মান গণনা করবেন৷
    • চতুর্থাংশ: এটি নির্দিষ্ট করে কোন মানটি ফেরত দিতে হবে৷

    <22

    QUARTILE ফাংশন ব্যবহার করে উপরের ডেটাসেটের আউটলায়ার গণনা করার জন্য, নিচের ধাপগুলি অনুসরণ করুন।

    ধাপ 1:

    • প্রথমে, 1ম চতুর্থাংশ ( প্রশ্ন 1 ) নির্ণয়ের জন্য নিচের সূত্রটি টাইপ করুন।
    =QUARTILE($C$5:$C$16,1)

    ধাপ 2:

    • এখানেআবার, 3য় চতুর্থাংশ ( Q3 ) গণনার সূত্রটি নীচে দেওয়া হয়েছে।
    =QUARTILE($C$5:$C$16,3)

    ধাপ 3:

    • তৃতীয়ত, আপনাকে IQR, নির্ধারণ করতে হবে যা আন্তঃ-চতুর্থাংশ পরিসর (এটি প্রথম এবং তৃতীয় চতুর্থাংশে পড়ে এমন ডেটা সেটের পরিসর থেকে প্রদত্ত ডেটার 50% প্রতিনিধিত্ব করে) Q1 বিয়োগ করে (সেলে G4 ) Q3 থেকে (সেলে G5 )। বিয়োগ গণনা করতে নিম্নলিখিত সূত্রটি টাইপ করুন।

      =G5-G4

    ধাপ 4:

    • IQR খোঁজার পরে, এর পরে আপনাকে উপরের এবং নির্ধারণ করতে হবে নিম্ন কারণ উর্ধ্ব এবং নিম্ন সীমার মধ্যে বেশিরভাগ ডেটা থাকবে ডেটা সেট। উপরের সীমা গণনা করতে নিম্নলিখিত সূত্রটি লিখুন।

      =G5+(1.5*G6)

    ধাপ 5:

    • তারপর, নিম্ন সীমা গণনা করতে, নিম্নলিখিত সূত্রটি লিখুন৷
    =G4-(1.5*G6)

    ধাপ 6:

    • অবশেষে, পূর্ববর্তী ধাপটি শেষ করার পরে, আপনি প্রতিটি ডেটার জন্য আউটলায়ার নির্ধারণ করতে পারেন মান এক্সেল ওয়ার্কশীটে, OR ফাংশন সেলে D5 দিয়ে নিম্নলিখিত সূত্রটি টাইপ করুন।
    =OR(C5$G$7)

    • এই সূত্রটি এমন ডেটা সনাক্ত করতে সাহায্য করবে যা উপরে উল্লিখিত পরিসরের সীমার মধ্যে পড়ে না। প্রক্রিয়াকরণের পরসূত্রটি একটি সত্য বিবৃতি দেখাবে যদি নির্দিষ্ট ডেটা একটি আউটলায়ার হয় এবং মিথ্যা যদি না হয়। অটোফিল সেলে অটোফিল টুলে C5 বাকি কক্ষে সূত্রটি কপি করতে ডাবল-ক্লিক করুন কলাম C -এ। এইভাবে, আপনি আপনার ডেটাসেটের সমস্ত আউটলারের পাশে একটি সত্য মান পর্যবেক্ষণ করতে পারেন।

    3. গড় এবং মানক বিচ্যুতি থেকে আউটলার গণনা করতে গড় এবং STDEV.P ফাংশনগুলিকে একত্রিত করুন

    A মানক বিচ্যুতি (বা σ ) সমগ্র ডেটা সেটের গড় মান সম্পর্কিত ডেটা কীভাবে বিতরণ করা হয় তা নির্ধারণ করার জন্য একটি মেট্রিক। যখন স্ট্যান্ডার্ড বিচ্যুতি কম থাকে তখন ডেটা গড় চারপাশে গোষ্ঠীবদ্ধ হয়, যখন স্ট্যান্ডার্ড বিচ্যুতি বেশি হয় তখন ডেটা আরও ছড়িয়ে পড়ে। মান এবং মানক বিচ্যুতি ব্যবহার করে আউটলিয়ার গণনা করতে আপনি নিম্নলিখিত ধাপগুলি অনুসরণ করতে পারেন৷

    ধাপ 1:

    • প্রথমে, এই নিবন্ধের শুরুতে দেখানো একই ডেটাসেট ব্যবহার করুন এবং তারপর গড় এবং মানক বিচ্যুতি গণনা করুন। গড় গণনা করতে, AVERAGE ফাংশন কক্ষে G5 দিয়ে নিম্নলিখিত সূত্রটি টাইপ করুন।
    =AVERAGE(C5:C16)

    ধাপ 2:

    • মানক বিচ্যুতি গণনা করতে, এসটিডিইভি সহ নিম্নলিখিত সূত্রটি সন্নিবেশ করান .P ফাংশন কক্ষে G6
    =STDEV.P(C5:C16)

    ধাপ 3:

    • এরপর, আপনি গণনা করবেনপ্রক্রিয়ায় আরও অগ্রগতির জন্য উচ্চ সীমা। সেলে G7 , নিম্নলিখিত সূত্রটি ব্যবহার করে নিম্ন সীমা গণনা করুন।
    =G5-(1.25*G6)

    পদক্ষেপ 4:

    • এবং কক্ষে G8 নিম্নলিখিত সূত্র থেকে উপরের সীমা গণনা করুন
    =G5+(1.5*G6)

    ধাপ 5: , কোনো বহিরাগত আছে কিনা তা গণনা করতে, D5 ঘরে নিম্নলিখিত সূত্রটি টাইপ করুন। =OR(C5$G$8)

    • সুতরাং, সূত্রটি একটি সত্য মান প্রদান করবে যদি কাঙ্খিত কক্ষের নির্দিষ্ট ডেটা একটি আউটলায়ার হয় এবং মিথ্যা।
    • ডাবল-ক্লিক করুন কক্ষে স্বয়ংক্রিয় পূরণ টুলে D5 <7 কলাম D -এর বাকি কক্ষগুলিতে সূত্রটি অনুলিপি করতে। এইভাবে, আপনি আপনার ডেটাসেটে বাকি সমস্ত আউটলায়ারগুলি খুঁজে পেতে পারেন৷

    আরও পড়ুন: এক্সেলে স্ট্যান্ডার্ড বিচ্যুতি সহ (দ্রুত পদক্ষেপের সাথে) কীভাবে আউটলায়ার্স খুঁজে পাবেন

    4. এক্সেলে আউটলিয়ার গণনা করতে Z-স্কোর সন্নিবেশ করান

    জেড-স্কোর হল সবচেয়ে বেশি ব্যবহৃত মেট্রিকগুলির মধ্যে একটি বহিরাগতদের চিহ্নিত করা। এই পদ্ধতিটি দেখায় যে একটি নির্দিষ্ট ডেটা একটি ডেটাসেটের গড় থেকে তার স্ট্যান্ডার্ড বিচ্যুতির ক্ষেত্রে কতটা দূরে। এক্সেলের জেড-স্কোর ব্যবহার করে আউটলায়ার গণনা করতে আপনি নীচে বর্ণিত ধাপগুলি দেখতে পারেন।

    ধাপ 1:

    • প্রথমে, পছন্দসই ডেটা সেট নিন।

    ধাপ2:

    • দ্বিতীয়ত, H5, সেলে মানে গণনা করার জন্য নিম্নলিখিত সূত্রটি টাইপ করুন 7>প্রদত্ত ডেটার জন্য৷
    =AVERAGE(C5:C16)

    পদক্ষেপ 3:

    • তৃতীয়ত, নিচের সূত্রটি ব্যবহার করে H6 কক্ষে প্রদত্ত ডেটাসেটের মান বিচ্যুতি গণনা করুন৷
    5> , আপনাকে প্রতিটি ডেটা মানের জন্য Z -স্কোর নির্ধারণ করতে হবে। এটি করার জন্য আপনি নীচের সূত্রটি ব্যবহার করুন৷ =(C5-$H$5)/$H$6

    পদক্ষেপ 5:

    • সমস্ত Z-মান গণনা করার পর, আপনি দেখতে পাবেন যে Z-মান হল -1.44 এবং 13 এর মধ্যে। সুতরাং, আমরা বাইরের সীমার জন্য Z-স্কোর -1.2-এর কম বা +1.8 -এর বেশি মান বিবেচনা করি।
    • তারপর, নিচের সূত্রটি সেলে টাইপ করুন E 5
    =OR((D51.8))

    <39

    • অবশেষে, সূত্রটি একটি সত্য মান প্রদান করবে যদি নির্দিষ্ট ডেটা একটি আউটলাইয়ার হয় এবং মিথ্যা <9 ফেরত দেয় অটোফিল ব্যবহার করতে
    • সেলে ডাবল ক্লিক করুন E5 টুল ফিল হ্যান্ডেলটি কলাম E -এর বাকি কক্ষগুলিতে সূত্রটি অনুলিপি করতে। এইভাবে, আপনি আপনার ডেটাসেটে বাকি সমস্ত আউটলায়ারগুলি খুঁজে পেতে পারেন৷

    আরও পড়ুন: এক্সেলে জেড স্কোর ব্যবহার করে কীভাবে আউটলায়ার্স খুঁজে পাবেন (দ্রুত সহ)ধাপ)

    5. Excel এ Outliers খুঁজে পেতে বড় এবং ছোট ফাংশন একত্রিত করুন

    LARGE ফাংশন এবং SMALL ফাংশন Excel এ বিপরীত অপারেশন আছে। আমরা একটি ডেটা সেটে যথাক্রমে সর্বশ্রেষ্ঠ এবং ক্ষুদ্রতম ডেটা বা মানগুলি খুঁজে পেতে এটি ব্যবহার করব। এই ফাংশনটি একটি ডেটা সেটের মধ্যে সমস্ত ডেটা টানবে, ক্ষুদ্রতম এবং বৃহত্তম সংখ্যাগুলি খুঁজে বের করবে। তারা দ্বিতীয় ক্ষুদ্রতম বা বৃহত্তম, তৃতীয় বৃহত্তম বা ক্ষুদ্রতম ইত্যাদি খুঁজে পেতে সক্ষম হয়।

    ধাপ 1:

    • প্রথমে, LARGE ফাংশন সহ E5 সেলে নিম্নলিখিত সূত্রটি ব্যবহার করুন।
    =LARGE($C$5:$C$16,1)

      • এভাবে, 12 মান থেকে, আপনি 1ম বৃহত্তম মান দেখতে পারেন যা হল <6 780

    ধাপ 2:

    <13
  • এর পর, G5 কক্ষে, ক্ষুদ্রতম মান খুঁজে পেতে নিম্নলিখিত সূত্রটি লিখুন।
  • =SMALL($C$5:$C$16,1)

    • অবশেষে, 12 মান থেকে, আপনি 1ম দেখতে পারেন সবচেয়ে ছোট মান 110
    • একবার আপনি সমস্ত প্রয়োজনীয় মান খুঁজে বের করার পরে, আপনি সহজেই ডেটাসেটে যেকোন আউটলায়ারকে নির্দেশ করতে পারেন।

    উপসংহার

    এটি এই নিবন্ধের শেষ। আমি আশা করি আপনি এই নিবন্ধটি সহায়ক হবে. এই নিবন্ধটি পড়ার পরে, আপনি যে কোনও পদ্ধতি ব্যবহার করে এক্সেলের আউটলিয়ার গণনা করতে সক্ষম হবেন। এর সাথে আরও কোন প্রশ্ন বা সুপারিশ শেয়ার করুননীচের মন্তব্য বিভাগে আমাদের.

    Hugh West একজন অত্যন্ত অভিজ্ঞ এক্সেল প্রশিক্ষক এবং শিল্পে 10 বছরেরও বেশি অভিজ্ঞতা সহ বিশ্লেষক। তিনি অ্যাকাউন্টিং এবং ফিন্যান্সে স্নাতক ডিগ্রি এবং ব্যবসায় প্রশাসনে স্নাতকোত্তর ডিগ্রি অর্জন করেছেন। Hugh শিক্ষাদানের জন্য একটি আবেগ আছে এবং একটি অনন্য শিক্ষণ পদ্ধতি তৈরি করেছে যা অনুসরণ করা এবং বোঝা সহজ। এক্সেল সম্পর্কে তার বিশেষজ্ঞ জ্ঞান বিশ্বব্যাপী হাজার হাজার ছাত্র এবং পেশাদারদের তাদের দক্ষতা উন্নত করতে এবং তাদের কর্মজীবনে শ্রেষ্ঠত্ব অর্জন করতে সাহায্য করেছে। তার ব্লগের মাধ্যমে, Hugh তার জ্ঞান বিশ্বের সাথে ভাগ করে নেয়, বিনামূল্যে এক্সেল টিউটোরিয়াল এবং অনলাইন প্রশিক্ষণ প্রদান করে ব্যক্তি এবং ব্যবসায়িকদের তাদের পূর্ণ সম্ভাবনায় পৌঁছাতে সহায়তা করার জন্য।