မာတိကာ
ဒေတာအစုံလိုက်မှ ဒေတာများကို ကိန်းဂဏန်းတွက်ချက်မှုများပြုလုပ်ရန်အတွက် Outliers များကို ဖော်ထုတ်ရန် လိုအပ်ပါသည်။ Microsoft Excel ကို အသုံးပြု၍ များပြားလှသော ဒေတာအတွဲများမှ အစွန်းထွက်များကို နည်းလမ်းများစွာဖြင့် ရှာဖွေနိုင်သည်။ ဤပို့စ်တွင်၊ မတူညီသောနည်းလမ်းငါးမျိုးဖြင့် Microsoft Excel တွင် outliers တွက်ချက်နည်းကို သင်ပြပါမည်။
Practice Workbook ကိုဒေါင်းလုဒ်လုပ်ပါ
သင်သည် ဤနေရာမှ အခမဲ့ Excel workbook ကိုဒေါင်းလုဒ်လုပ်ပြီး သင်ကိုယ်တိုင် လေ့ကျင့်နိုင်ပါသည်။ .
Outliers.xlsx
Excel တွင် Outliers များကို တွက်ချက်ရန် အသုံးဝင်သော နည်းလမ်း 5 ခု
Outliers များသည် ဒေတာတန်ဖိုးများ ၎င်းသည် ဒေတာအတွဲရှိ အခြားဒေတာတန်ဖိုးများနှင့် သိသိသာသာကွာခြားပါသည်။ တစ်နည်းဆိုရသော် Outliers များသည် ထူးခြားသောတန်ဖိုးများဖြစ်သည်။ ၎င်းတို့သည် ဒေတာအတွဲတစ်ခုရှိ အခြားတန်ဖိုးများနှင့် နှိုင်းယှဉ်ပါက ၎င်းတို့သည် ထူးထူးခြားခြား မြင့် သို့မဟုတ် အလွန်အမင်း နိမ့် ဖြစ်သည်။ ကျွန်ုပ်တို့၏ဒေတာခွဲခြမ်းစိတ်ဖြာမှုတွေ့ရှိချက်များအပေါ် သက်ရောက်မှုရှိသောကြောင့် ၎င်းတို့သည် ကိန်းဂဏန်းအစွန်းထွက်များကိုရှာဖွေခြင်း သည် အရေးကြီးပါသည်။
ဥပမာ၊ လူဆယ့်နှစ်ယောက်၏နေ့စဉ်ဝင်ငွေကိုပြသသည့် ဒေတာအတွဲတစ်ခု သင့်တွင်ရှိသည်။ ယခု၊ သင်သည် Microsoft Excel ကို အသုံးပြု၍ အစွန်းထွက်များကို တွက်ချက်ရန် လိုအပ်ပါသည်။ ဤတွင်၊ ထိုသို့ပြုလုပ်ရန် လွယ်ကူသောနည်းလမ်းငါးခုကို သင့်အားပြသပါမည်။
1. Sort & ကိုသုံးပါ။ Excel တွင် Outliers များကို တွက်ချက်ရန် စစ်ထုတ်ခြင်း
Sort & ကိုအသုံးပြု၍ သတ်မှတ်ထားသော သေးငယ်သောဒေတာမှ အစွန်းများကို တွက်ချက်နိုင်သည်။ Excel တွင် အမိန့်ကို စစ်ထုတ်ပါ။ အမျိုးအစားခွဲခြင်းနှင့် စစ်ထုတ်ခြင်းလုပ်ဆောင်ချက်ကို အသုံးပြု၍ အစွန်းများကို တွက်ချက်လိုပါက၊ အောက်ပါတို့ကို လိုက်နာခြင်းဖြင့် ၎င်းကို လုပ်ဆောင်နိုင်သည်။အောက်ပါအဆင့်များ။
အဆင့် 1-
- ပထမဦးစွာ၊ သင်အမျိုးအစားခွဲလိုသော excel ဒေတာအတွဲရှိ ကော်လံခေါင်းစီးကို ရွေးပါ။ ဥပမာအားဖြင့်၊ ပေးထားသောဒေတာအစုံတွင်၊ နေ့စဉ်ဝင်ငွေ (ဆဲလ် C40 အမည်ရှိသော ဖိုင်ကော်လံခေါင်းစီးတွင်)။<15
အဆင့် 2-
- ထို့နောက် Home <7 ကိုနှိပ်ပါ။ ဖဲကြိုးပေါ်ရှိ တက်ဘ်နှင့် တည်းဖြတ်ခြင်း အဖွဲ့သို့ သွားပါ။
အဆင့် 3:
- ထို့နောက်၊ တည်းဖြတ်ခြင်းအဖွဲ့ တွင် စီရန် & Filter command ကိုနှိပ်ပြီး Custom Sort ။
အဆင့် 4-
- ထို့နောက်၊ စီရန် ဟု အမည်ပေးထားသည့် ဒိုင်ယာလော့ဂ်ဘောက်စ်အသစ်တစ်ခု ပွင့်လာပါမည်။ ပေါ်လာသည့် ဒိုင်ယာလော့ခ်ဘောက်စ်တွင်၊ နေ့စဉ် ဝင်ငွေ ကို စီရန် <7 ကို ရွေးပါ> drop-down နှင့် အသေးငယ်ဆုံးမှ အကြီးဆုံး အမှာစာ drop-down တွင်။ ထို့နောက် OK ကိုနှိပ်ပါ။
အဆင့် 5-
- နောက်ဆုံးတွင်၊ နေ့စဉ် ၀င်ငွေ ကော်လံကို အပေါ်မှ အနိမ့်ဆုံးတန်ဖိုးများနှင့် အောက်ခြေတွင် အကြီးဆုံးတန်ဖိုးများဖြင့် ဖော်ပြထားသည့်ပုံစံအတိုင်း စီစစ်မည်ဖြစ်သည်။ လုပ်ထုံးလုပ်နည်းကို လုပ်ဆောင်ပြီးနောက်၊ outliers ကိုဆုံးဖြတ်ရန် ဒေတာအပိုင်းအခြားရှိ မမှန်မှုများကို ရှာဖွေပါ။
ဥပမာ၊ ကော်လံရှိ ပထမတန်ဖိုးနှစ်ခုသည် သိသိသာသာနိမ့်သွားပြီး၊ ကော်လံရှိ နောက်ဆုံးတန်ဖိုးနှစ်ခုသည် ဒေတာအတွဲတွင်ပြထားသည့်အတိုင်း ကျန်တန်ဖိုးများထက် သိသိသာသာမြင့်မားပါသည်။အထက်ဖော်ပြပါရလဒ်။
နောက်ထပ်ဖတ်ရန်- Excel တွင် Regression Analysis တွင် Outliers ကိုရှာဖွေနည်း (လွယ်ကူသောနည်းလမ်း 3 ခု)
2. QUARTILE Function ကိုသုံးပါ Excel တွင် Outliers တွက်ချက်ခြင်း
QUARTILE function ချဉ်းကပ်မှုသည် Excel တွင် outliers များကိုတွက်ချက်ရန် ပိုမိုသိပ္ပံနည်းကျနည်းလမ်းတစ်ခုဖြစ်သည်။ သင်၏ဒေတာအတွဲများကို အညီအမျှ အပိုင်းလေးပိုင်းခွဲရန် ဤလုပ်ဆောင်ချက်ကို အသုံးပြုနိုင်သည်။ အောက်ပါတန်ဖိုးများကို QUARTILE လုပ်ဆောင်ချက် ဖြင့် ပြန်ပေးလိမ့်မည်-
- The အနည်းဆုံး တန်ဖိုး။
- The 1st quartile (Q1- ပေးထားသော dataset တစ်ခု၏ အနိမ့်ဆုံး 25%))
- The 2nd quartile (Q2-နောက်တစ်ခု ဒေတာအတွဲ၏ အနိမ့်ဆုံး 25%))။
- တတိယ quartile (Q3- ဒုတိယအမြင့်ဆုံး 25% dataset)။
- The အမြင့်ဆုံး တန်ဖိုး။
Excel တွင် QUARTILE လုပ်ဆောင်ချက် ၏ syntax မှာ-
=QUARTILE( array၊quart)
syntax တွင် အောက်ပါ အကြောင်းပြချက်များ ပါဝင်သည်-
- a rray - ပေးထားသော ဆဲလ်အကွာအဝေး quartile တန်ဖိုးကို သင်တွက်ချက်မည့် ဒေတာအတွဲ။
- quart- ၎င်းက မည်သည့်တန်ဖိုးကို ပြန်ပေးသင့်သည်ကို သတ်မှတ်ပေးပါသည်။
<22
QUARTILE လုပ်ဆောင်ချက်ကို အသုံးပြု၍ အထက်ဖော်ပြပါ ဒေတာအတွဲအတွက် အစွန်းထွက်များကို တွက်ချက်ရန်အတွက်၊ အောက်ဖော်ပြပါ အဆင့်များကို လိုက်နာပါ။
အဆင့် 1-
- ပထမဦးစွာ၊ 1st quartile ( Q1 ) ကို ဆုံးဖြတ်ရန်အတွက် အောက်ပါဖော်မြူလာကို ရိုက်ထည့်ပါ။
=QUARTILE($C$5:$C$16,1)
အဆင့် 2-
- ဤနေရာတွင်တစ်ဖန်၊ 3rd quartile ( Q3 ) ကို တွက်ချက်ရန် ဖော်မြူလာကို အောက်တွင်ပေးထားပါသည်။
=QUARTILE($C$5:$C$16,3)
အဆင့် 3-
- တတိယ၊ သင်သည် IQR ကိုဆုံးဖြတ်ရန် လိုအပ်သည်၊ ဖြစ်သည့် Quartile Range (၎င်းသည် ပထမနှင့်တတိယ quartiles သို့ကျသော ဒေတာအစုအဝေးမှ ပေးထားသောဒေတာ၏ 50% ကိုကိုယ်စားပြုသည်) Q1 ကိုနုတ်ခြင်းဖြင့်၊ Q3 (ဆဲလ် G5 ) မှ (ဆဲလ် G4 )။ နုတ်ခြင်းကို တွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ရိုက်ထည့်ပါ။
=G5-G4
အဆင့် 4-
- IQR ကိုရှာဖွေပြီးနောက်၊ နောက်တစ်ခုအနေဖြင့် အပေါ်ပိုင်း နှင့် ဆုံးဖြတ်ရမည်ဖြစ်ပါသည်။ အောက် အထက် နှင့် အောက် ကန့်သတ်ချက်တွင် ဒေတာအများစုပါဝင်နေသောကြောင့်၊ ဒေတာအစုံ။ အထက်ကန့်သတ်ချက်ကိုတွက်ချက်ရန် အောက်ပါဖော်မြူလာကို ချရေးပါ။
=G5+(1.5*G6)
အဆင့် 5-
- ထို့နောက် အောက်ကန့်သတ်ချက်ကို တွက်ချက်ရန် အောက်ပါပုံသေနည်းကို ချရေးပါ။
=G4-(1.5*G6)
အဆင့် 6-
- နောက်ဆုံးတွင်၊ ယခင်အဆင့်ကို ပြီးပါက၊ ဒေတာတစ်ခုစီအတွက် အစွန်းများကို သင်ဆုံးဖြတ်နိုင်သည် တန်ဖိုး။ Excel အလုပ်စာရွက်တွင်၊ ဆဲလ်အတွင်း OR လုပ်ဆောင်ချက် ဖြင့် အောက်ပါဖော်မြူလာကို ရိုက်ထည့်ပါ။ D5 ။
=OR(C5$G$7)
- ဤဖော်မြူလာသည် အထက်ဖော်ပြပါ အကွာအဝေး ကန့်သတ်ချက်အတွင်း မကျရောက်သည့် ဒေတာကို ဖော်ထုတ်ရန် ကူညီပေးပါမည်။ လုပ်ဆောင်ပြီးနောက်တိကျသောဒေတာသည် အကြမ်းဖျင်းဖြစ်ပြီး FALSE မဟုတ်ပါက TRUE ထုတ်ပြန်ချက် ကို ပြပါမည်။ နှစ်ချက်နှိပ်ပါ ဆဲလ်အတွင်းရှိ အလိုအလျောက်ဖြည့် ကိရိယာ C5 ဖော်မြူလာကို ကျန်ဆဲလ်များသို့ ကူးယူရန် ကော်လံ C တွင်။ ထို့ကြောင့်၊ သင့်ဒေတာအတွဲရှိ အစွန်းထွက်အားလုံးဘေးရှိ စစ်မှန်သောတန်ဖိုးကို သင်ကြည့်ရှုနိုင်သည်။
3. ပျမ်းမျှနှင့် STDEV.P Functions များကို ပျမ်းမျှနှင့် Standard Deviation မှ Outliation တွက်ချက်ရန် AVERAGE နှင့် STDEV.P ပေါင်းစပ်ခြင်း
A စံသွေဖည် (သို့မဟုတ် σ ) သည် ဒေတာအစုတစ်ခုလုံး၏ ပျမ်းမျှတန်ဖိုးနှင့်ပတ်သက်၍ ဒေတာဖြန့်ဝေပုံကို ဆုံးဖြတ်ရန်အတွက် မက်ထရစ်တစ်ခုဖြစ်သည်။ စံသွေဖည်မှု နည်းနေချိန်တွင် ဒေတာကို စံသွေဖည်မှု မြင့်မားနေချိန်တွင် ဒေတာပိုမိုပျံ့နှံ့သွားချိန်တွင် ဒေတာကို ပျမ်းမျှအားဖြင့် အုပ်စုဖွဲ့ထားသည်။ Mean နှင့် Standard Deviation ကိုအသုံးပြု၍ အစွန်းများကို တွက်ချက်ရန် အောက်ပါအဆင့်များကို လိုက်နာနိုင်ပါသည်။
အဆင့် 1-
- ပထမဦးစွာ၊ ဤဆောင်းပါး၏အစတွင် ပြသထားသည့် တူညီသောဒေတာအတွဲကို အသုံးပြုပြီး ပျမ်းမျှနှင့် စံသွေဖည်မှုကို တွက်ချက်ပါ။ ပျမ်းမျှတွက်ချက်ရန်၊ ဆဲလ်အတွင်း AVERAGE function ဖြင့် အောက်ပါဖော်မြူလာကို ရိုက်ထည့်ပါ။ G5 ။
=AVERAGE(C5:C16)
အဆင့် 2-
- စံသွေဖည်မှုကို တွက်ချက်ရန်၊ အောက်ပါဖော်မြူလာကို STDEV ဖြင့် ထည့်ပါ ဆဲလ်ရှိ .P လုပ်ဆောင်ချက် G6 ။
=STDEV.P(C5:C16)
အဆင့် 3-
- နောက်တစ်ခု၊ သင်တွက်ချက်ရလိမ့်မည်လုပ်ငန်းစဉ်တွင် ပိုမိုတိုးတက်မှုအတွက် ကန့်သတ်ချက်အထက်။ ဆဲလ် G7 တွင်၊ အောက်ပါဖော်မြူလာကို အသုံးပြု၍ အောက်ခြေကန့်သတ်ချက်ကို တွက်ချက်ပါ။
=G5-(1.25*G6)
အဆင့် 4-
- ပြီးလျှင် ဆဲလ် G8 အောက်ပါဖော်မြူလာမှ အပေါ်ဆုံးကန့်သတ်ချက်ကို တွက်ချက်ပါ
=G5+(1.5*G6)
အဆင့် 5-
- ထို့နောက် အစွန်းအထင်းများ ရှိ၊ မရှိ တွက်ချက်ရန်၊ အောက်ပါ ဖော်မြူလာကို ဆဲလ် D5 ရိုက်ထည့်ပါ။
=OR(C5$G$8)
- ထို့ကြောင့် ဖော်မြူလာသည် TRUE တန်ဖိုးကို လိုချင်သောဆဲလ်ရှိ သီးခြားဒေတာသည် သာလွန်ပြီး ဖြစ်ပါက၊ FALSE။
- ဆဲလ်ရှိ AutoFill တူးလ်တွင် နှစ်ချက်နှိပ်ပါ D5 <7 ကော်လံ D ရှိ ကျန်ဆဲလ်များသို့ ဖော်မြူလာကို ကူးယူရန်။ ထို့ကြောင့်၊ သင့်ဒေတာအတွဲတွင် ကျန်ရှိသော အစွန်းအထင်းများအားလုံးကို သင်ရှာဖွေနိုင်ပါသည်။
နောက်ထပ်ဖတ်ရန်- Excel တွင် Standard Deviation ဖြင့် Outlier ကိုမည်သို့ရှာဖွေနည်း (အမြန်အဆင့်များဖြင့်)
4. Excel တွင် Outliers များကို တွက်ချက်ရန် Z-Score ကိုထည့်ပါ
The Z-score သည် အသုံးအများဆုံး မက်ထရစ်များထဲမှ တစ်ခုဖြစ်သည်။ outliers ခွဲခြားသတ်မှတ်ခြင်း။ ဤနည်းလမ်းသည် ဒေတာအတွဲတစ်ခု၏ စံနှုန်းသွေဖည်ခြင်းနှင့်စပ်လျဉ်း၍ သီးခြားဒေတာမည်မျှကွာသည်ကို ပြသသည်။ Excel တွင် Z-score ကို အသုံးပြု၍ outliers များကို တွက်ချက်ရန် အောက်တွင်ဖော်ပြထားသော အဆင့်များကို သင်တွေ့မြင်နိုင်ပါသည်။
အဆင့် 1-
- ပထမဦးစွာ၊ အလိုရှိသောဒေတာအစုံကို ယူပါ။
အဆင့်2-
- ဒုတိယ၊ ဆဲလ် H5 တွင်၊ အောက်ပါဖော်မြူလာကို ရိုက်ထည့်ပါ ပျမ်းမျှ ပေးထားသောဒေတာအတွက်။
=AVERAGE(C5:C16)
အဆင့် 3:
- တတိယအနေဖြင့်၊ အောက်ပါဖော်မြူလာကို အသုံးပြု၍ ဆဲလ်အတွင်းပေးထားသောဒေတာအတွဲ၏ စံသွေဖည် ကို တွက်ချက်ပါ။
=STDEV.P(C5:C16)
အဆင့် 4-
- ထို့နောက် ဒေတာတန်ဖိုးတစ်ခုစီအတွက် Z -score ကို သင်ဆုံးဖြတ်ရပါမည်။ ထိုသို့လုပ်ဆောင်ရန် အောက်တွင်ပေးထားသော ဖော်မြူလာကို အသုံးပြုပါ။
=(C5-$H$5)/$H$6
အဆင့် 5:
- Z-တန်ဖိုးများအားလုံးကို တွက်ချက်ပြီးနောက်၊ Z-တန်ဖိုးများ ၏ အကွာအဝေးကို သင်တွေ့လိမ့်မည်> သည် -1.44 နှင့် 13 ကြားဖြစ်သည်။ ထို့ကြောင့်၊ ကျွန်ုပ်တို့သည် Z-score ထက်နည်းသော တန်ဖိုးများကို -1.2 သို့မဟုတ် +1.8 ထက် သာလွန်သောကန့်သတ်ချက်များအတွက် စဉ်းစားပါသည်။
- ထို့နောက်၊ အောက်ပါဖော်မြူလာကို ဆဲလ် E 5 တွင် ရိုက်ထည့်ပါ။
=OR((D51.8))
- နောက်ဆုံးတွင်၊ ဖော်မြူလာသည် TRUE တန်ဖိုးကို ပြန်ပေးမည်ဆိုပါက တိကျသောဒေတာသည် သာလွန်ပြီး FALSE <9 သို့ ပြန်သွားလိမ့်မည်
- ဆဲလ် E5 AutoFill ကို အသုံးပြုရန် နှစ်ချက်နှိပ်ပါ ကော်လံ E ရှိ ကျန်ဆဲလ်များသို့ ဖော်မြူလာကို ကူးယူရန် ကိရိယာဖြည့်လက်ကိုင်။ ထို့ကြောင့်၊ သင့်ဒေတာအတွဲတွင် ကျန်ရှိသော အစွန်းအထင်းများအားလုံးကို သင်ရှာတွေ့နိုင်ပါသည်။
နောက်ထပ်ဖတ်ရန်- Z ရမှတ်ကို Excel တွင် အသုံးပြု၍ Outliers များကို မည်သို့ရှာရမည်နည်း (အမြန်ဖြင့်အဆင့်များ)
5. Excel တွင် Outliers များကိုရှာဖွေရန် ကြီးမားသောနှင့် သေးငယ်သောလုပ်ဆောင်ချက်များကို ပေါင်းစည်းပါ
Excel ရှိ ကြီးမားသောလုပ်ဆောင်ချက် နှင့် သေးငယ်သောလုပ်ဆောင်ချက် ဆန့်ကျင်ဘက်လုပ်ဆောင်မှုများရှိသည်။ ဒေတာအတွဲတစ်ခုတွင် အကြီးဆုံးနှင့်အသေးဆုံးဒေတာ သို့မဟုတ် တန်ဖိုးများကို ရှာဖွေရန် ၎င်းကို ကျွန်ုပ်တို့အသုံးပြုပါမည်။ ဤလုပ်ဆောင်ချက်သည် ဒေတာအစုတစ်ခုအတွင်း ဒေတာအားလုံးကို ဆွဲထုတ်မည်ဖြစ်ပြီး အသေးငယ်ဆုံးနှင့် အကြီးဆုံးနံပါတ်များကို ရှာဖွေမည်ဖြစ်သည်။ ၎င်းတို့သည် ဒုတိယအငယ်ဆုံး သို့မဟုတ် အကြီးဆုံး၊ တတိယအကြီးဆုံး သို့မဟုတ် အငယ်ဆုံး အစရှိသည်တို့ကို ရှာဖွေနိုင်သည်။
အဆင့် 1:
- ပထမဦးစွာ၊ ဆဲလ် E5 တွင် အောက်ပါဖော်မြူလာကို ကြီးမားသောလုပ်ဆောင်ချက် ဖြင့်အသုံးပြုပါ။
=LARGE($C$5:$C$16,1)
-
- ထို့ကြောင့် 12 တန်ဖိုးများမှ၊ သင်သည် <6 ဖြစ်သည့် ပထမအကြီးဆုံးတန်ဖိုးကို သင်တွေ့မြင်နိုင်ပါသည်။ 780 ။
အဆင့် 2-
- ထို့နောက်၊ ဆဲလ် G5 တွင် အသေးငယ်ဆုံးတန်ဖိုးကိုရှာဖွေရန် အောက်ပါဖော်မြူလာကို ချရေးပါ။
=SMALL($C$5:$C$16,1)
- နောက်ဆုံးတွင် 12 တန်ဖိုးများမှ 1st ကို သင်မြင်နိုင်သည် အငယ်ဆုံးတန်ဖိုး 110 ။
- လိုအပ်သောတန်ဖိုးများအားလုံးကို သိရှိပြီးသည်နှင့် ဒေတာအတွဲအတွင်းရှိ အစွန်းအထင်းများကို အလွယ်တကူညွှန်ပြနိုင်မည်ဖြစ်သည်။
နိဂုံး
ဒါက ဒီဆောင်းပါးရဲ့အဆုံးပါ။ ဒီဆောင်းပါးက အသုံးဝင်မယ်လို့ မျှော်လင့်ပါတယ်။ ဤဆောင်းပါးကိုဖတ်ပြီးနောက်၊ သင်သည်မည်သည့်နည်းလမ်းကိုမဆိုအသုံးပြု၍ Excel တွင်အထွက်များကိုတွက်ချက်နိုင်လိမ့်မည်။ နောက်ထပ်မေးခွန်းများ သို့မဟုတ် အကြံပြုချက်များကို မျှဝေပါ။အောက်ဖော်ပြပါ မှတ်ချက်ကဏ္ဍတွင် ကျွန်ုပ်တို့။