តារាងមាតិកា
ការស្វែងរក outliers និងការដកពួកវាចេញគឺជាកិច្ចការសាមញ្ញបំផុតក្នុងការវិភាគទិន្នន័យនៅក្នុងស្ថិតិ ការជីកយករ៉ែទិន្នន័យ ការរៀនម៉ាស៊ីនជាដើម។ មានវិធីជាច្រើនដែលអ្នកអាចស្វែងរក outliers នៅក្នុងសំណុំទិន្នន័យរបស់អ្នក ប៉ុន្តែដំណើរការដើម្បីយកពួកវាចេញគឺមិនងាយស្រួលទេក្នុងការ ស្វែងរក។ នៅក្នុងអត្ថបទនេះ យើងនឹងបង្ហាញអ្នកពីរបៀប លុប outliers នៅក្នុង Excel ។
ទាញយកសៀវភៅការងារ
អ្នកអាចទាញយកសៀវភៅលំហាត់ Excel ដោយឥតគិតថ្លៃពី នៅទីនេះ។
លុប Outliers.xlsx
តើអ្វីជា Outliers នៅក្នុង Excel?
មួយ ខាងក្រៅ គឺជាតម្លៃដែលធ្លាក់ចេញពីតម្លៃមធ្យម ឬមធ្យមនៃសំណុំទិន្នន័យ។ ម្យ៉ាងវិញទៀត Outliers គឺជាតម្លៃដែលខ្ពស់ជាង ឬទាបជាងតម្លៃដែលនៅសល់ក្នុងសំណុំទិន្នន័យ។
សូមគិតអំពីការប្រកួតកីឡា cricket ដែលកីឡាករវាយកូនបាល់ទាំងអស់ស៊ុតបញ្ចូលទីបានប្រហែល 50 ប៉ុន្តែមានតែអ្នកប្រយុទ្ធម្នាក់ប៉ុណ្ណោះដែលរកបានមួយសតវត្ស (100 ) ហើយអ្នកប្រដាល់ម្នាក់ទៀតបានចេញនៅត្រឹម 0។ ពិន្ទុ 100 និង 0 នោះគឺជាពិន្ទុលើសនៅក្នុងការប្រកួតនេះ។
ក្រុម Outliers មានបញ្ហាដោយសារពួកគេអាចបំភាន់លទ្ធផលនៃការវិភាគទិន្នន័យ និងបង្កើតលទ្ធផលមិនពិត។ ដូច្នេះវាជាការប្រសើរក្នុងការស្វែងរក outliers ហើយយកវាចេញដើម្បីឱ្យមានសំណុំទិន្នន័យរលូន។
វិធី 3 យ៉ាងដើម្បីលុប Outliers នៅក្នុង Excel
នៅក្នុងផ្នែកនេះ អ្នកនឹងរៀនពីរបៀប លុប outliers ពីសំណុំទិន្នន័យរបស់អ្នកតាម 3 វិធីផ្សេងគ្នា។ ការដកផ្នែកខាងក្រៅចេញគឺជាដំណើរការដ៏លំបាកមួយ ដូច្នេះសូមអានអត្ថបទទាំងមូលដោយប្រុងប្រយ័ត្ន។
1. ការប្រើប្រាស់មុខងារ Excel ដើម្បីគណនាមធ្យមដោយគ្មានOutliers
Excel អនុគមន៍ TRIMMEAN អាចត្រូវបានប្រើដើម្បីគណនាមធ្យមភាគនៃសំណុំទិន្នន័យដែលបានផ្តល់ឲ្យ ខណៈពេលដែលមិនរាប់បញ្ចូលការលើស។ ចំណុចទិន្នន័យដែលត្រូវដកចេញត្រូវបានផ្គត់ផ្គង់ជាភាគរយ។ តម្លៃភាគរយអាចត្រូវបានបញ្ចូលជាទម្រង់ទសភាគ ឬទម្រង់ភាគរយ។
វាក្យសម្ព័ន្ធដើម្បីគណនាមធ្យមដោយគ្មានធាតុចេញគឺ
=TRIMMEAN(អារេ ភាគរយ)នៅទីនេះ
- អារេ = ជួរទិន្នន័យដែលត្រូវកាត់ និងគណនាលទ្ធផលជាមធ្យម
- ភាគរយ = នេះ ចំនួននៃចំណុចទិន្នន័យដែលត្រូវដកចេញ
តោះមើលពីរបៀបអនុវត្តមុខងារនេះ ដើម្បីគណនាលទ្ធផលជាមួយនឹងផ្នែកខាងក្រៅដែលបានដកចេញ។
ពិចារណារូបភាពខាងលើ។ យើងមានទិន្នន័យពី Cell B5 ដល់ B14 ។ នៅទីនេះភាគច្រើននៃលេខគឺស្ថិតនៅចន្លោះពី 20 ទៅ 27 ប៉ុន្តែតម្លៃពីរ – 0 និង 100 – គឺជាវិធីឆ្ងាយពីតម្លៃទាំងនោះ។ ដូច្នេះទាំងនេះគឺជា outliers នៅក្នុងសំណុំទិន្នន័យរបស់យើង។
សម្រាប់សំណុំទិន្នន័យរបស់យើង រូបមន្តគណនាមធ្យម (មធ្យម) ដោយគ្មានតម្លៃខាងក្រៅជាមួយនឹងមុខងារ Excel TRIMMEAN គឺ
=TRIMMEAN(B5:B14,0.2)
នៅទីនេះ
- B5:B14 = ជួរទិន្នន័យដែលត្រូវកាត់ និងគណនាលទ្ធផលជាមធ្យម
- 0.2 (ឬ 20%) = ចំនួននៃចំណុចទិន្នន័យដែលត្រូវដកចេញ
ប្រសិនបើចំនួនណាមួយនៅក្នុងសំណុំទិន្នន័យធ្លាក់ចុះ 20% ចេញពីសំណុំទិន្នន័យដែលនៅសល់ បន្ទាប់មកលេខនោះនឹងត្រូវបានគេហៅថា outliers។
ប្រសិនបើអ្នកសរសេររូបមន្តយោងទៅតាមសំណុំទិន្នន័យរបស់អ្នក ហើយចុច Enter អ្នកនឹងទទួលបាន មធ្យោបាយគណនាដោយគ្មាន outliers សម្រាប់សំណុំទិន្នន័យរបស់អ្នក។ ក្នុងករណីរបស់យើង Cell E6 មានមធ្យមគណនាដែលជា 23.50 ។
ដើម្បីពិនិត្យមើលថាតើចម្លើយត្រឹមត្រូវឬអត់ យើងដំណើរការមុខងារ AVERAGE ក្នុង Cell E5 ដែលត្រឡប់ជាមធ្យម ( 28.80 ) នៃតម្លៃទាំងអស់នៅក្នុងជួរ B5:B14 ។ ហើយនៅក្នុង Cell E7 យើងដំណើរការមុខងារ AVERAGE មួយផ្សេងទៀត ដោយបញ្ចូលក្រឡាទាំងអស់ដោយដៃ លើកលែងតែកោសិកាដែលរក្សាតម្លៃ outliers ហើយទទួលបានលទ្ធផល 23.50 ។
ដូច្នេះ យើងអាចនិយាយបានថាមុខងារ TRIMMEAN អាចដកចេញដោយជោគជ័យចេញពីសំណុំទិន្នន័យដែលបានផ្តល់ឱ្យដោយជោគជ័យ ខណៈពេលដែលគណនាជាមធ្យមក្នុង Excel។
អានបន្ថែម៖ របៀបសម្អាតរូបមន្តក្នុង Excel (7+ Methods)
2. យក Outliers ចេញពីសំណុំទិន្នន័យ និងគំនូសតាងបន្ទាត់ក្នុង Excel
សូមកត់សម្គាល់រូបភាពខាងក្រោម។ យើងមានទិន្នន័យមួយចំនួនដែលផ្អែកលើការបង្កើតក្រាហ្វបន្ទាត់។ ពីក្រាហ្វបន្ទាត់ យើងអាចមើលឃើញយ៉ាងងាយស្រួលថានៅក្នុង ចំណុចទិន្នន័យ 4 និង 8 យើងមានចំនុចខាងក្រៅរបស់យើង ។
ឥឡូវនេះយើងនឹងឃើញពីរបៀបដែលយើងអាចរលូន ចេញពីគំនូសតាងបន្ទាត់ដោយយកតម្លៃខាងក្រៅចេញពីសំណុំទិន្នន័យ។
នៅក្នុងក្រឡាមួយទៀត (ក្នុងករណីរបស់យើងវាជា Cell H6 ) សូមសរសេររូបមន្តខាងក្រោម
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
នៅទីនេះ
- C6 = ក្រឡាដែលផ្ទុកទិន្នន័យដំបូងក្នុងសំណុំទិន្នន័យ
- C5 = ក្រឡាខាងលើក្រឡាទិន្នន័យដំបូង
- C7 = ក្រឡាខាងក្រោមក្រឡាទិន្នន័យដំបូង
- $E$6 = ភាពខុសគ្នារវាងចំណុចទិន្នន័យ .
កំពុងមើលទិន្នន័យរបស់យើង វាហាក់បីដូចជានៅពេលដែលចំណុចទិន្នន័យមួយគឺ ខុសគ្នា 10 ឯកតា ពីអ្នកដទៃ ត្រូវបានកំណត់ថាជា លើសពី ។ ដូច្នេះយើងដាក់ 10 ក្នុង Cell E6 ហើយធ្វើវាជា Absolute Cell Reference ដូច្នេះក្រឡានេះនឹងត្រូវបានជួសជុលពេលស្កេន និងគណនាតាមរយៈសំណុំទិន្នន័យទាំងមូល។
បន្ទាប់ពីចុច Enter អ្នកអាចឃើញទិន្នន័យដំបូងនៅតែលេចឡើងក្នុងក្រឡាលទ្ធផល H6 ។ អ្វីដែលអ្នកត្រូវធ្វើគឺគ្រាន់តែបង្កើតរូបមន្ត ដើម្បីយើងអាចអូស Fill Handle ដើម្បីអនុវត្តរូបមន្តទៅក្រឡាដែលនៅសល់។
ឥឡូវនេះអូសជួរដេកចុះក្រោមដោយ Fill Handle ហើយអ្នកនឹងឃើញក្រឡាដែលកំពុងកាន់ខាងក្រៅឥឡូវត្រូវបានបំពេញដោយ #N/A ។
ហើយមើលគំនូសតាងបន្ទាត់ឥឡូវនេះ នេះជាក្រាហ្វរាបស្មើដោយមិនមានតម្លៃលើសពីវាទេ។
ការបំបែករូបមន្ត
=IF(
ខណៈដែលយើងនឹងប្រៀបធៀបតម្លៃដោយផ្អែកលើអ្វីដែលយើងនឹងស្រង់ចេញលទ្ធផល យើងចាប់ផ្តើមរូបមន្តជាមួយ លក្ខខណ្ឌ IF ។
=IF(AND(
យើងនឹងប្រៀបធៀបចំណុចទិន្នន័យបច្ចុប្បន្ន និងក្រឡាខាងលើ និងក្រឡាខាងក្រោម ហើយប្រសិនបើការប្រៀបធៀបទាំងពីរជាការពិត នោះមានតែយើងទេដែលបង្ហាញចំណុចទិន្នន័យជាលទ្ធផល។ ដូច្នេះ ដោយសារយើងត្រូវដោះស្រាយជាមួយការប្រៀបធៀប "ទាំងពីរ" ដូច្នេះយើងគួរតែប្រើមុខងារ AND ។
=IF(AND(ABS(
) នៅពេលដែលយើងដកចំណុចទិន្នន័យ ទិន្នន័យមួយចំនួនអាចទម្លាក់តម្លៃអវិជ្ជមាន។ ហើយយើងធ្វើ ទេចង់ដោះស្រាយជាមួយតម្លៃអវិជ្ជមាន ព្រោះតម្លៃអវិជ្ជមាននឹងតែងតែផ្ទុយនឹងលក្ខខណ្ឌនៃ "ការយកទិន្នន័យចេញនៅពេលមានភាពខុសគ្នាគឺ 10"។ ដូច្នេះដើម្បីប្រាកដថាយើងតែងតែមានលទ្ធផលវិជ្ជមាន យើងត្រូវចងក្រងការប្រៀបធៀបក្នុង មុខងារតម្លៃដាច់ខាត ។
=IF(AND(ABS(C6-C5)>) ;$E$6
នៅទីនេះ យើងបានចាប់ផ្តើមការប្រៀបធៀបដំបូងរបស់យើង។ យើងគ្រាន់តែដកតម្លៃបច្ចុប្បន្នជាមួយនឹងតម្លៃខាងលើ ហើយមើលថាតើលទ្ធផលគឺធំជាងកម្រិតខុសគ្នាដែលរក្សាទុកក្នុង Cell E6 និងធ្វើឱ្យក្រឡាជា សេចក្តីយោងដាច់ខាត ដើម្បីរក្សាតម្លៃក្រឡាជាប់សោ។
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
បន្ទាប់ ផ្នែកទីពីរនៃការប្រៀបធៀបដែលត្រូវបានបំបែកដោយសញ្ញាក្បៀស។ វានឹងប្រៀបធៀបចំណុចទិន្នន័យបច្ចុប្បន្នជាមួយនឹងចំណុចទិន្នន័យបន្ទាប់។
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
ឥឡូវយើងដាក់ សញ្ញាក្បៀស និងកំណត់ដាក់ អនុគមន៍ NA នៅទីនោះ ប្រសិនបើមុខងារ AND ទាំងពីរពិត។
=IF(AND(ABS(C6-C5)) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
ហើយប្រសិនបើមុខងារ AND មិនពិត នោះយើង ចង់ត្រឡប់ចំណុចទិន្នន័យពិតជា IF False value។ ដូច្នេះយើងវាយបញ្ចូល e ក្នុងសញ្ញាក្បៀស ហើយហុចលេខយោងក្រឡា C6 នៅទីនោះ។
អានបន្ថែម៖ របៀបលុបសុពលភាពទិន្នន័យក្នុង Excel (5 វិធី)
ការអានស្រដៀងគ្នា
- របៀបលុបបឋមកថានៅក្នុង Excel (4 វិធីសាស្រ្ត)
- លុបបន្ទាត់ចំនុចចេញExcel (5 វិធីរហ័ស)
- របៀបយកក្រឡាចត្រង្គចេញពី Excel (6 វិធីងាយៗ)
- លុបព្រំដែនក្នុង Excel (4 វិធីរហ័ស)
- របៀបលុបភាពឆបគ្នាក្នុង Excel (វិធីងាយៗ 2)
3. លុប Outliers ដោយដៃក្នុង Excel
មធ្យោបាយងាយស្រួលមួយផ្សេងទៀតដើម្បីលុបបំបាត់ outliers នៅក្នុង Excel គឺគ្រាន់តែតម្រៀបតម្លៃនៃសំណុំទិន្នន័យរបស់អ្នក ហើយលុបតម្លៃខាងលើ និងខាងក្រោមដោយដៃពីវា។
ដើម្បីតម្រៀប ទិន្នន័យ
- ជ្រើសរើស សំណុំទិន្នន័យ។
- ចូលទៅកាន់ តម្រៀប & ត្រង នៅក្នុងក្រុម ការកែសម្រួល ហើយជ្រើសរើស តម្រៀបតូចបំផុតទៅធំបំផុត ឬ តម្រៀបធំបំផុតទៅតូចបំផុត ។
- ក្នុងករណីរបស់យើង យើងបានជ្រើសរើស តម្រៀបតូចបំផុតទៅធំបំផុត ។ វាបានតម្រៀបលេខនៅក្នុងសំណុំទិន្នន័យរបស់យើងតាមលំដាប់ឡើង ដោយដាក់លេខតូចបំផុតនៅខាងលើ និងលេខធំបំផុតនៅខាងក្រោម។
ឥឡូវនេះគ្រាន់តែលុបទិន្នន័យទាំងនោះដោយដៃប៉ុណ្ណោះ។ ដើម្បីធ្វើឱ្យតម្លៃដាច់នៃសំណុំទិន្នន័យឥតគិតថ្លៃ។
យើងមិនណែនាំឱ្យធ្វើតាមដំណើរការនេះទេ ខណៈពេលដែលធ្វើការជាមួយសំណុំទិន្នន័យធំ។ នៅពេលដែលសំណុំទិន្នន័យរបស់អ្នកមានទំហំតូច និងងាយស្រួលមើល មានតែអ្នកប៉ុណ្ណោះដែលអាចអនុវត្តនីតិវិធីនេះ បើមិនដូច្នេះទេកុំអនុវត្តវា។
អានបន្ថែម៖ របៀបយកតម្រៀបចេញក្នុង Excel ( 3 វិធីសាស្រ្តងាយៗ)
សេចក្តីសន្និដ្ឋាន
អត្ថបទនេះបង្ហាញអ្នកពីរបៀប លុបផ្នែកខាងក្រៅចេញ នៅក្នុង Excel។ ខ្ញុំសង្ឃឹមថាអត្ថបទនេះមានប្រយោជន៍ច្រើនសម្រាប់អ្នក។ មានអារម្មណ៍ថាមានសេរីភាពក្នុងការសួរប្រសិនបើអ្នកមានសំណួរណាមួយទាក់ទងនឹងប្រធានបទ។