جدول المحتويات
يعد العثور على القيم المتطرفة وإزالتها مهمة شائعة جدًا لتحليل البيانات في الإحصائيات واستخراج البيانات والتعلم الآلي وما إلى ذلك. هناك العديد من الطرق التي يمكنك من خلالها العثور على القيم المتطرفة في مجموعة البيانات الخاصة بك ولكن عملية إزالتها ليست بهذه السهولة تجد. في هذه المقالة ، سنوضح لك كيفية إزالة القيم المتطرفة في Excel .
تنزيل المصنف
يمكنك تنزيل مصنف Excel التدريبي المجاني من هنا.
إزالة Outliers.xlsx
ما هي القيم المتطرفة في Excel؟ هي قيمة تقع بعيدًا عن القيمة المتوسطة أو المتوسطة لمجموعة البيانات. بعبارة أخرى ، القيم المتطرفة هي قيم أعلى أو أقل بكثير من بقية القيم في مجموعة البيانات.
فكر في مباراة كريكيت حيث سجل جميع الضاربين حوالي 50 ولكن سجل ضارب واحد فقط قرنًا (100) ) ورجل مضرب آخر خرج عند 0. هذه الدرجات 100 و 0 هي القيم المتطرفة في هذه المباراة.
القيم المتطرفة تمثل مشكلة لأنها يمكن أن تحرف نتيجة تحليل البيانات وتحدث نتائج مضللة. لذلك من الأفضل العثور على القيم المتطرفة وإزالتها للحصول على مجموعة بيانات سلسة.
3 طرق لإزالة القيم المتطرفة في Excel
في هذا القسم ، ستتعلم كيفية احذف القيم المتطرفة من مجموعة البيانات الخاصة بك بثلاث طرق مختلفة. تعد إزالة القيم المتطرفة عملية صعبة ، لذا اقرأ المقالة بالكامل بعناية.
1. استخدام وظيفة Excel لحساب المتوسط بدونالقيم المتطرفة
Excel دالة TRIMMEAN يمكن استخدامها لحساب متوسط مجموعة بيانات معينة مع استبعاد القيم المتطرفة. يتم توفير نقاط البيانات المراد استبعادها كنسبة مئوية. يمكن إدخال قيمة النسبة المئوية كتنسيق عشري أو تنسيق النسبة المئوية.
بناء الجملة لحساب المتوسط بدون القيم المتطرفة هو
= TRIMMEAN (مجموعة ، نسبة مئوية)هنا ،
- المصفوفة = نطاق البيانات لقص وحساب متوسط النتيجة
- بالمائة = عدد نقاط البيانات المراد استبعادها
دعونا نرى كيفية تنفيذ هذه الوظيفة لحساب النتائج مع القيم المتطرفة التي تمت إزالتها.
ضع في اعتبارك الصورة أعلاه. لدينا بيانات من خلية B5 إلى B14 . تتراوح معظم الأرقام هنا بين 20 و 27 ، لكن قيمتين - 0 و 100 - بعيدة كل البعد عن هذه القيم. هذه هي القيم المتطرفة في مجموعة البيانات الخاصة بنا.
بالنسبة لمجموعة البيانات الخاصة بنا ، الصيغة لحساب المتوسط (المتوسط) بدون القيم الخارجية باستخدام Excel TRIMMEAN الوظيفة هي ،
=TRIMMEAN(B5:B14,0.2)
هنا ،
- B5: B14 = نطاق البيانات المطلوب اقتطاعه وحساب النتيجة المتوسطة
- 0.2 (أو 20٪) = عدد نقاط البيانات المطلوب استبعادها
إذا كان أي رقم في مجموعة البيانات يقع بنسبة 20٪ بعيدًا عن بقية مجموعة البيانات ، فسيتم استدعاء هذا الرقم القيم المتطرفة.
إذا كتبت الصيغة وفقًا لمجموعة البيانات الخاصة بك واضغط على أدخل ، فستحصل على المتوسط المحسوب بدون القيم المتطرفة لمجموعة البيانات الخاصة بك. في حالتنا ، الخلية E6 تحمل المتوسط المحسوب وهو 23.50 .
للتحقق مما إذا كانت الإجابة صحيحة أم لا ، نقوم بتشغيل وظيفة AVERAGE في الخلية E5 التي تُرجع المتوسط ( 28.80 ) لجميع القيم الموجودة في النطاق B5: B14 . وفي الخلية الخلية E7 ، نقوم بتشغيل وظيفة أخرى AVERAGE عن طريق إدخال جميع الخلايا يدويًا باستثناء تلك التي تحتوي على قيم متطرفة ، وحصلنا على عائد 23.50 نتيجة لذلك.
لذلك يمكننا القول أن الوظيفة TRIMMEAN يمكنها إزالة القيم المتطرفة بنجاح من مجموعة بيانات معينة أثناء حساب المتوسط في Excel.
اقرأ المزيد: كيفية مسح الصيغة في Excel (7+ طرق)
2. قم بإزالة القيم المتطرفة من مجموعة البيانات والمخطط الخطي في Excel
لاحظ الصورة التالية. لدينا بعض البيانات التي بناءً عليها أنشأنا رسمًا بيانيًا خطيًا. من الرسم البياني الخطي ، يمكننا أن نرى بسهولة أنه في نقطتي البيانات 4 و 8 لدينا القيم المتطرفة .
الآن سنرى كيف يمكننا السلاسة خارج المخطط الخطي عن طريق إزالة القيم البعيدة من مجموعة البيانات.
في خلية أخرى (في حالتنا هي الخلية H6 ) ، اكتب الصيغة التالية ،
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
هنا ،
- C6 = الخلية التي تحتوي على البيانات الأولى في مجموعة البيانات
- C5 = خلية أعلى خلية البيانات الأولى
- C7 = خلية أسفل خلية البيانات الأولى
- $ E $ 6 = الفرق بين نقاط البيانات .
النظر فيبياناتنا ، يبدو أنه عندما تكون نقطة البيانات تختلف 10 وحدات عن الآخرين ، يتم تعيينها على أنها خارجية . لذلك وضعنا 10 في الخلية E6 وجعلها مرجع الخلية المطلق بحيث يتم إصلاح هذه الخلية أثناء المسح والحساب من خلال مجموعة البيانات بأكملها.
بعد الضغط على إدخال ، يمكنك رؤية البيانات الأولى لا تزال تظهر في خلية النتيجة H6 . كل ما عليك فعله هنا هو فقط إنشاء الصيغة حتى نتمكن من سحب Fill Handle لتطبيق الصيغة على بقية الخلايا.
الآن اسحب الصف لأسفل باستخدام مقبض التعبئة وسترى الخلايا التي كانت تحتوي على القيم المتطرفة مملوءة الآن بـ # N / A .
وانظر إلى المخطط الخطي الآن ، هذا رسم بياني مسطح بدون أي قيم نائية فيه.
انهيار الصيغة
= IF (
نظرًا لأننا سنقارن القيم بناءً على ما سنستخرج النتيجة ، نبدأ الصيغة باستخدام الشرط IF .
= IF (AND (
سنقوم بمقارنة نقطة البيانات الحالية والخلية أعلاه والخلية أدناه . وإذا كان كلا المقارنتين صحيحين ، عندها فقط سنعرض نقطة البيانات كنتيجة لذلك ، بما أننا بحاجة إلى التعامل مع مقارنات "كلاهما" ، لذا يجب أن نستخدم الدالة AND .
= IF (AND (ABS (
) عندما نطرح نقاط البيانات ، قد تطرح بعض البيانات قيمًا سالبة. ونفعل لاتريد التعامل مع القيم السالبة لأن القيم السالبة ستتعارض دائمًا مع شرط "إزالة البيانات عندما يكون الفرق 10". لذلك للتأكد من حصولنا دائمًا على نتائج إيجابية ، نحتاج إلى لف المقارنات في دالة القيمة المطلقة .
= IF (AND (ABS (C6-C5) & gt) ؛ $ E $ 6
هنا بدأنا المقارنة الأولى. نحن ببساطة نطرح القيمة الحالية بالقيمة أعلاه ونرى ما إذا كانت النتيجة أكبر من مستوى الاختلاف المخزن في الخلية E6 وجعل الخلية مرجع مطلق للحفاظ على قيمة الخلية مقفلة.
= IF (AND (ABS (C6-C5) & gt؛ $ E $ 6، ABS (C6) -C7) & gt؛ $ E $ 6)
التالي ، الجزء الثاني من المقارنة مفصول بفاصلة. سيقارن نقطة البيانات الحالية بنقطة البيانات التالية.
= IF (AND (ABS (C6-C5) & gt؛ $ E $ 6، ABS (C6-C7) & gt؛ $ E $ 6)، NA ()
الآن نضع فاصلة وتحديد وضع NA function هناك إذا كانت كلتا الوظيفتين و صحيحين.
= IF (AND (ABS (C6-C5) & gt؛ $ E $ 6، ABS (C6-C7) & gt؛ $ E $ 6)، NA ()، C6)
وإذا كانت الوظيفة AND غير صحيحة فإننا تريد إرجاع نقطة البيانات الفعلية كقيمة خطأ IF . لذلك نكتب e في فاصلة وتمرير الرقم المرجعي للخلية C6 هناك.
اقرأ المزيد: كيفية إزالة التحقق من صحة البيانات في Excel (5 طرق)
قراءات مماثلة
- كيفية إزالة رأس في Excel (4 طرق)
- إزالة الخطوط المنقطة بتنسيقExcel (5 طرق سريعة)
- كيفية إزالة الشبكة من Excel (6 طرق سهلة)
- إزالة الحدود في Excel (4 طرق سريعة)
- كيفية إزالة وضع التوافق في Excel (طريقتان سهلتان)
3. إزالة القيم المتطرفة يدويًا في Excel
هناك طريقة أخرى سهلة للتخلص من القيم المتطرفة في Excel وهي ، فقط قم بفرز قيم مجموعة البيانات الخاصة بك وحذف القيم العليا والسفلى منها يدويًا.
للفرز البيانات ،
- حدد مجموعة البيانات.
- انتقل إلى Sort & amp؛ قم بالتصفية في المجموعة التحرير واختر إما الفرز من الأصغر إلى الأكبر أو الفرز من الأكبر إلى الأصغر .
- في حالتنا ، اخترنا فرز من الأصغر إلى الأكبر . لقد قامت بفرز الأرقام في مجموعة البيانات الخاصة بنا بترتيب تصاعدي ، ووضع أصغرها في الأعلى والأكبر في الأسفل.
الآن فقط احذف هذه البيانات يدويًا لجعل القيم البعيدة لمجموعة البيانات مجانية.
لا نوصي باتباع هذه العملية أثناء العمل مع مجموعة بيانات كبيرة. عندما تكون مجموعة البيانات الخاصة بك صغيرة وسهلة العرض ، عندها فقط يمكنك تطبيق هذا الإجراء ، وإلا فلا تقم بتنفيذ هذا.
اقرأ المزيد: كيفية إزالة الفرز في Excel ( 3 طرق سهلة)
الخاتمة
توضح لك هذه المقالة كيفية إزالة القيم المتطرفة في Excel. آمل أن يكون هذا المقال مفيدًا جدًا لك. لا تتردد في السؤال عما إذا كان لديك أي أسئلة بخصوصالموضوع.