فهرست مطالب
ممکن است برای انجام محاسبات آماری بر روی دادههای مجموعه دادهها، نیاز به شناسایی موارد پرت باشد. شما می توانید با استفاده از مایکروسافت اکسل به روش های متعددی اطلاعات پرت را از مجموعه داده های عظیم کشف کنید. در این پست، ما به شما نشان خواهیم داد که چگونه با استفاده از پنج روش متمایز، مقادیر پرت را در مایکروسافت اکسل محاسبه کنید.
دانلود کتاب تمرین تمرین
می توانید کتاب کار رایگان اکسل را از اینجا دانلود کنید و خودتان تمرین کنید. .
پیدا کردن Outliers.xlsx
5 روش کاربردی برای محاسبه نقاط پرت در اکسل
Outliers مقادیر داده هستند که به طور قابل توجهی با بقیه مقادیر داده در مجموعه داده متفاوت است. به عبارت دیگر، مقادیر پرت، ارزشهای خارقالعادهای هستند. آنها در مقایسه با مقادیر دیگر در یک مجموعه داده یا به طور استثنایی بالا یا بیش از حد کم هستند. یافتن مقادیر پرت در محاسبات آماری حیاتی است زیرا آنها بر یافته های تجزیه و تحلیل داده های ما تأثیر دارند.
به عنوان مثال، شما مجموعه داده ای دارید که درآمد روزانه دوازده نفر را نشان می دهد. اکنون باید مقادیر پرت را با استفاده از Microsoft Excel محاسبه کنید. در اینجا، من پنج روش آسان برای انجام این کار را به شما نشان خواهم داد.
1. از Sort & برای محاسبه نقاط پرت در اکسل فیلتر کنید
شما می توانید با استفاده از Sort & دستور Filter در اکسل. اگر میخواهید مقادیر پرت را با استفاده از تابع مرتبسازی و فیلتر محاسبه کنید، میتوانید این کار را با دنبال کردن زیر انجام دهیدمراحل زیر را انجام دهید.
مرحله 1:
- ابتدا، عنوان ستونی را در مجموعه داده اکسل خود که می خواهید مرتب کنید، انتخاب کنید. به عنوان مثال، در مجموعه داده داده شده، در سرفصل ستون فایل با نام درآمد روزانه (سلول C40 انتخاب شده است).
مرحله 2:
- سپس، Home <7 را فشار دهید> برگه روی نوار و به گروه ویرایش بروید.
مرحله 3:
- پس از آن، در گروه ویرایش بر روی Sort & دستور را فیلتر کنید و بر روی Custom Sort کلیک کنید.
مرحله 4:
- سپس، کادر محاوره ای جدیدی با نام Sort باز می شود. در کادر محاورهای باز شده، روزانه درآمد را در مرتبسازی بر اساس <7 انتخاب کنید> کشویی و Smallest to Largest در منوی کرکره Order. پس از آن، روی OK کلیک کنید.
مرحله 5:
- در نهایت، ستون درآمد روزانه به روشی که گفته شد، با کمترین مقادیر در بالا و بیشترین مقادیر در پایین مرتب می شود. پس از اجرای رویه، به دنبال هر گونه بی نظمی در محدوده داده باشید تا مقادیر پرت را تعیین کنید.
به عنوان مثال، دو مقدار اول در ستون به طور قابل توجهی کمتر هستند و دو مقدار آخر در ستون به طور قابل توجهی بالاتر از بقیه مقادیر موجود در مجموعه داده هستند، همانطور که درنتیجه فوق.
بیشتر بخوانید: چگونه نقاط پرت را در تحلیل رگرسیون در اکسل پیدا کنیم (3 روش آسان)
2. اعمال تابع QUARTILE در محاسبه نقاط پرت در اکسل
رویکرد تابع QUARTILE روشی علمی تر برای محاسبه نقاط پرت در اکسل است. می توانید از این تابع برای تقسیم مجموعه داده های خود به چهار قسمت مساوی استفاده کنید. مقادیر زیر توسط تابع QUARTILE برگردانده می شود:
- حداقل مقدار.
- 6> چهارک 1 (Q1- کمترین 25٪ از یک مجموعه داده داده شده).
- چهارک دومین (Q2- بعدی کمترین 25% مجموعه داده).
- چهارک 3 (Q3- دومین 25% مجموعه داده بالاتر).
- حداکثر مقدار.
سینتکس عملکرد QUARTILE در اکسل این است:
=QUARTILE( آرایه، کوارت)
نحو حاوی آرگومان های زیر است:
- a ray : محدوده سلولی داده شده مجموعه داده ای که برای آن مقدار چارک را محاسبه خواهید کرد.
- quart: این مشخص می کند که کدام مقدار باید برگردانده شود.
برای محاسبه مقادیر پرت برای مجموعه داده فوق با استفاده از عملکرد QUARTILE، مراحل زیر را دنبال کنید.
مرحله 1:
- ابتدا، فرمول زیر را برای تعیین چارک 1 ( Q1 ) در زیر تایپ کنید.
=QUARTILE($C$5:$C$16,1)
مرحله 2:
- اینجادوباره، فرمول محاسبه 3 چهارم ( Q3 ) در زیر آورده شده است.
=QUARTILE($C$5:$C$16,3)
مرحله 3:
- سوم، شما باید IQR را تعیین کنید، که محدوده بین ربعی (نماینده 50% داده های داده شده از طیفی از مجموعه داده هایی است که در ربع اول و سوم قرار می گیرند) با تفریق Q1 (در سلول G4 ) از Q3 (در سلول G5 ). فرمول زیر را برای محاسبه تفریق تایپ کنید.
=G5-G4
> 0> مرحله 4:
- پس از یافتن IQR، بعد باید بالا و تعیین کنید پایین زیرا حد بالا و پایین حاوی بیشتر دادههای درون مجموعه داده ها برای محاسبه حد بالا فرمول زیر را بنویسید>
مرحله 5:
- سپس برای محاسبه حد پایین، فرمول زیر را بنویسید.
=G4-(1.5*G6)
مرحله 6:
همچنین ببینید: نحوه حذف Read Only از Excel (7 ساده ترین راه)- در نهایت، پس از اتمام مرحله قبل، می توانید برای هر داده مقادیر پرت تعیین کنید. ارزش. در کاربرگ اکسل، فرمول زیر را با تابع OR در سلول D5 تایپ کنید.
=OR(C5$G$7)
- این فرمول به شناسایی داده هایی که در محدوده محدوده فوق الذکر قرار نمی گیرند کمک می کند. پس از پردازشفرمول یک گزاره TRUE را نشان می دهد اگر داده های خاص پرت باشد و FALSE اگر نیست. دوبار کلیک کنید بر روی ابزار AutoFill در سلول C5 برای کپی فرمول در بقیه سلولها در ستون C . بنابراین، میتوانید یک مقدار True را در کنار همه نقاط پرت در مجموعه داده خود مشاهده کنید.
3. توابع AVERAGE و STDEV.P را برای محاسبه مقادیر پرت از میانگین و انحراف استاندارد
A ترکیب کنید. انحراف استاندارد (یا σ ) معیاری برای تعیین نحوه توزیع دادهها با توجه به مقدار میانگین کل مجموعه داده است. هنگامی که انحراف استاندارد کم است، داده ها حول میانگین گروه بندی می شوند، در حالی که زمانی که انحراف استاندارد زیاد است، داده ها بیشتر پخش می شوند. برای محاسبه مقادیر پرت با استفاده از میانگین و انحراف استاندارد میتوانید مراحل زیر را دنبال کنید.
مرحله 1:
- ابتدا از همان مجموعه داده نشان داده شده در ابتدای این مقاله استفاده کنید و سپس میانگین و انحراف معیار را محاسبه کنید. برای محاسبه میانگین، فرمول زیر را با عملکرد AVERAGE در سلول G5 تایپ کنید.
=AVERAGE(C5:C16)
مرحله 2:
- برای محاسبه انحراف معیار، فرمول زیر را با STDEV وارد کنید تابع .P در سلول G6 .
=STDEV.P(C5:C16)
مرحله 3:
- بعد، شما مقدارحد بالایی برای پیشرفت بیشتر در فرآیند. در سلول G7 ، حد پایین را با استفاده از فرمول زیر محاسبه کنید.
=G5-(1.25*G6)
مرحله 4:
- و در سلول G8 حد بالایی را از فرمول زیر محاسبه کنید
=G5+(1.5*G6)
مرحله 5:
- بعد از آن ، برای محاسبه وجود یا عدم وجود موارد پرت، فرمول زیر را در سلول D5 تایپ کنید.
=OR(C5$G$8)
- بنابراین، اگر دادههای خاص در سلول مورد نظر پرت باشد و باشد، فرمول مقدار TRUE را برمیگرداند. FALSE.
- روی ابزار AutoFill در سلول D5 <7 دوبار کلیک کنید >برای کپی کردن فرمول در بقیه سلول های ستون D . بنابراین، میتوانید تمام نقاط پرت باقیمانده در مجموعه داده خود را بیابید.
بیشتر بخوانید: چگونه مقادیر پرت را با انحراف استاندارد در اکسل (با مراحل سریع) پیدا کنید
4. درج Z-Score برای محاسبه نقاط پرت در اکسل
Z-score یکی از رایج ترین معیارهای مورد استفاده برای شناسایی نقاط پرت این روش نشان میدهد که یک داده خاص با توجه به انحراف استاندارد چقدر از میانگین یک مجموعه داده فاصله دارد. برای محاسبه نقاط پرت با استفاده از Z-score در اکسل می توانید مراحل شرح داده شده در زیر را مشاهده کنید.
مرحله 1:
- ابتدا مجموعه داده مورد نظر را انتخاب کنید.
مرحله2:
- دوم، در سلول H5، فرمول زیر را برای محاسبه میانگین <تایپ کنید 7>برای داده های داده شده.
=AVERAGE(C5:C16)
مرحله 3:
- سوم، انحراف استاندارد مجموعه داده داده شده در سلول H6 را با استفاده از فرمول زیر محاسبه کنید.
=STDEV.P(C5:C16)
مرحله 4:
- بعد از آن ، باید برای هر مقدار داده، Z -score را تعیین کنید. برای انجام این کار از فرمول زیر استفاده کنید.
=(C5-$H$5)/$H$6
مرحله 5:
- بعد از محاسبه همه Z-values، خواهید دید که محدوده Z-values بین -1.44 و 13 است. بنابراین، ما مقادیر Z-score کمتر از -1.2 یا بیشتر از +1.8 را برای محدودیت های پرت در نظر می گیریم.
- سپس، فرمول زیر را در سلول E 5 تایپ کنید.
=OR((D51.8))
- در نهایت، اگر دادههای خاص یک مقدار پرت باشد، فرمول مقدار TRUE را برمیگرداند و FALSE <9 را برمیگرداند>
- برای استفاده از AutoFill روی سلول E5 دوبار کلیک کنید دستگاه پر کردن ابزار برای کپی کردن فرمول در بقیه سلول های ستون E . بنابراین، میتوانید تمام نقاط پرت باقیمانده را در مجموعه داده خود پیدا کنید.
بیشتر بخوانید: چگونه با استفاده از امتیاز Z در اکسل (با Quickمراحل)
5. ادغام توابع LARGE و SMALL برای یافتن نقاط پرت در اکسل
عملکرد LARGE و عملکرد SMALL در اکسل عملیات مخالف دارند ما از آن برای یافتن بزرگترین و کوچکترین داده یا مقادیر در یک مجموعه داده استفاده خواهیم کرد. این تابع تمام داده ها را در یک مجموعه داده جمع می کند و کوچکترین و بزرگترین اعداد را پیدا می کند. آنها میتوانند دومین کوچکترین یا بزرگترین، سومین بزرگترین یا کوچکترین و غیره را پیدا کنند.
مرحله 1:
- ابتدا از فرمول زیر در سلول E5 با تابع LARGE استفاده کنید.
=LARGE($C$5:$C$16,1)
-
- بنابراین، از 12 مقادیر، میتوانید اولین مقدار بزرگ را ببینید که <6 است> 780 .
مرحله 2:
- پس از آن، در سلول G5 ، فرمول زیر را بنویسید تا کوچکترین مقدار را پیدا کنید.
=SMALL($C$5:$C$16,1)
- در نهایت، از 12 مقادیر، می توانید 1 را ببینید کوچکترین مقدار 110 .
- هنگامی که تمام مقادیر مورد نیاز را پیدا کردید، آنگاه می توانید به راحتی به هر نقطه پرت در مجموعه داده اشاره کنید.
نتیجه گیری
این پایان این مقاله است. امیدوارم این مقاله برای شما مفید باشد. پس از مطالعه این مقاله، می توانید با استفاده از هر یک از روش ها، مقادیر پرت را در اکسل محاسبه کنید. لطفاً هرگونه سؤال یا توصیه بیشتر را با آنها در میان بگذاریدما در بخش نظرات زیر.
- پس از یافتن IQR، بعد باید بالا و تعیین کنید پایین زیرا حد بالا و پایین حاوی بیشتر دادههای درون مجموعه داده ها برای محاسبه حد بالا فرمول زیر را بنویسید>