تجزیه و تحلیل رگرسیون چندگانه با اکسل

  • این را به اشتراک بگذارید
Hugh West
تجزیه و تحلیل رگرسیون سادهمعمولاً برای تخمین رابطه بین دو متغیر استفاده می شود، به عنوان مثال، رابطه بین عملکرد محصول و بارندگی یا رابطه بین طعم نان و دمای فر. با این حال، ما نیاز به بررسی رابطه بین یک متغیر وابسته و دو یا چند متغیر مستقل داریم. به عنوان مثال، یک مشاور املاک ممکن است بخواهد بداند که آیا و چگونه معیارهایی مانند اندازه خانه، تعداد اتاق خواب ها، و درآمد متوسط ​​محله با قیمتی که یک خانه به آن فروخته می شود، مرتبط است یا خیر. این نوع مشکل را می توان با استفاده از تجزیه و تحلیل رگرسیون چندگانه حل کرد.و این مقاله خلاصه ای از نحوه استفاده از تجزیه و تحلیل رگرسیون چندگانه با استفاده از Excel را به شما ارائه می دهد.

مشکل

فرض کنید 5 فروشنده به صورت تصادفی انتخاب شده و اطلاعات را مطابق جدول زیر جمع آوری کرده ایم. آیا تحصیلات یا انگیزه تأثیری بر فروش سالانه دارد یا نه؟ اندازه گیری شده با مقیاس انگیزه هیگینز فروش سالانه به دلار 12 32 $350,000 14 35 $399,765 15 45 429000$ 16 50 435000$ 18 65 433000$

معادله

به طور کلی، چندگانهتحلیل رگرسیون فرض می کند که یک رابطه خطی بین متغیر وابسته (y) و متغیرهای مستقل (x1، x2، x3 ... xn) وجود دارد. و این نوع رابطه خطی را می توان با استفاده از فرمول زیر توصیف کرد:

Y = ثابت + β1*x1 + β2*x2+…+ βn*xn

در اینجا توضیحاتی برای ثابت ها و ضرایب آورده شده است. :

Y مقدار پیش بینی شده Y
Constant Y- قطع کردن
β1 تغییر Y در هر 1 تغییر افزایشی در x1
β2 تغییر در Y هر 1 افزایش تغییر در x2
bn تغییر در Y هر 1 تغییر افزایشی در xn

ثابت و β1، β2... βn را می توان بر اساس داده های نمونه موجود محاسبه کرد. بعد از اینکه مقادیر ثابت، β1، β2... βn را دریافت کردید، می‌توانید از آنها برای پیش‌بینی استفاده کنید. بنابراین، معادله این خواهد بود:

فروش سالانه = ثابت + β1*(بالاترین سال تحصیلی تکمیل شده) + β2*(انگیزه بر اساس مقیاس انگیزه هیگینز)

مدل تنظیم

فروش سالانه، بالاترین سال تحصیلی و انگیزه در ستون A، ستون B و ستون C همانطور که در شکل 1 نشان داده شده است وارد شد. بهتر است همیشه متغیر وابسته (فروش سالانه در اینجا) قبل از متغیرهای مستقل قرار گیرد. .

شکل 1

دانلود Analysis ToolPak

Excelویژگی تجزیه و تحلیل داده را به ما ارائه می دهد که می تواند مقادیر ثابت ها و ضرایب را برگرداند. اما قبل از استفاده از این ویژگی، باید Analysis ToolPak را دانلود کنید. در اینجا نحوه نصب آن آمده است.

روی برگه File -> Options کلیک کنید و سپس روی Add-Ins در <کلیک کنید 1>گزینه های اکسل کادر محاوره ای. روی دکمه برو در پایین کادر محاوره ای گزینه های اکسل کلیک کنید تا کادر محاوره ای افزونه ها باز شود. در کادر محاوره ای افزونه ها ، کادر انتخاب Analysis TookPak را انتخاب کنید و سپس بر روی Ok کلیک کنید.

حالا اگر روی کلیک کنید تب Data ، خواهید دید که Analysis Data در گروه Analysis ظاهر می شود (پانل سمت راست).

شکل 2 [روی تصویر کلیک کنید تا مشاهده کامل]

تجزیه و تحلیل رگرسیون چندگانه

در گروه تجزیه و تحلیل در برگه داده روی تحلیل داده کلیک کنید . Regression را در کادر گفتگوی تحلیل داده انتخاب کنید. همچنین می توانید تحلیل آماری دیگری مانند آزمون t، ANOVA و غیره را انجام دهید.

شکل 3.1

A رگرسیون پس از انتخاب Regression کادر محاوره ای از شما خواسته می شود. کادر محاوره ای را همانطور که در شکل 3.2 نشان داده شده است پر کنید.

Input Y Range حاوی متغیر وابسته و داده است در حالی که Input X Range حاوی متغیرها و داده های مستقل است. در اینجا باید یادآوری کنم که متغیرهای مستقل باید در ستون های مجاور باشند. و حداکثر تعداد متغیرهای مستقل 15 است.

از آنجا کهمحدوده A1: C1 شامل برچسب های متغیر است و بنابراین باید کادر بررسی Labels انتخاب شود. در واقع، من به شما توصیه می کنم هر بار که محدوده ورودی Y و محدوده X ورودی را پر می کنید، برچسب ها را اضافه کنید. این برچسب‌ها هنگام بررسی گزارش‌های خلاصه‌ای که توسط اکسل برگردانده می‌شوند مفید هستند.

شکل 3.2

با انتخاب کادر بررسی Residuals، می‌توانید Excel را فعال کنید تا موارد باقیمانده را برای هر مشاهده فهرست کند. به شکل 1 نگاه کنید، در مجموع 5 مشاهده وجود دارد و شما 5 باقیمانده را دریافت خواهید کرد. باقیمانده چیزی است که وقتی مقدار پیش بینی شده را از مقدار مشاهده شده کم می کنید، باقی می ماند. باقیمانده استاندارد شده، باقیمانده تقسیم بر انحراف استاندارد آن است.

همچنین می‌توانید کادر انتخاب نمودار باقیمانده را انتخاب کنید که می‌تواند اکسل را قادر به برگرداندن نمودارهای باقیمانده کند. تعداد نمودارهای باقیمانده برابر با تعداد متغیرهای مستقل است. نمودار باقیمانده نموداری است که باقیمانده ها را در محور Y و متغیرهای مستقل را در محور x نشان می دهد. نقاط پراکنده تصادفی حول محور x در نمودار باقیمانده نشان می دهد که مدل رگرسیون خطی مناسب است. به عنوان مثال، شکل 3.3 سه الگوی معمولی از نمودارهای باقیمانده را نشان می دهد. تنها موردی که در پانل سمت چپ قرار دارد نشان می‌دهد که برای یک مدل خطی مناسب است. دو الگوی دیگر تناسب بهتری را برای یک مدل غیر خطی نشان می‌دهند.

شکل 3.3

اگر کادر بررسی Line Fit Plots را انتخاب کنید اکسل یک نمودار خط برازش را برمی‌گرداند. طرح خط مناسبمی تواند رابطه بین یک متغیر وابسته و یک متغیر مستقل را رسم کند. به عبارت دیگر، اکسل همان تعداد نمودار خط متناسب با متغیر مستقل را به شما برمی گرداند. به عنوان مثال، شما 2 نمودار خط متناسب برای مشکل ما دریافت خواهید کرد.

نتایج

پس از کلیک بر روی دکمه Ok، اکسل گزارش خلاصه ای را به شرح زیر برمی گرداند. سلول هایی که با رنگ سبز و زرد مشخص شده اند، مهم ترین قسمتی هستند که باید به آن توجه کنید.

شکل 3.4

هر چه مربع R بالاتر باشد (سلول F5)، رابطه تنگاتنگی وجود دارد. بین متغیرهای وابسته و متغیرهای مستقل و ضرایب (محدوده F17: F19) در جدول سوم مقادیر ثابت ها و ضرایب را به شما برمی گرداند. معادله باید فروش سالانه = 1589.2 + 19928.3 * (بالاترین سال تحصیلی تکمیل شده) + 11.9 * (انگیزه اندازه گیری شده توسط مقیاس انگیزه هیگینز).

با این حال، برای دیدن اینکه آیا نتایج قابل اعتماد هستند، شما همچنین نیاز دارید برای بررسی مقادیر p که با رنگ زرد برجسته شده اند. تنها اگر مقدار p در سلول J12 کمتر از 0.05 باشد، کل معادله رگرسیون قابل اعتماد است. اما شما همچنین باید مقادیر p را در محدوده I17: I19 بررسی کنید تا ببینید آیا متغیرهای ثابت و مستقل برای پیش‌بینی متغیر وابسته مفید هستند یا خیر. برای مشکل ما، بهتر است هنگام در نظر گرفتن متغیرهای مستقل انگیزه را کنار بگذاریم.

بیشتر بخوانید: نحوه محاسبه P Value در رگرسیون خطی در اکسل (3)راه ها)

حذف انگیزه از متغیرهای مستقل

پس از حذف انگیزه به عنوان متغیر مستقل، من همین رویکرد را اعمال کردم و یک تحلیل رگرسیون ساده انجام دادم. می بینید که اکنون همه مقادیر کمتر از 0.05 هستند. معادله نهایی باید این باشد:

فروش سالانه = 1167.8 + 19993.3*(بالاترین سال تحصیلی تکمیل شده)

شکل 3.5 [برای مشاهده کامل روی تصویر کلیک کنید]

توجه

شکل 4

علاوه بر ابزار Add-Ins، می توانید از تابع LINEST برای انجام تحلیل رگرسیون چندگانه نیز استفاده کنید. تابع LINEST یک تابع آرایه است که می تواند نتیجه را در یک سلول یا محدوده ای از سلول ها برگرداند. اول از همه، محدوده A8:B12 را انتخاب کنید و سپس فرمول "=LINEST (A2:A6، B2:B6، TRUE، TRUE)" را در اولین سلول این محدوده (A8) وارد کنید. پس از اینکه CTRL + SHIFT +ENTER را فشار دادید، اکسل نتایج زیر را برمی گرداند. با مقایسه با شکل 3.4، می بینید که 19993.3 ضریب بالاترین سال تحصیلی است در حالی که 1167.8 ثابت است. به هر حال من به شما توصیه می کنم از ابزار Add-Ins استفاده کنید. بسیار ساده تر است.

ادامه مطلب…

تحلیل معکوس What-If در اکسل

چگونه از Wildcards در Excel استفاده کنیم؟

دانلود فایل کاری

فایل کاری را از لینک زیر دانلود کنید.

Multiple-Reggression-Analysis. xlsx

هیو وست یک مربی و تحلیلگر اکسل بسیار با تجربه با بیش از 10 سال تجربه در این صنعت است. وی دارای مدرک لیسانس در رشته حسابداری و امور مالی و مدرک کارشناسی ارشد در رشته مدیریت بازرگانی است. هیو علاقه زیادی به تدریس دارد و یک رویکرد آموزشی منحصر به فرد ایجاد کرده است که به راحتی قابل پیگیری و درک است. دانش تخصصی او از اکسل به هزاران دانش آموز و متخصص در سراسر جهان کمک کرده تا مهارت های خود را بهبود بخشند و در حرفه خود برتری پیدا کنند. هیو از طریق وبلاگ خود دانش خود را با جهان به اشتراک می گذارد و آموزش های رایگان اکسل و آموزش آنلاین ارائه می دهد تا به افراد و مشاغل کمک کند تا به پتانسیل کامل خود دست یابند.