نحوه تفسیر نتایج رگرسیون در اکسل (تحلیل دقیق)

  • این را به اشتراک بگذارید
Hugh West

تحلیل رگرسیون تقریباً در هر نوع نرم افزار آماری مانند SPSS ، و به غیر از Excel وجود دارد. رگرسیون می تواند تصویر بزرگی در مورد روابط بین متغیرها به ما بدهد. رگرسیون خطی را می توان به سرعت در اکسل با استفاده از ابزار تحلیل داده انجام داد. این مقاله نشان می دهد که چگونه می توانید نتایج رگرسیون را در اکسل تفسیر کنید.

دانلود کتاب تمرین تمرین

این کتاب تمرینی را در زیر دانلود کنید.

تفسیر رگرسیون Results.xlsx

رگرسیون چیست؟

تحلیل رگرسیون اغلب در تجزیه و تحلیل داده ها برای تعیین ارتباط بین متغیرهای متعدد استفاده می شود. تحلیل رگرسیون به شما این امکان را می دهد که انتخاب کنید در صورت تغییر یکی از متغیرهای مستقل چه اتفاقی برای متغیر وابسته می افتد. همچنین به شما این امکان را می‌دهد که از نظر ریاضی بفهمید که کدام متغیرهای مستقل تأثیر دارند.

رگرسیون خطی ساده با رگرسیون خطی چندگانه در آمار متمایز است. با استفاده از یک تابع خطی، رگرسیون خطی ساده ارتباط بین متغیرها و یک متغیر مستقل را تجزیه و تحلیل می کند. رگرسیون خطی چندگانه زمانی است که از دو یا چند عامل توضیحی برای تعیین متغیرها استفاده می شود. استفاده از رگرسیون غیرخطی به جای متغیر وابسته به عنوان یک تابع غیرخطی توصیف می شود زیرا روابط داده ها خطی نیستند. این مقاله بر روی خطی چندگانه متمرکز خواهد شدرگرسیون برای نشان دادن اینکه چگونه می‌توانید نتایج رگرسیون را در اکسل تفسیر کنید.

مراحل انجام رگرسیون در اکسل

برای اهداف رگرسیون، از مجموعه داده زیر برای اهداف تجزیه و تحلیل در اینجا متغیر مستقل ستون قیمت و ستون فروش خواهد بود. ستون مستقل ستون تقاضا خواهد بود.

مراحل

  • برای انجام رگرسیون باید به تب داده برویم و روی تحلیل داده کلیک کنیم تا رگرسیون انجام دهیم .

  • یک پنجره جدید وجود خواهد داشت. متغیر وابسته و محدوده داده متغیر مستقل را انتخاب کنید.
  • سپس کادر Labels و کادر Confidence را علامت بزنید.
  • سپس بر روی محدوده سلول خروجی کلیک کنید. کادر برای انتخاب آدرس سلول خروجی
  • بعد، روی Residual تیک بزنید تا باقیمانده ها محاسبه شود.
  • بعد از آن، نمودارهای Residual را علامت بزنید و کادرهای Line Fit Plots
  • پس از این OK کلیک کنید.

  • پس از کلیک کردن خوب، پارامترهای خروجی اولیه تجزیه و تحلیل در سلول های مشخص شده خواهد بود.

  • سپس چند پارامتر را نیز دریافت خواهید کرد. مانند اهمیت مقدار و غیره در جدول ANOVA ( Analysis of Variance ).
  • در اینجا، df نشان دهنده درجه آزادی مربوط به منبع واریانس است.
  • SS نشان دهنده مجموع مربعات است. اگر مدل شما داده ها را بهتر منعکس کند Residual SS کوچکتر از Total SS است.
  • MS به معنای مربع است.
  • F نشان‌دهنده آزمون F برای فرضیه صفر است.
  • اهمیت F نشان‌دهنده P -مقدار F است.

  • سپس ضرایب متغیر، مقدار معنی‌داری و غیره را نیز در یک جدول دریافت خواهید کرد.

  • سپس یک جدول نهایی در زیر جدول ضریب دریافت خواهید کرد که حاوی مقدار باقیمانده برای هر ورودی است.

  • سپس نمودار رگرسیون تقاضا در مقابل قیمت را با خط روند دریافت خواهید کرد.

  • بعد از این، نمودار رگرسیون تقاضا در مقابل فروش را با یک خط روند دریافت می کنید.

  • یکی دیگر وجود دارد نمودار توزیع باقیمانده هر ورودی از متغیر فروش را نشان می دهد.

  • نمودار دیگری وجود دارد که توزیع باقیمانده ها را نشان می دهد هر ورودی از متغیر Price .

بعد، به شما نشان خواهیم داد که چگونه می توانید n این نتایج رگرسیون را در اکسل تفسیر کنید.

بیشتر بخوانید: نحوه انجام رگرسیون لجستیک در اکسل (با مراحل سریع)

نحوه تفسیر نتایج رگرسیون در اکسل

کار بعدی که باید بعد از انجام تحلیل رگرسیون انجام دهید و آنها را تفسیر کنید. نتایج در زیر شرح داده شده و به تفصیل توضیح داده شده است.عدد R-squared نشان می دهد که عناصر مجموعه داده چقدر به هم مرتبط هستند و خط رگرسیون چقدر با داده ها مطابقت دارد. ما قصد داریم از تحلیل رگرسیون خطی چندگانه استفاده کنیم که در آن تاثیر دو یا چند متغیر بر عامل اصلی را تعیین می کنیم. این به چگونگی تغییر متغیر وابسته به عنوان یکی از متغیرهای مستقل اشاره دارد. دامنه این ضریب از 1- تا 1 است. در اینجا

  • 1 به معنای رابطه مثبت نزدیک است
  • 0 به این معنی است که هیچ رابطه ای بین متغیرها وجود ندارد. به عبارت دیگر، نقاط داده تصادفی هستند.
  • -1 به معنای رابطه معکوس یا منفی بین متغیرها است.

در نتایج خروجی نشان داده شده در بالا، مقدار R چندگانه داده شده است. مجموعه داده ها o.7578 است ( تقریبا )، که نشان دهنده روابط قوی بین متغیرها است.

R مربع

R مربع value توضیح می دهد که چگونه پاسخ متغیرهای وابسته به متغیر مستقل تغییر می کند. در مورد ما، مقدار 0.574 (تقریبا) است، که می تواند به عنوان یک رابطه منطقی خوب بین متغیرها تفسیر شود.

Adjusted R-Squared

این صرفا یک نسخه جایگزین از مقدار R مربع . این به سادگی متغیرهای پیش بینی را در حین پیش بینی متغیر پاسخ به هم می زند. به صورت

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)] <3 محاسبه می شود>

در اینجا، R^2 : مقدار R^2 که ما از آن گرفتیممجموعه داده.

n : تعداد مشاهدات.

K : تعداد متغیرهای پیش بینی کننده.

اهمیت این مقدار هنگام انجام تجزیه و تحلیل رگرسیون بین دو متغیر پیش بینی بوجود می آید. اگر بیش از یک متغیر پیش بینی در مجموعه داده وجود داشته باشد، آنگاه مقدار مربع R افزایش می یابد که بسیار نامطلوب است. مقدار تنظیم‌شده R مربع این تورم را تنظیم می‌کند و تصویر دقیقی از متغیرها ارائه می‌کند.

خطای استاندارد

یکی دیگر از معیارهای مناسب بودن که نشان دهنده دقت تحلیل رگرسیون شماست. هرچه مقدار کمتر باشد، مطمئن‌تر می‌توانید در تحلیل رگرسیون خود باشید.

خطای استاندارد یک معیار تجربی است که میانگین فاصله نقاط از خط روند را نشان می‌دهد. در مقابل، R2 نسبت تغییرات متغیر وابسته را نشان می دهد. در این مورد، مقدار خطای استاندارد 288.9 است ( تقریبا )، که بیانگر این است که نقاط داده ما، به طور متوسط، 288.9 از خط روند افت می کنند.

<. 1> مشاهدات

تعداد مشاهدات یا ورودی ها را مشخص کنید.

تعیین متغیر مهم

مقدار اهمیت نشان دهنده قابل اعتماد بودن (از نظر آماری) تحلیل ما است. به عبارت دیگر، احتمال اشتباه بودن مجموعه داده های ما را نشان می دهد. این مقدار باید کمتر از 5 درصد باشد. اما در این مورد، مقدار اهمیت ما 0.00117 است،که به 0.1٪ ترجمه می شود که بسیار کمتر از 5٪ است. پس تحلیل ما خوب است. در غیر این صورت، ممکن است مجبور شویم متغیرهای مختلفی را برای تجزیه و تحلیل خود انتخاب کنیم.

P-value در تحلیل رگرسیون

به طور نزدیک به یک مقدار قابل توجه، P- مرتبط است. value نشان دهنده احتمال اشتباه بودن مقدار ضریب است. P-value نشان دهنده ارتباط فرضیه صفر با متغیرها است.

اگر p-value < عدد اهمیت ، شواهد کافی برای رد فرضیه ارزش صفر وجود دارد. این به این معنی است که یک همبستگی غیر صفر بین متغیرها وجود دارد.

اما اگر مقدار p-value > Significance مقدار، شواهد کافی برای رد این متغیر وجود نخواهد داشت. فرضیه صفر. این نشان می‌دهد که هیچ ارتباطی بین متغیرها وجود ندارد.

در هر صورت، P-value متغیر Price =0.000948 < 0.00117 (مقدار اهمیت)،

بنابراین هیچ فرضیه صفری در اینجا وجود ندارد و شواهد کافی برای اعلام همبستگی بین متغیرها وجود دارد.

از سوی دیگر، برای متغیر فروش ، (P-value) 0.0038515 < 0.0011723 (مقدار معناداری)

بنابراین ممکن است یک فرضیه صفر در اینجا وجود داشته باشد و شواهد کافی برای اعلام همبستگی غیر صفر بین متغیرها وجود ندارد.

در اکثر موارد، این P -value تعیین می کند که آیا یک متغیر در مجموعه داده خواهد بود یا خیر. به عنوان مثال، ما باید Sold را حذف کنیممتغیر برای حفظ استحکام مجموعه داده.

معادله رگرسیون

همانطور که تحلیل رگرسیون خطی را در اکسل تعیین می کنیم، خط روند نیز باید خطی باشد. شکل کلی این است:

Y=mX+C.

در اینجا، Y متغیر وابسته است.

و X در اینجا متغیر مستقل است، به این معنی که ما تأثیر تغییر متغیر x را بر روی متغیر Y تعیین خواهیم کرد.

C فقط مقدار تقاطع محور Y خواهد بود. خط.

در این مورد، مقدار C  برابر با 9502.109853 است

و مقدار m برای دو متغیر 809.265- و 0.424818 است.

0>بنابراین، معادله نهایی دو متغیر مجزا را داریم.

اولین معادله این است:

Y=-809.265771X+9502.12

و معادله متغیر دوم این است:

Y=0.4248X+9502.12

ضرایب

ضرایبی که به دست آوردیم m1=-809.2655 و m2=04248 هستند. و رهگیر، C= 9502.12 .

  • اول، مقدار رهگیر نشان می دهد که وقتی قیمت صفر باشد، تقاضا 9502 خواهد بود.
  • و مقادیر m نشان دهنده نرخ تغییر تقاضا به ازای هر واحد تغییر قیمت است. مقدار ضریب قیمت 809.265- است که نشان می دهد افزایش هر واحد قیمت باعث کاهش تقاضا به میزان تقریبی 809 واحد می شود.
  • برای متغیر دوم، Sold، مقدار m برابر 0.424 است. این نشان می دهد که تغییر در هر واحد کالای فروخته شدهمنجر به افزایش واحد زمان 0424 محصول می شود.

باقیمانده

باقیمانده تفاوت بین اصلی و محاسبه شده ورود از خط رگرسیون تفاوت است. Residuals نشان می دهد که مقدار واقعی چقدر از خط فاصله دارد. به عنوان مثال، ورودی محاسبه شده از تحلیل رگرسیون برای ورودی اول 9497 است. و اولین مقدار اصلی 9500 است. بنابراین باقیمانده حدود 2.109 است.

T-Statistics Value

مقدار T-statics تقسیم ضریب بر مقدار استاندارد است. هر چه مقدار بالاتر باشد، قابلیت اطمینان بهتر ضریب را نشان می دهد.

این مقدار اهمیت دیگری نیز دارد که برای محاسبه P-value لازم است.

فاصله اطمینان 95%

در اینجا اطمینان متغیری که در ابتدا 95 تعیین کردیم. اگرچه ممکن است تغییر کند.

  • در اینجا، مقدار ضریب 95% پایینی 8496.84 محاسبه می‌شود، یعنی 95% بالا به صورت 10507.37 محاسبه می‌شود،
  • این بدان معناست که در حالی که ما ضریب اصلی حدود 9502.1 است. احتمال زیادی وجود دارد که مقدار می تواند زیر 8496 برای 95٪ موارد و 5٪ احتمال بالای 10507.37 باشد

بیشتر بخوانید:

چیزهایی که باید به خاطر بسپارید

روش تحلیل رگرسیون صرفاً رابطه بین متغیرهای مورد بررسی را ارزیابی می کند. علیت را ایجاد نمی کند. از جهات دیگر فقط جنبههمبستگی را در نظر می گیرد. وقتی عملی باعث چیزی می شود، تبدیل به علت می شود. هنگامی که تغییر یک متغیر تغییراتی ایجاد می کند، می توان آن را علت در نظر گرفت. قبل از انجام تجزیه و تحلیل، همه انواع نقاط پرت باید حذف شوند. برای تجزیه و تحلیل و تفسیر نتایج تجزیه و تحلیل رگرسیون در اکسل، باید این نکات را در نظر بگیرید.

نتیجه گیری

به طور خلاصه، به سؤال "چگونه نتایج رگرسیون را در اکسل تفسیر کنیم" به طور مفصل پاسخ داده شده است. تجزیه و تحلیل و بعداً تفسیر آن. تجزیه و تحلیل از طریق ابزار تجزیه و تحلیل داده ها در تب داده انجام می شود.

برای این مشکل، یک کتاب کار برای دانلود در دسترس است که در آن می توانید تحلیل رگرسیون را تمرین کرده و تفسیر کنید. آن را.

در صورت تمایل هر گونه سوال یا بازخوردی را از طریق بخش نظرات بپرسید. هر پیشنهادی برای بهبود جامعه Exceldemy بسیار قابل قدردانی خواهد بود.

هیو وست یک مربی و تحلیلگر اکسل بسیار با تجربه با بیش از 10 سال تجربه در این صنعت است. وی دارای مدرک لیسانس در رشته حسابداری و امور مالی و مدرک کارشناسی ارشد در رشته مدیریت بازرگانی است. هیو علاقه زیادی به تدریس دارد و یک رویکرد آموزشی منحصر به فرد ایجاد کرده است که به راحتی قابل پیگیری و درک است. دانش تخصصی او از اکسل به هزاران دانش آموز و متخصص در سراسر جهان کمک کرده تا مهارت های خود را بهبود بخشند و در حرفه خود برتری پیدا کنند. هیو از طریق وبلاگ خود دانش خود را با جهان به اشتراک می گذارد و آموزش های رایگان اکسل و آموزش آنلاین ارائه می دهد تا به افراد و مشاغل کمک کند تا به پتانسیل کامل خود دست یابند.