সুচিপত্র
রিগ্রেশন বিশ্লেষণ প্রায় প্রতিটি ধরণের পরিসংখ্যানগত সফ্টওয়্যার যেমন SPSS , R, এবং এক্সেল উল্লেখ না করে। রিগ্রেশন আমাদের ভেরিয়েবলের মধ্যে সম্পর্ক সম্পর্কে বড় ছবি দিতে পারে। ডেটা অ্যানালাইসিস টুল ব্যবহার করে এক্সেলে লিনিয়ার রিগ্রেশন খুব দ্রুত করা যেতে পারে। এই নিবন্ধটি দেখাবে কিভাবে আপনি এক্সেল-এ রিগ্রেশন ফলাফল ব্যাখ্যা করতে পারেন।
অভ্যাস ওয়ার্কবুক ডাউনলোড করুন
নিচের এই অনুশীলন ওয়ার্কবুকটি ডাউনলোড করুন।
রিগ্রেশনের ব্যাখ্যা করুন Results.xlsx
রিগ্রেশন কি?
অধিগমন বিশ্লেষণ প্রায়শই ডেটা বিশ্লেষণে একাধিক ভেরিয়েবলের মধ্যে সম্পর্ক নির্ধারণ করতে ব্যবহৃত হয়। রিগ্রেশন বিশ্লেষণ আপনাকে স্বাধীন ভেরিয়েবলের একটি পরিবর্তন করলে নির্ভরশীল ভেরিয়েবলের কী হবে তা চয়ন করতে দেয়। এটি আপনাকে গাণিতিকভাবে বের করতে দেয় কোন স্বাধীন ভেরিয়েবলের প্রভাব রয়েছে।
সরল রৈখিক রিগ্রেশন পরিসংখ্যানে মাল্টিপল লিনিয়ার রিগ্রেশন থেকে আলাদা। একটি রৈখিক ফাংশন ব্যবহার করে, সরল রৈখিক রিগ্রেশন বিশ্লেষণ করে ভেরিয়েবল এবং একটি স্বাধীন পরিবর্তনশীলের মধ্যে সম্পর্ক। মাল্টিপল লিনিয়ার রিগ্রেশন যখন ভেরিয়েবল নির্ধারণ করতে দুই বা ততোধিক ব্যাখ্যামূলক ফ্যাক্টর ব্যবহার করা হয়। নির্ভরশীল ভেরিয়েবলের পরিবর্তে ননলিনিয়ার রিগ্রেশন ব্যবহার করাকে একটি ননলাইনার ফাংশন হিসাবে বর্ণনা করা হয়েছে যেহেতু ডেটা সম্পর্কগুলি রৈখিক নয়। এই নিবন্ধটি একাধিক রৈখিক উপর মনোনিবেশ করবেরিগ্রেশন প্রদর্শনের জন্য কিভাবে আপনি এক্সেল-এ রিগ্রেশন ফলাফল ব্যাখ্যা করতে পারেন ।
এক্সেলে রিগ্রেশন করার পদক্ষেপ
রিগ্রেশনের উদ্দেশ্যে, আমরা নিচের ডেটাসেট ব্যবহার করব বিশ্লেষণের উদ্দেশ্য। এখানে স্বাধীন ভেরিয়েবল হবে মূল্য কলাম এবং বিক্রীত কলাম। স্বাধীন কলামটি হবে ডিমান্ড কলাম।
পদক্ষেপ
- আমাদের ডেটা ট্যাবে যেতে হবে এবং রিগ্রেশন করতে ডেটা অ্যানালাইসিস এ ক্লিক করতে হবে ।
- একটি নতুন উইন্ডো থাকবে; নির্ভরশীল ভেরিয়েবল এবং স্বাধীন পরিবর্তনশীল ডেটা পরিসর নির্বাচন করুন।
- তারপর লেবেল বক্স এবং বিশ্বাস বক্সে টিক দিন।
- তারপর আউটপুট সেল পরিসরে ক্লিক করুন আউটপুট ঘরের ঠিকানা নির্বাচন করার জন্য বক্স
- এরপর, অবশিষ্টাংশগুলি গণনা করতে অবশিষ্ট তে টিক দিন।
- এর পরে, অবশিষ্ট প্লটগুলিতে টিক দিন এবং লাইন ফিট প্লট বক্স
- এর পরে ঠিক আছে এতে ক্লিক করুন।
- ক্লিক করার পর ঠিক আছে, বিশ্লেষণের প্রাথমিক আউটপুট প্যারামিটারগুলি নির্দিষ্ট সেলগুলিতে থাকবে৷
- তারপর আপনি কিছু প্যারামিটারও পাবেন যেমন ANOVA ( ভ্যারিয়েন্সের বিশ্লেষণ ) টেবিলে তাৎপর্য মান ইত্যাদি।
- এখানে, df বোঝায় পার্থক্যের উৎসের সাথে সম্পর্কিত স্বাধীনতার মাত্রা।
- SS বর্গক্ষেত্রের সমষ্টিকে বোঝায়। আপনার মডেল তথ্য প্রতিফলিত হবে ভাল যদি অবশিষ্ট SS মোট SS থেকে ছোট।
- MS মানে বর্গক্ষেত্র।
- F শূন্য অনুমানের জন্য F -পরীক্ষা বোঝায়।
- তাৎপর্য F বোঝায় F -এর P -মান। >>>>>>>
- তারপর আপনি সহগ সারণীর নীচে একটি চূড়ান্ত টেবিল পাবেন যেখানে প্রতিটি এন্ট্রির জন্য অবশিষ্ট মান রয়েছে।
- এরপর, আপনি একটি ট্রেন্ডলাইন সহ ডিমান্ড বনাম মূল্য রিগ্রেশন চার্ট পাবেন।
- পরে এটি, আপনি একটি ট্রেন্ডলাইন সহ ডিমান্ড বনাম বিক্রীত রিগ্রেশন চার্ট পাবেন৷
- আরেকটি আছে চার্ট বিক্রীত ভেরিয়েবল থেকে প্রতিটি এন্ট্রির অবশিষ্টাংশের বন্টন দেখায়।
- অন্য একটি চার্ট রয়েছে যা অবশিষ্টাংশের বিতরণ দেখায় প্রতিটি এন্ট্রির মূল্য ভেরিয়েবল থেকে।
পরবর্তী, আমরা আপনাকে দেখাব কিভাবে আপনি n এক্সেলে এই রিগ্রেশন ফলাফলগুলিকে ব্যাখ্যা করুন।
আরো পড়ুন: এক্সেলে লজিস্টিক রিগ্রেশন কীভাবে করবেন (দ্রুত পদক্ষেপ সহ)
কীভাবে ব্যাখ্যা করবেন এক্সেলে রিগ্রেশন ফলাফল
রিগ্রেশন বিশ্লেষণ করার পর আপনাকে যা করতে হবে এবং সেগুলি ব্যাখ্যা করতে হবে। ফলাফলগুলি নীচে বর্ণিত এবং বিশদভাবে বর্ণনা করা হয়েছে৷
মাল্টিপল R-স্কোয়ার রিগ্রেশন ভ্যালু অ্যানালাইসিস
R-squared সংখ্যা নির্দেশ করে যে ডেটাসেটের উপাদানগুলি কতটা ঘনিষ্ঠভাবে সম্পর্কিত এবং রিগ্রেশন লাইনটি ডেটার সাথে কতটা ভালভাবে মেলে। আমরা একাধিক রৈখিক রিগ্রেশন বিশ্লেষণ ব্যবহার করতে যাচ্ছি, যেখানে আমরা প্রধান ফ্যাক্টরের উপর দুই বা ততোধিক ভেরিয়েবলের প্রভাব নির্ধারণ করতে যাচ্ছি। এটি বোঝায় কিভাবে নির্ভরশীল ভেরিয়েবল পরিবর্তন হয় যেমন একটি স্বাধীন ভেরিয়েবল পরিবর্তন হয়। এই সহগের পরিসীমা -1 থেকে 1 পর্যন্ত। এখানে,
- 1 মানে একটি ঘনিষ্ঠ ইতিবাচক সম্পর্ক
- 0 মানে ভেরিয়েবলের মধ্যে কোনো সম্পর্ক নেই। অন্য কথায়, ডাটা পয়েন্টগুলো এলোমেলো।
- -1 মানে ভেরিয়েবলের মধ্যে বিপরীত বা নেতিবাচক সম্পর্ক।
উপরে দেখানো আউটপুট ফলাফলে, প্রদত্ত একাধিক R-মান। ডেটা সেট হল o.7578( প্রায় ), যা ভেরিয়েবলের মধ্যে শক্তিশালী সম্পর্ক নির্দেশ করে।
R স্কোয়ার
R বর্গ মান ব্যাখ্যা করে কিভাবে নির্ভরশীল ভেরিয়েবলের প্রতিক্রিয়া স্বাধীন পরিবর্তনশীলের সাথে পরিবর্তিত হয়। আমাদের ক্ষেত্রে, মান হল 0.574(প্রায়), যা ভেরিয়েবলের মধ্যে একটি যুক্তিসঙ্গতভাবে ঠিক সম্পর্ক হিসাবে ব্যাখ্যা করা যেতে পারে।
সামঞ্জস্য করা R-স্কোয়ার
এটি শুধুমাত্র R বর্গ মানের একটি বিকল্প সংস্করণ। প্রতিক্রিয়া ভেরিয়েবলের পূর্বাভাস দেওয়ার সময় এটি কেবল ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলিকে এলোমেলো করে। এটি হিসাবে গণনা করা হয়
R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]
এখানে, R^2 : যে R^2 মান আমরা পেয়েছিডেটাসেট।
n : পর্যবেক্ষণের সংখ্যা।
K : ভবিষ্যদ্বাণীকারী ভেরিয়েবলের সংখ্যা।
তাৎপর্য দুটি ভবিষ্যদ্বাণীকারী ভেরিয়েবলের মধ্যে রিগ্রেশন বিশ্লেষণ করার সময় এই মানের উদ্ভব হয়। যদি ডেটাসেটে একাধিক ভবিষ্যদ্বাণী ভেরিয়েবল থাকে, তাহলে R বর্গ মান স্ফীত হবে, যা অত্যন্ত অনাকাঙ্ক্ষিত। সামঞ্জস্য করা R বর্গক্ষেত্র মান এই মুদ্রাস্ফীতিকে সামঞ্জস্য করে এবং ভেরিয়েবলের একটি সঠিক চিত্র দেয়।
স্ট্যান্ডার্ড ত্রুটি
আরেকটি ভাল-অফ-ফিট মেট্রিক এটি আপনার রিগ্রেশন বিশ্লেষণের যথার্থতা নির্দেশ করে; মান যত কম হবে, আপনি আপনার রিগ্রেশন বিশ্লেষণে তত বেশি নিশ্চিত হতে পারবেন।
মানক ত্রুটি হল একটি অভিজ্ঞতামূলক মেট্রিক যা গড় দূরত্বের প্রতিনিধিত্ব করে যে পয়েন্টগুলি ট্রেন্ডলাইন থেকে বিচ্যুত হয়। বিপরীতে, R2 নির্ভরশীল পরিবর্তনশীল পরিবর্তনের অনুপাতকে উপস্থাপন করে। এই ক্ষেত্রে, স্ট্যান্ডার্ড ত্রুটি এর মান হল 288.9 ( প্রায় ), যা বোঝায় যে আমাদের ডেটা পয়েন্টগুলি, গড়ে, ট্রেন্ডলাইন থেকে 288.9 কমে যায়৷
পর্যবেক্ষণ
অবজারভেশন বা এন্ট্রির সংখ্যা নির্দেশ করুন।
গুরুত্বপূর্ণ পরিবর্তনশীল নির্ধারণ করুন
তাৎপর্য মান আমাদের বিশ্লেষণের বিশ্বস্ততা (পরিসংখ্যানগতভাবে ভাল) নির্দেশ করে। অন্য কথায়, এটি আমাদের ডেটাসেটের ভুল হওয়ার সম্ভাবনাকে বোঝায়। এই মান 5% এর নিচে হওয়া উচিত। কিন্তু এই ক্ষেত্রে, আমাদের তাৎপর্য মান হল 0.00117,যা 0.1%-এ অনুবাদ করে, যা 5%-এর নীচে। তাই আমাদের বিশ্লেষণ ঠিক আছে. অন্যথায়, আমাদের বিশ্লেষণের জন্য আমাদের বিভিন্ন ভেরিয়েবল বেছে নিতে হতে পারে।
রিগ্রেশন বিশ্লেষণে পি-মান
একটি উল্লেখযোগ্য মানের সাথে ঘনিষ্ঠভাবে যুক্ত, P- মান সহগ মান ভুল হওয়ার সম্ভাবনা বোঝায়। P-মান ভেরিয়েবলের সাথে নাল হাইপোথিসিসের সংযোগকে বোঝায়।
যদি আপনার p-মান < তাৎপর্য সংখ্যা, শূন্য মান অনুমান প্রত্যাখ্যান করার জন্য যথেষ্ট প্রমাণ রয়েছে। এর মানে ভেরিয়েবলের মধ্যে একটি অ-শূন্য পারস্পরিক সম্পর্ক রয়েছে।
কিন্তু যদি p-মান > তাৎপর্য মান হয়, তাহলে খারিজ করার জন্য অপর্যাপ্ত প্রমাণ থাকবে। শূন্য অনুমান। এটি বোঝায় যে ভেরিয়েবলের মধ্যে কোন সম্পর্ক থাকতে পারে না।
অথবা ক্ষেত্রে, পরিবর্তনশীলের P-মান মূল্য =0.000948 < 0.00117 (তাৎপর্য মান),
সুতরাং এখানে কোন শূন্য হাইপোথিসিস চলছে না, এবং ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক ঘোষণা করার জন্য যথেষ্ট প্রমাণ রয়েছে।
অন্যদিকে, পরিবর্তনশীল <1 এর জন্য>বিক্রীত , (P-মান) 0.0038515 < 0.0011723 (তাৎপর্য মান)
সুতরাং এখানে একটি শূন্য হাইপোথিসিস চলছে, এবং ভেরিয়েবলের মধ্যে একটি অ-শূন্য পারস্পরিক সম্পর্ক ঘোষণা করার জন্য যথেষ্ট প্রমাণ নেই।
বেশিরভাগ ক্ষেত্রে, এই পি -মান নির্ধারণ করে যে একটি ভেরিয়েবল ডেটাসেটে থাকবে কি না। উদাহরণস্বরূপ, আমাদের বিক্রীত অপসারণ করা উচিতডেটাসেটের মজবুততা রক্ষা করার জন্য ভেরিয়েবল।
রিগ্রেশন ইকুয়েশন
যেহেতু আমরা এক্সেলে রৈখিক রিগ্রেশন বিশ্লেষণ নির্ধারণ করি, ট্রেন্ড লাইনটিও লিনিয়ার হওয়া উচিত। সাধারণ ফর্ম হল:
Y=mX+C.
এখানে, Y নির্ভরশীল চলক৷
এবং X হল এখানে স্বাধীন চলক, যার অর্থ হল আমরা পরিবর্তনশীল x-এর পরিবর্তনের প্রভাব Y-এর উপর নির্ধারণ করব।
C হবে শুধু Y-অক্ষের ছেদ-এর মান। লাইন।
এই ক্ষেত্রে, C ইন্টারসেপ্টের মান 9502.109853 এর সমান
এবং দুটি ভেরিয়েবলের জন্য m এর মান হল -809.265 এবং 0.424818।
সুতরাং, আমাদের কাছে দুটি পৃথক চলকের জন্য চূড়ান্ত সমীকরণ রয়েছে।
প্রথমটি হল:
Y=-809.265771X+9502.12এবং দ্বিতীয় চলকের সমীকরণ হল:
Y=0.4248X+9502.12সহগ
আমরা যে সহগগুলি পেয়েছি তা হল m1=-809.2655 এবং m2=04248 । এবং ইন্টারসেপ্টর, C= 9502.12 ।
- প্রথম, ইন্টারসেপ্টরের মান নির্দেশ করে যে দাম শূন্য হলে চাহিদা 9502 হবে।
- এবং এর মান m মূল্য পরিবর্তনের একক প্রতি চাহিদা পরিবর্তনের হার বোঝায়। মূল্য সহগ মান হল -809.265, যা ইঙ্গিত করে যে প্রতি ইউনিট মূল্য বৃদ্ধির ফলে চাহিদা প্রায় 809 ইউনিট কমে যাবে।
- দ্বিতীয় ভেরিয়েবলের জন্য, বিক্রি হয়েছে, m মান হল 0.424। এটি প্রতি ইউনিট বিক্রি আইটেম পরিবর্তন বোঝায়এর ফলে পণ্যের 0424-সময়ের ইউনিট বৃদ্ধি পাবে।
অবশিষ্ট
মূল এবং গণনার মধ্যে অবশিষ্ট পার্থক্য রিগ্রেশন লাইন থেকে এন্ট্রি পার্থক্য. অবশিষ্ট নির্দেশ করে যে প্রকৃত মান রেখা থেকে কতটা দূরে। উদাহরণস্বরূপ, প্রথম এন্ট্রির রিগ্রেশন বিশ্লেষণ থেকে গণনা করা এন্ট্রি হল 9497৷ এবং প্রথম মূল মান হল 9500৷ সুতরাং অবশিষ্টাংশ হল প্রায় 2.109৷
টি-পরিসংখ্যান মান
টি-স্ট্যাটিক্স মান হল প্রমিত মান দ্বারা গুণাঙ্কের বিভাজন। মান যত বেশি হবে, গুণাঙ্কের তত ভালো নির্ভরযোগ্যতা নির্দেশ করে।
এই মানের আরেকটি তাৎপর্য রয়েছে, যেটি P-মান গণনা করার জন্য প্রয়োজন।
95% কনফিডেন্স ইন্টারভাল
এখানে ভেরিয়েবলের কনফিডেন্স আমরা শুরুতে 95 হিসাবে সেট করেছি। যদিও এটি পরিবর্তিত হতে পারে।
- এখানে, নিচের 95% এর সহগ মানকে 8496.84 হিসাবে গণনা করা হয়েছে মানে উপরের 95%টিকে 10507.37 হিসাবে গণনা করা হয়েছে,
- এর মানে হল যখন আমাদের প্রধান সহগ হল, 9502.1. 95% ক্ষেত্রে মানটি 8496-এর নিচে হওয়ার সম্ভাবনা বেশি এবং 10507.37
আরও পড়ুন:
মনে রাখার মতো বিষয়
✎ রিগ্রেশন বিশ্লেষণ পদ্ধতি শুধুমাত্র পরীক্ষার অধীনে ভেরিয়েবলের মধ্যে সম্পর্ককে মূল্যায়ন করে। এটি কার্যকারণ প্রতিষ্ঠা করে না। অন্য উপায়ে, শুধুমাত্র দিকপারস্পরিক সম্পর্ক বিবেচনা করে। যখন কিছু কাজ কিছু ঘটায়, তখন তা কার্যকারণে পরিণত হয়। যখন একটি ভেরিয়েবলের পরিবর্তন পরিবর্তনের সৃষ্টি করে, তখন এটিকে কার্যকারণ হিসেবে বিবেচনা করা যেতে পারে।
✎ রিগ্রেশন বিশ্লেষণ আউটলায়ারদের দ্বারা ব্যাপকভাবে বাধাগ্রস্ত হয়। বিশ্লেষণ সম্পন্ন করার আগে সমস্ত ধরণের বহিরাগত অপসারণ করা আবশ্যক। এক্সেলে রিগ্রেশন বিশ্লেষণের ফলাফল বিশ্লেষণ ও ব্যাখ্যা করার জন্য, আপনাকে এই পয়েন্টগুলি বিবেচনা করতে হবে।
উপসংহার
এটি সংক্ষেপে বলতে গেলে, "এক্সেলে রিগ্রেশন ফলাফলগুলি কীভাবে ব্যাখ্যা করা যায়" প্রশ্নের উত্তর বিশদভাবে দেওয়া হয়েছে বিশ্লেষণ এবং পরে তা ব্যাখ্যা করা। বিশ্লেষণটি ডেটা ট্যাবে ডেটা অ্যানালাইসিস টুলের মাধ্যমে করা হয়।
এই সমস্যার জন্য, একটি ওয়ার্কবুক ডাউনলোডের জন্য উপলব্ধ যেখানে আপনি রিগ্রেশন বিশ্লেষণ এবং ব্যাখ্যা অনুশীলন করতে পারেন। এটা।
কমেন্ট সেকশনের মাধ্যমে যেকোনো প্রশ্ন বা প্রতিক্রিয়া জিজ্ঞাসা করতে দ্বিধা বোধ করুন। Exceldemy সম্প্রদায়ের উন্নতির জন্য যেকোনো পরামর্শ অত্যন্ত প্রশংসনীয় হবে।