როგორ განვმარტოთ რეგრესიის შედეგები Excel-ში (დეტალური ანალიზი)

  • გააზიარეთ ეს
Hugh West

რეგრესიის ანალიზი თითქმის ყველა ტიპის სტატისტიკურ პროგრამაშია, როგორიცაა SPSS , R, და რომ აღარაფერი ვთქვათ Excel-ში. რეგრესიას შეუძლია მოგვცეს დიდი სურათი ცვლადებს შორის ურთიერთობების შესახებ. ხაზოვანი რეგრესია შეიძლება საკმაოდ სწრაფად განხორციელდეს Excel-ში მონაცემთა ანალიზის ხელსაწყოს გამოყენებით. ეს სტატია გაჩვენებთ, თუ როგორ შეგიძლიათ რეგრესიის შედეგების ინტერპრეტაცია Excel-ში.

ჩამოტვირთეთ პრაქტიკის სამუშაო წიგნი

ჩამოტვირთეთ ეს პრაქტიკული სამუშაო წიგნი ქვემოთ.

რეგრესიის შედეგების ინტერპრეტაცია.xlsx

რა არის რეგრესია?

რეგრესიული ანალიზი ხშირად გამოიყენება მონაცემთა ანალიზში მრავალ ცვლადს შორის ასოციაციების დასადგენად. რეგრესიის ანალიზი საშუალებას გაძლევთ აირჩიოთ რა დაემართება დამოკიდებულ ცვლადს, თუ რომელიმე დამოუკიდებელი ცვლადი შეიცვლება. ის ასევე საშუალებას გაძლევთ გაარკვიოთ მათემატიკურად რომელ დამოუკიდებელ ცვლადებს აქვთ გავლენა.

მარტივი წრფივი რეგრესია განსხვავდება მრავალჯერადი წრფივი რეგრესიისგან სტატისტიკაში. წრფივი ფუნქციის გამოყენებით მარტივი წრფივი რეგრესია აანალიზებს ცვლადებსა და ერთ დამოუკიდებელ ცვლადს შორის კავშირს. მრავალჯერადი წრფივი რეგრესია არის, როდესაც ორი ან მეტი ახსნა-განმარტებადი ფაქტორი გამოიყენება ცვლადების დასადგენად. არაწრფივი რეგრესიის გამოყენება დამოკიდებული ცვლადის ნაცვლად აღწერილია, როგორც არაწრფივი ფუნქცია, რადგან მონაცემთა მიმართებები არ არის წრფივი. ეს სტატია კონცენტრირებული იქნება მრავალ წრფივზერეგრესია იმის დემონსტრირებისთვის, თუ როგორ შეგიძლიათ რეგრესიის შედეგების ინტერპრეტაცია Excel-ში.

ნაბიჯები Excel-ში რეგრესიის გასაკეთებლად

რეგრესიის მიზნებისთვის, ჩვენ გამოვიყენებთ ქვემოთ მოცემულ მონაცემთა ნაკრებს ანალიზის მიზნები. აქ დამოუკიდებელი ცვლადი იქნება ფასი სვეტი და გაყიდული სვეტი. დამოუკიდებელი სვეტი იქნება მოთხოვნის სვეტი.

ნაბიჯები

  • ჩვენ უნდა გადავიდეთ მონაცემები ჩანართზე და დააწკაპუნოთ მონაცემთა ანალიზი რეგრესიის გასაკეთებლად .

  • იქნება ახალი ფანჯარა; აირჩიეთ დამოკიდებული ცვლადი და დამოუკიდებელი ცვლადი მონაცემთა დიაპაზონი.
  • შემდეგ მონიშნეთ Labels ველი და Confidence box.
  • შემდეგ დააწკაპუნეთ გამომავალი უჯრედების დიაპაზონზე უჯრა გამომავალი უჯრედის მისამართის შესარჩევად
  • შემდეგი, მონიშნეთ ნარჩენი ნარჩენების გამოსათვლელად.
  • ამის შემდეგ მონიშნეთ ნარჩენი ნახაზები და Line Fit Plots-ის ველები
  • დააწკაპუნეთ OK ამის შემდეგ.

  • დაწკაპუნების შემდეგ OK, ანალიზის პირველადი გამომავალი პარამეტრები იქნება მითითებულ უჯრედებზე.

  • შემდეგ თქვენ ასევე მიიღებთ რამდენიმე პარამეტრს როგორიცაა მნიშვნელობა მნიშვნელობა და ა.შ. ANOVA ( ვარიანტობის ანალიზი ) ცხრილში.
  • აქ, df აღნიშნავს თავისუფლების ხარისხი, რომელიც დაკავშირებულია დისპერსიის წყაროსთან.
  • SS აღნიშნავს კვადრატების ჯამს. თქვენი მოდელი უკეთ ასახავს მონაცემებს, თუ ნარჩენი SS უფრო მცირეა, ვიდრე სულ SS.
  • MS ნიშნავს კვადრატს.
  • F აღნიშნავს F -ტესტს ნულოვანი ჰიპოთეზისთვის.
  • მნიშვნელობა F აღნიშნავს P -მნიშვნელობას F .

  • შემდეგ ასევე მიიღებთ ცვლადის კოეფიციენტებს, მნიშვნელოვნების მნიშვნელობას და ა.შ. ცხრილში.

  • შემდეგ მიიღებთ საბოლოო ცხრილს კოეფიციენტების ცხრილის ქვემოთ, რომელიც შეიცავს ნარჩენ მნიშვნელობას თითოეული ჩანაწერისთვის.

  • შემდეგი, თქვენ მიიღებთ მოთხოვნის ფასის რეგრესიის დიაგრამას, ტრენდის ხაზით.

  • შემდეგ. ეს, თქვენ მიიღებთ მოთხოვნა vs გაყიდული რეგრესიის დიაგრამა ტრენდული ხაზით.

  • არსებობს კიდევ ერთი დიაგრამა, რომელიც აჩვენებს თითოეული ჩანაწერის ნარჩენების განაწილებას გაყიდული ცვლადიდან.

  • არსებობს კიდევ ერთი სქემა, რომელიც აჩვენებს ნარჩენების განაწილებას თითოეული ჩანაწერის ფასი ცვლადი.

შემდეგ, ჩვენ გაჩვენებთ, თუ როგორ შეგიძლიათ n ამ რეგრესიის შედეგების ინტერპრეტაცია Excel-ში.

წაიკითხეთ მეტი: როგორ გავაკეთოთ ლოგისტიკური რეგრესია Excel-ში (სწრაფი ნაბიჯებით)

როგორ განვახორციელოთ ინტერპრეტაცია რეგრესიის შედეგები Excel-ში

შემდეგი რაც უნდა გააკეთოთ რეგრესიული ანალიზის გაკეთების და მათი ინტერპრეტაციის შემდეგ. შედეგები აღწერილი და დამუშავებულია ქვემოთ.

მრავალჯერადი R-კვადრატული რეგრესიის მნიშვნელობის ანალიზი

R-კვადრატი რიცხვი მიუთითებს, თუ რამდენად მჭიდროდ არის დაკავშირებული მონაცემთა ნაკრების ელემენტები და რამდენად ემთხვევა რეგრესიის ხაზი მონაცემებს. ჩვენ ვაპირებთ გამოვიყენოთ მრავალჯერადი წრფივი რეგრესიის ანალიზი, რომელშიც განვსაზღვრავთ ორი ან მეტი ცვლადის გავლენას მთავარ ფაქტორზე. ეს ეხება იმას, თუ როგორ იცვლება დამოკიდებული ცვლადი, როგორც იცვლება ერთ-ერთი დამოუკიდებელი ცვლადი. ამ კოეფიციენტის დიაპაზონი არის -1-დან 1-მდე. აქ,

  • 1 ნიშნავს მჭიდრო პოზიტიურ ურთიერთობას
  • 0 ნიშნავს, რომ ცვლადებს შორის კავშირი არ არის. სხვა სიტყვებით რომ ვთქვათ, მონაცემთა წერტილები შემთხვევითია.
  • -1 ნიშნავს ინვერსიულ ან უარყოფით ურთიერთობას ცვლადებს შორის.

ზემოთ ნაჩვენები გამომავალი შედეგები, მოცემულის მრავალჯერადი R-მნიშვნელობა. მონაცემთა ნაკრები არის o.7578( დაახლოებით ), რაც მიუთითებს ცვლადებს შორის ძლიერ ურთიერთობაზე.

R კვადრატი

R კვადრატი მნიშვნელობა განმარტავს, თუ როგორ იცვლება დამოკიდებული ცვლადების პასუხი დამოუკიდებელ ცვლადზე. ჩვენს შემთხვევაში, მნიშვნელობა არის 0.574 (დაახლოებით), რაც შეიძლება განიმარტოს, როგორც გონივრულად კარგი ურთიერთობა ცვლადებს შორის.

მორგებული R-Squared

ეს არის უბრალოდ R კვადრატში მნიშვნელობის ალტერნატიული ვერსია. ეს უბრალოდ არევს პროგნოზირებად ცვლადებს, ხოლო პროგნოზირებს პასუხის ცვლადს. ის ითვლის როგორც

R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]

აქ, R^2 : R^2 მნიშვნელობა, საიდანაც მივიღეთმონაცემთა ნაკრები.

n : დაკვირვებების რაოდენობა.

K : პროგნოზირების ცვლადების რაოდენობა.

მნიშვნელობა ეს მნიშვნელობა წარმოიქმნება რეგრესიის ანალიზის დროს ორ პროგნოზირებად ცვლადს შორის. თუ მონაცემთა ნაკრებში არის ერთზე მეტი პროგნოზირებადი ცვლადი, მაშინ R კვადრატის მნიშვნელობა იქნება გაბერილი, რაც ძალზე არასასურველია. შესწორებული R კვადრატში მნიშვნელობა არეგულირებს ამ ინფლაციას და იძლევა ცვლადების ზუსტ სურათს.

სტანდარტული შეცდომა

კიდევ ერთი სიკეთის მეტრიკა რაც მიუთითებს თქვენი რეგრესიული ანალიზის სიზუსტეზე; რაც უფრო დაბალია მნიშვნელობა, მით უფრო დარწმუნებული იქნებით თქვენს რეგრესიის ანალიზში.

სტანდარტული შეცდომა არის ემპირიული მეტრიკა, რომელიც წარმოადგენს საშუალო მანძილს, რომლითაც წერტილები გადახრის ტენდენციას. ამის საპირისპიროდ, R2 წარმოადგენს დამოკიდებული ცვლადის ვარიაციის პროპორციას. ამ შემთხვევაში, სტანდარტული შეცდომის მნიშვნელობა არის 288.9 ( დაახლოებით ), რაც ნიშნავს, რომ ჩვენი მონაცემების წერტილები, საშუალოდ, 288.9-ით ჩამოდის ტრენდის ხაზიდან.

დაკვირვებები

მიუთითეთ დაკვირვებების ან ჩანაწერების რაოდენობა.

განსაზღვრეთ მნიშვნელოვანი ცვლადი

მნიშვნელოვანი მნიშვნელობა მიუთითებს ჩვენი ანალიზის სანდოობაზე (სტატისტიკურად საფუძვლად). სხვა სიტყვებით რომ ვთქვათ, ეს ნიშნავს ჩვენი მონაცემთა ნაკრების არასწორი ალბათობას. ეს მნიშვნელობა უნდა იყოს 5%-ზე ნაკლები. მაგრამ ამ შემთხვევაში, ჩვენი მნიშვნელოვნების მნიშვნელობა არის  0.00117,რაც ითარგმნება 0.1%-ზე, რაც 5%-ზე გაცილებით დაბალია. ასე რომ, ჩვენი ანალიზი კარგია. წინააღმდეგ შემთხვევაში, შეიძლება დაგვჭირდეს სხვადასხვა ცვლადის არჩევა ჩვენი ანალიზისთვის.

P-მნიშვნელობა რეგრესიულ ანალიზში

მჭიდროდ არის დაკავშირებული მნიშვნელოვან მნიშვნელობასთან, P- მნიშვნელობა აღნიშნავს კოეფიციენტის მნიშვნელობის არასწორის ალბათობას. P-მნიშვნელობა აღნიშნავს ნულოვანი ჰიპოთეზის ასოციაციას ცვლადებთან.

თუ თქვენი p-მნიშვნელობა < მნიშვნელოვნება რიცხვი, არის საკმარისი მტკიცებულება ნულოვანი მნიშვნელობის ჰიპოთეზის უარსაყოფად. ეს ნიშნავს, რომ ცვლადებს შორის არის არანულოვანი კორელაცია.

მაგრამ თუ p-მნიშვნელობა > მნიშვნელოვნება მნიშვნელობა, არ იქნება საკმარისი მტკიცებულება უარსაყოფად. ნულოვანი ჰიპოთეზა. ეს ნიშნავს, რომ არ შეიძლება არსებობდეს კორელაცია ცვლადებს შორის.

ან შემთხვევაში, P-მნიშვნელობა ცვლადის Price =0.000948 < 0.00117 (მნიშვნელობის მნიშვნელობა),

ასე რომ, აქ არ არსებობს ნულოვანი ჰიპოთეზა და არის საკმარისი მტკიცებულება ცვლადებს შორის კორელაციის გამოსაცხადებლად.

მეორე მხრივ, ცვლადისთვის გაიყიდა , (P-მნიშვნელობა) 0.0038515 < 0.0011723 (მნიშვნელობის მნიშვნელობა)

ასე რომ, აქ შეიძლება იყოს ნულოვანი ჰიპოთეზა და არ არის საკმარისი მტკიცებულება ცვლადებს შორის არანულოვანი კორელაციის გამოსაცხადებლად.

უმეტეს შემთხვევაში, ეს P -მნიშვნელობა განსაზღვრავს, იქნება თუ არა ცვლადი მონაცემთა ნაკრებში. მაგალითად, ჩვენ უნდა წავშალოთ გაყიდული ცვლადი მონაცემთა ნაკრების გამძლეობის შესანარჩუნებლად.

რეგრესიის განტოლება

როგორც ჩვენ განვსაზღვრავთ ხაზოვანი რეგრესიის ანალიზს Excel-ში, ტრენდის ხაზი ასევე უნდა იყოს წრფივი. ზოგადი ფორმაა:

Y=mX+C.

აქ, Y არის დამოკიდებული ცვლადი.

და X არის დამოუკიდებელი ცვლადი აქ, რაც იმას ნიშნავს, რომ ჩვენ განვსაზღვრავთ x ცვლადის ცვლილების ეფექტს Y ცვლადზე.

C უბრალოდ იქნება Y-ღერძის გადაკვეთის მნიშვნელობა. ხაზი.

ამ შემთხვევაში, C  კვეთის მნიშვნელობა უდრის 9502.109853

და m-ის მნიშვნელობა ორი ცვლადისთვის არის -809.265 და 0.424818.

0>მაშ, ჩვენ გვაქვს საბოლოო განტოლება ორი ცალკეული ცვლადისთვის.

პირველი არის:

Y=-809.265771X+9502.12

და მეორე ცვლადის განტოლებაა:

Y=0.4248X+9502.12

კოეფიციენტები

კოეფიციენტები, რომლებიც მივიღეთ არის m1=-809.2655 და m2=04248 . და interceptor, C= 9502.12 .

  • პირველი, interceptor მნიშვნელობა მიუთითებს, რომ მოთხოვნა იქნება 9502, როდესაც ფასი ნულის ტოლია.
  • და მნიშვნელობები m აღნიშნავს ტემპს, რომლითაც იცვლება მოთხოვნა ფასის ცვლილების ერთეულზე. ფასის კოეფიციენტის მნიშვნელობა არის -809,265, რაც მიუთითებს იმაზე, რომ ფასის ერთეულზე ზრდა შეამცირებს მოთხოვნას დაახლოებით 809 ერთეულით.
  • მეორე ცვლადისთვის, გაყიდული, m მნიშვნელობა არის 0,424. ეს ნიშნავს, რომ ცვლილება გაყიდულ ერთეულზეგამოიწვევს პროდუქტის 0424-ჯერ ზრდას ერთეულში.

ნარჩენები

ნარჩენი სხვაობა ორიგინალსა და გამოთვლილს შორის რეგრესიის ხაზიდან შესვლა არის განსხვავება. ნარჩენები მიუთითებს, თუ რამდენად დაშორებულია ფაქტობრივი მნიშვნელობა ხაზისგან. მაგალითად, გამოთვლილი ჩანაწერი რეგრესიის ანალიზიდან პირველი ჩანაწერისთვის არის 9497. ხოლო პირველი ორიგინალური მნიშვნელობა არის 9500. ასე რომ, ნარჩენი არის დაახლოებით 2.109.

T-Statistics Value

T-სტატიკური მნიშვნელობა არის კოეფიციენტის გაყოფა სტანდარტულ მნიშვნელობაზე. რაც უფრო მაღალია მნიშვნელობა, მით უკეთესია კოეფიციენტის სანდოობა.

არსებობს ამ მნიშვნელობის კიდევ ერთი მნიშვნელობა, რომელიც საჭიროა P-მნიშვნელობის გამოსათვლელად.

95% ნდობის ინტერვალი

აქ ცვლადის ნდობა, რომელიც დასაწყისში დავაყენეთ, როგორც 95. თუმცა ის შეიძლება შეიცვალოს.

  • აქ, ქვედა 95%-ის კოეფიციენტის მნიშვნელობა გამოითვლება როგორც 8496.84 ნიშნავს, რომ ზედა 95% გამოითვლება როგორც 10507.37,
  • ეს ნიშნავს, რომ სანამ ჩვენი ძირითადი კოეფიციენტი არის დაახლოებით, 9502.1. არსებობს დიდი შანსი, რომ მნიშვნელობა შეიძლება იყოს 8496-ზე დაბლა შემთხვევების 95%-ისთვის და 5% შანსი, რომ იყოს 10507.37-ზე მეტი

დაწვრილებით:

რაც უნდა გვახსოვდეს

რეგრესიული ანალიზის მეთოდი მხოლოდ აფასებს ცვლადებს შორის არსებულ ურთიერთობას. ის არ ადგენს მიზეზობრიობას. სხვა მხრივ, მხოლოდ ასპექტიკორელაციის მიაჩნია. როდესაც რაიმე ქმედება იწვევს რაიმეს, ეს ხდება მიზეზობრიობა. როდესაც ერთი ცვლადის ცვლილება ქმნის ცვლილებებს, ის შეიძლება ჩაითვალოს მიზეზობრიობად.

რეგრესიის ანალიზი ძლიერ აფერხებს outliers. ანალიზის გაკეთებამდე ყველა სახის გამონაყარი უნდა მოიხსნას. Excel-ში რეგრესიის ანალიზის შედეგების გასაანალიზებლად და ინტერპრეტაციისთვის, თქვენ უნდა გაითვალისწინოთ ეს პუნქტები.

დასკვნა

შესაჯამებლად, კითხვაზე „როგორ განვახორციელოთ რეგრესიის შედეგების ინტერპრეტაცია Excel-ში“ დეტალურად არის პასუხი გაცემული. მისი ანალიზი და მოგვიანებით ინტერპრეტაცია. ანალიზი კეთდება მონაცემთა ანალიზის ხელსაწყოს მეშვეობით მონაცემები ჩანართში.

ამ პრობლემისთვის ხელმისაწვდომია სამუშაო წიგნი ჩამოსატვირთად, სადაც შეგიძლიათ ივარჯიშოთ რეგრესიული ანალიზისა და ინტერპრეტაციისთვის. ის.

შეგიძლიათ დაუსვათ ნებისმიერი შეკითხვა ან გამოხმაურება კომენტარების განყოფილების მეშვეობით. ნებისმიერი შემოთავაზება Exceldemy საზოგადოების გასაუმჯობესებლად ძალიან დასაფასებელია.

ჰიუ ვესტი არის Excel-ის ძალიან გამოცდილი ტრენერი და ანალიტიკოსი, რომელსაც აქვს 10 წელზე მეტი გამოცდილება ინდუსტრიაში. მას აქვს ბაკალავრის ხარისხი ბუღალტერიასა და ფინანსებში და მაგისტრის ხარისხი ბიზნესის ადმინისტრირებაში. ჰიუს აქვს სწავლების გატაცება და შეიმუშავა სწავლების უნიკალური მიდგომა, რომელიც ადვილად გასაგები და გასაგებია. მისი ექსპერტი Excel-ის ცოდნა დაეხმარა ათასობით სტუდენტს და პროფესიონალს მთელს მსოფლიოში, გაეუმჯობესებინათ თავიანთი უნარები და გამოირჩეოდნენ თავიანთ კარიერაში. თავისი ბლოგის საშუალებით, ჰიუ უზიარებს თავის ცოდნას მსოფლიოს, სთავაზობს უფასო Excel გაკვეთილებს და ონლაინ ტრენინგებს, რათა დაეხმაროს ინდივიდებსა და ბიზნესს თავიანთი პოტენციალის სრულად მიღწევაში.