Πώς να ερμηνεύσετε τα αποτελέσματα παλινδρόμησης στο Excel (λεπτομερής ανάλυση)

  • Μοιραστείτε Αυτό
Hugh West

Η ανάλυση παλινδρόμησης υπάρχει σχεδόν σε κάθε τύπο στατιστικού λογισμικού όπως SPSS , R, και για να μην αναφέρουμε το Excel. Η παλινδρόμηση μπορεί να μας δώσει τη μεγάλη εικόνα για τις σχέσεις μεταξύ των μεταβλητών. Η γραμμική παλινδρόμηση μπορεί να γίνει αρκετά γρήγορα στο Excel χρησιμοποιώντας την Ανάλυση δεδομένων Αυτό το άρθρο θα σας δείξει πώς μπορείτε να να ερμηνεύετε τα αποτελέσματα της παλινδρόμησης στο Excel.

Κατεβάστε το βιβλίο ασκήσεων

Κατεβάστε αυτό το βιβλίο ασκήσεων παρακάτω.

Ερμηνεύστε τα αποτελέσματα παλινδρόμησης.xlsx

Τι είναι η παλινδρόμηση;

Η ανάλυση παλινδρόμησης χρησιμοποιείται συχνά στην ανάλυση δεδομένων για τον προσδιορισμό των συσχετίσεων μεταξύ πολλαπλών μεταβλητών. Η ανάλυση παλινδρόμησης σας επιτρέπει να επιλέξετε τι συμβαίνει στην εξαρτημένη μεταβλητή εάν μεταβληθεί μία από τις ανεξάρτητες μεταβλητές. Σας επιτρέπει επίσης να υπολογίσετε με μαθηματικό τρόπο ποιες ανεξάρτητες μεταβλητές έχουν επίδραση.

Απλή γραμμική παλινδρόμηση διαφέρει από ένα πολλαπλή γραμμική παλινδρόμηση στη στατιστική. Χρησιμοποιώντας μια γραμμική συνάρτηση, απλή αναλύσεις γραμμικής παλινδρόμησης η συσχέτιση μεταξύ των μεταβλητών και μιας ανεξάρτητης μεταβλητής. Πολλαπλή γραμμική παλινδρόμηση είναι όταν δύο ή περισσότεροι επεξηγηματικοί παράγοντες χρησιμοποιούνται για τον προσδιορισμό των μεταβλητών. Η χρήση μη γραμμικής παλινδρόμησης αντί της εξαρτημένης μεταβλητής περιγράφεται ως μη γραμμική συνάρτηση, δεδομένου ότι οι σχέσεις των δεδομένων δεν είναι γραμμικές. Αυτό το άρθρο θα επικεντρωθεί στην πολλαπλή γραμμική παλινδρόμηση για να δείξετε πώς μπορείτε να να ερμηνεύετε τα αποτελέσματα της παλινδρόμησης στο Excel.

Βήματα για να κάνετε παλινδρόμηση στο Excel

Για σκοπούς παλινδρόμησης, θα χρησιμοποιήσουμε το παρακάτω σύνολο δεδομένων για σκοπούς ανάλυσης. Εδώ η ανεξάρτητη μεταβλητή θα είναι η Τιμή στήλη και Πωλείται στήλη. ανεξάρτητο θα είναι η στήλη Ζήτηση στήλη.

Βήματα

  • Πρέπει να πάμε στο Δεδομένα και κάντε κλικ στην καρτέλα Ανάλυση δεδομένων να κάνει παλινδρόμηση .

  • Θα εμφανιστεί ένα νέο παράθυρο- επιλέξτε το εύρος δεδομένων της εξαρτημένης μεταβλητής και της ανεξάρτητης μεταβλητής.
  • Στη συνέχεια, τσεκάρετε το Ετικέτες κουτί και Εμπιστοσύνη κουτί.
  • Στη συνέχεια, κάντε κλικ στο πλαίσιο περιοχής κελιών εξόδου για να επιλέξετε τη διεύθυνση κελιού εξόδου.
  • Στη συνέχεια, επιλέξτε το Υπόλοιπο για τον υπολογισμό των υπολοίπων.
  • Μετά από αυτό, τσεκάρετε το Υπόλοιπο οικόπεδα και Πλαίσια Line Fit Plots
  • Κάντε κλικ στο OK μετά από αυτό.

  • Αφού κάνετε κλικ στο ΕΝΤΆΞΕΙ, οι πρωταρχικές παράμετροι εξόδου της ανάλυσης θα βρίσκονται στα καθορισμένα κελιά.

  • Τότε θα λάβετε επίσης κάποιες παραμέτρους όπως Σημασία τιμή κ.λπ. στο ANOVA ( Ανάλυση διακύμανσης ) πίνακα.
  • Ορίστε, df δηλώνει τον βαθμό ελευθερίας που σχετίζεται με την πηγή της διακύμανσης.
  • SS Το μοντέλο σας θα αντικατοπτρίζει καλύτερα τα δεδομένα αν το Υπόλοιπο SS είναι μικρότερη από την Σύνολο SS.
  • MS σημαίνει τετράγωνο.
  • F υποδηλώνει το F -δοκιμή για τη μηδενική υπόθεση.
  • Σημασία F υποδηλώνει το P -τιμή του F .

  • Στη συνέχεια, θα λάβετε επίσης τους συντελεστές της μεταβλητής, την τιμή σημαντικότητας κ.λπ. σε έναν πίνακα.

  • Στη συνέχεια, θα λάβετε έναν τελικό πίνακα κάτω από τον πίνακα συντελεστών, ο οποίος περιέχει την υπολειμματική τιμή για κάθε καταχώρηση.

  • Στη συνέχεια, θα λάβετε το Ζήτηση εναντίον Τιμή διάγραμμα παλινδρόμησης, με γραμμή τάσης.

  • Μετά από αυτό, λαμβάνετε το Ζήτηση εναντίον Πωλείται διάγραμμα παλινδρόμησης με γραμμή τάσης.

  • Υπάρχει ένα άλλο διάγραμμα που δείχνει την κατανομή των υπολοίπων κάθε καταχώρησης από το Πωλείται μεταβλητή.

  • Υπάρχει ένα άλλο διάγραμμα που δείχνει την κατανομή των υπολοίπων κάθε καταχώρησης από το Τιμή μεταβλητή.

Στη συνέχεια, θα σας δείξουμε πώς μπορείτε να ερμηνεύσετε αυτά τα αποτελέσματα της παλινδρόμησης στο Excel.

Διαβάστε περισσότερα: Πώς να κάνετε λογιστική παλινδρόμηση στο Excel (με γρήγορα βήματα)

Πώς να ερμηνεύετε τα αποτελέσματα παλινδρόμησης στο Excel

Το επόμενο πράγμα που πρέπει να κάνετε αφού κάνετε την ανάλυση παλινδρόμησης και να τα ερμηνεύσετε. Τα αποτελέσματα περιγράφονται και αναλύονται παρακάτω.

Ανάλυση πολλαπλών τιμών παλινδρόμησης R-τετράγωνο

Το Τετράγωνο R αριθμός δείχνει πόσο στενά σχετίζονται τα στοιχεία του συνόλου δεδομένων και πόσο καλά η γραμμή παλινδρόμησης ταιριάζει με τα δεδομένα. Θα χρησιμοποιήσουμε την ανάλυση πολλαπλής γραμμικής παλινδρόμησης, στην οποία θα προσδιορίσουμε την επίδραση δύο ή περισσότερων μεταβλητών στον κύριο παράγοντα. Αυτός αναφέρεται στο πώς μεταβάλλεται η εξαρτημένη μεταβλητή καθώς μεταβάλλεται μία από τις ανεξάρτητες μεταβλητές. Το εύρος του συντελεστή αυτού είναι από-1 έως 1. Εδώ,

  • 1 σημαίνει στενή θετική σχέση
  • 0 σημαίνει ότι δεν υπάρχουν σχέσεις μεταξύ των μεταβλητών. Με άλλα λόγια, τα σημεία δεδομένων είναι τυχαία.
  • -1 σημαίνει αντίστροφη ή αρνητική σχέση μεταξύ των μεταβλητών.

Στα αποτελέσματα εξόδου που παρουσιάζονται παραπάνω, η πολλαπλή τιμή R των συγκεκριμένων συνόλων δεδομένων είναι o.7578( περίπου ), γεγονός που υποδηλώνει ισχυρές σχέσεις μεταξύ των μεταβλητών.

Τετράγωνο R

Τετράγωνο R τιμή εξηγεί πώς η απόκριση των εξαρτημένων μεταβλητών μεταβάλλεται σε σχέση με την ανεξάρτητη μεταβλητή. Στην περίπτωσή μας, η τιμή είναι 0,574(περίπου), η οποία μπορεί να ερμηνευτεί ως μια αρκετά καλή σχέση μεταξύ των μεταβλητών.

Προσαρμοσμένο R-τετράγωνο

Πρόκειται απλώς για μια εναλλακτική εκδοχή του Τετράγωνο R Αυτό απλά ανακατεύει τις predictor μεταβλητές κατά την πρόβλεψη της απάντηση Υπολογίζεται ως εξής

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Ορίστε, R^2 : Η R^2 τιμή που πήραμε από το σύνολο δεδομένων.

n : ο αριθμός των παρατηρήσεων.

K : ο αριθμός των μεταβλητών πρόβλεψης.

Η σημασία αυτής της τιμής προκύπτει κατά την ανάλυση παλινδρόμησης μεταξύ δύο predictor μεταβλητές. Εάν υπάρχουν περισσότερες από μία predictor μεταβλητή στο σύνολο των δεδομένων, τότε η τιμή του τετραγώνου R θα διογκωθεί, πράγμα εξαιρετικά ανεπιθύμητο. Η προσαρμοσμένη Τετράγωνο R προσαρμόζει αυτόν τον πληθωρισμό και δίνει μια ακριβή εικόνα των μεταβλητών.

Τυπικό σφάλμα

Όσο χαμηλότερη είναι η τιμή, τόσο πιο σίγουροι μπορείτε να είστε στην ανάλυση παλινδρόμησης.

Τυπικό σφάλμα είναι μια εμπειρική μετρική που αντιπροσωπεύει τη μέση απόσταση που τα σημεία αποκλίνουν από τη γραμμή τάσης. Αντίθετα, R2 αντιπροσωπεύει την αναλογία της μεταβολής της εξαρτημένης μεταβλητής. Στην περίπτωση αυτή, η τιμή της Τυπικό σφάλμα είναι 288,9 ( περίπου ), το οποίο δηλώνει ότι τα σημεία των δεδομένων μας, κατά μέσο όρο, απέχουν 288,9 από τη γραμμή τάσης.

Παρατηρήσεις

Αναφέρετε τον αριθμό των παρατηρήσεων ή των καταχωρίσεων.

Καθορισμός σημαντικής μεταβλητής

Το Τιμή σημαντικότητας υποδεικνύει την αξιοπιστία (στατιστικά ορθή) της ανάλυσής μας. Με άλλα λόγια, δηλώνει την πιθανότητα να είναι λάθος το σύνολο των δεδομένων μας. Η τιμή αυτή θα πρέπει να είναι κάτω από 5%. Αλλά σε αυτή την περίπτωση, η τιμή σημαντικότητας είναι 0,00117, που μεταφράζεται σε 0,1%, δηλαδή πολύ κάτω από το 5%. Επομένως, η ανάλυσή μας είναι εντάξει. Διαφορετικά, ίσως πρέπει να επιλέξουμε διαφορετικές μεταβλητές για την ανάλυσή μας.

P-value στην ανάλυση παλινδρόμησης

Στενά συνδεδεμένη με μια σημαντική αξία, η P-value δηλώνει την πιθανότητα η τιμή του συντελεστή να είναι λανθασμένη. Η τιμή P δηλώνει τη συσχέτιση της μηδενικής υπόθεσης με τις μεταβλητές.

Εάν το p-value <η Σημασία αριθμό, υπάρχουν αρκετά στοιχεία για την απόρριψη της υπόθεσης της μηδενικής τιμής. Αυτό σημαίνει ότι υπάρχει μη μηδενική συσχέτιση μεταξύ των μεταβλητών.

Αλλά αν η p-value >, Σημασία τιμή, δεν θα υπάρχουν επαρκή στοιχεία για την απόρριψη της μηδενικής υπόθεσης. Αυτό δηλώνει ότι δεν θα μπορούσε να υπάρχει συσχέτιση μεταξύ των μεταβλητών.

Σε κάθε περίπτωση, το P-value της μεταβλητής Τιμή =0,000948 <0,00117 (τιμή σημαντικότητας),

Επομένως, δεν υπάρχει καμία μηδενική υπόθεση εδώ, και υπάρχουν αρκετά στοιχεία για να δηλωθεί συσχέτιση μεταξύ των μεταβλητών.

Από την άλλη πλευρά, για τη μεταβλητή Πωλείται , η (P-value) 0.0038515 <0.0011723 (τιμή σημαντικότητας)

Επομένως, θα μπορούσε να υπάρχει μια μηδενική υπόθεση και δεν υπάρχουν αρκετά στοιχεία για να δηλωθεί μια μη μηδενική συσχέτιση μεταξύ των μεταβλητών.

Στις περισσότερες περιπτώσεις, αυτή η τιμή P-value καθορίζει αν μια μεταβλητή θα είναι στο σύνολο δεδομένων ή όχι. Για παράδειγμα, θα πρέπει να αφαιρέσουμε την Πωλείται μεταβλητή για να διατηρηθεί η ευρωστία του συνόλου δεδομένων.

Εξίσωση παλινδρόμησης

Καθώς προσδιορίζουμε τη γραμμική ανάλυση παλινδρόμησης στο Excel, η γραμμή τάσης θα πρέπει επίσης να είναι γραμμική. Η γενική μορφή είναι:

Y=mX+C.

Ορίστε, Y είναι η εξαρτημένη μεταβλητή.

Και το Χ είναι η ανεξάρτητη μεταβλητή εδώ, που σημαίνει ότι θα προσδιορίσουμε την επίδραση της μεταβολής της μεταβλητής Χ στη μεταβλητή Υ.

C θα είναι απλώς η τιμή της τομής του άξονα Υ της γραμμής.

Στην περίπτωση αυτή, η τιμή της τομής C είναι ίση με 9502,109853

Και η τιμή του m για τις δύο μεταβλητές είναι -809,265 και 0,424818.

Έτσι, έχουμε την τελική εξίσωση για τις δύο ξεχωριστές μεταβλητές.

Το πρώτο είναι:

Y=-809.265771X+9502.12

Και η εξίσωση για τη δεύτερη μεταβλητή είναι:

Y=0.4248X+9502.12

Συντελεστές

Οι συντελεστές που πήραμε είναι m1=-809.2655 και m2=04248 . και αναχαιτιστής, C= 9502.12 .

  • Πρώτον, η τιμή αναχαίτισης δείχνει ότι η ζήτηση θα είναι 9502 όταν η τιμή είναι μηδέν.
  • Και οι τιμές των m υποδηλώνουν τον ρυθμό με τον οποίο μεταβάλλεται η ζήτηση ανά μονάδα μεταβολής της τιμής. Η τιμή του συντελεστή τιμής είναι -809,265, υποδεικνύοντας ότι μια αύξηση της τιμής ανά μονάδα θα μειώσει τη ζήτηση κατά περίπου 809 μονάδες.
  • Για τη δεύτερη μεταβλητή, Sold, η τιμή m είναι 0,424. Αυτό υποδηλώνει ότι η μεταβολή ανά μονάδα πωλούμενου προϊόντος θα οδηγήσει σε αύξηση του προϊόντος κατά 0424 μονάδες.

Υπολείμματα

Το Υπόλοιπο η διαφορά μεταξύ της αρχικής και της υπολογιζόμενης εισόδου από τη γραμμή παλινδρόμησης είναι η διαφορά. Υπολείμματα δείχνουν πόσο μακριά είναι η πραγματική τιμή από τη γραμμή. Για παράδειγμα, η υπολογισμένη εγγραφή από την ανάλυση παλινδρόμησης για την πρώτη εγγραφή είναι 9497. Και η πρώτη αρχική τιμή είναι 9500. Έτσι, το υπόλοιπο είναι περίπου 2,109.

T-Statistics Τιμή

Η τιμή T-statics είναι η διαίρεση του συντελεστή με την τυπική τιμή. Όσο υψηλότερη είναι η τιμή, τόσο καλύτερη αξιοπιστία δείχνει ο συντελεστής.

Υπάρχει μια άλλη σημασία αυτής της τιμής, η οποία απαιτείται για να υπολογίστε την τιμή P-value.

Το 95% διάστημα εμπιστοσύνης

Εδώ η εμπιστοσύνη της μεταβλητής που ορίσαμε στην αρχή ως 95. Μπορεί όμως να αλλάξει.

  • Εδώ, η τιμή του συντελεστή του κατώτερου 95% υπολογίζεται ως 8496,84 και το ανώτερο 95% υπολογίζεται ως 10507,37,
  • Αυτό σημαίνει ότι ενώ ο κύριος συντελεστής μας είναι περίπου 9502,1, υπάρχει μεγάλη πιθανότητα η τιμή να είναι κάτω από 8496 για το 95% των περιπτώσεων και 5% πιθανότητα να είναι πάνω από 10507,37.

Διαβάστε περισσότερα:

Πράγματα που πρέπει να θυμάστε

Η μέθοδος ανάλυσης παλινδρόμησης αξιολογεί αποκλειστικά τη σχέση μεταξύ των υπό εξέταση μεταβλητών. Δεν διαπιστώνει την αιτιώδη συνάφεια. Με άλλους τρόπους, εξετάζεται μόνο η πτυχή της συσχέτισης. Όταν κάποια πράξη προκαλεί κάτι, γίνεται αιτιώδης συνάφεια. Όταν η μεταβολή μιας μεταβλητής δημιουργεί αλλαγές, μπορεί να θεωρηθεί αιτιώδης συνάφεια.

Η ανάλυση παλινδρόμησης παρεμποδίζεται σε μεγάλο βαθμό από τις ακραίες τιμές. Όλα τα είδη ακραίων τιμών πρέπει να απομακρύνονται πριν από την ανάλυση. Για να αναλύσετε και να ερμηνεύσετε τα αποτελέσματα της ανάλυσης παλινδρόμησης στο Excel, πρέπει να λάβετε υπόψη σας αυτά τα σημεία.

Συμπέρασμα

Συνοψίζοντας, το ερώτημα "πώς να ερμηνεύσουμε τα αποτελέσματα της παλινδρόμησης στο Excel" απαντάται με την ενδελεχή ανάλυση και στη συνέχεια την ερμηνεία. Η ανάλυση γίνεται μέσω της Ανάλυση δεδομένων εργαλείο στο Δεδομένα καρτέλα.

Για το πρόβλημα αυτό, διατίθεται ένα βιβλίο εργασίας για λήψη, όπου μπορείτε να εξασκηθείτε στην ανάλυση παλινδρόμησης και να την ερμηνεύσετε.

Μη διστάσετε να κάνετε οποιεσδήποτε ερωτήσεις ή σχόλια μέσω της ενότητας των σχολίων. Exceldemy κοινότητα θα εκτιμηθεί ιδιαίτερα.

Ο Hugh West είναι ένας εξαιρετικά έμπειρος εκπαιδευτής και αναλυτής του Excel με πάνω από 10 χρόνια εμπειρίας στον κλάδο. Είναι κάτοχος πτυχίου Λογιστικής και Χρηματοοικονομικής και μεταπτυχιακού στη Διοίκηση Επιχειρήσεων. Ο Hugh έχει πάθος για τη διδασκαλία και έχει αναπτύξει μια μοναδική προσέγγιση διδασκαλίας που είναι εύκολο να ακολουθηθεί και να κατανοηθεί. Οι εξειδικευμένες γνώσεις του στο Excel έχουν βοηθήσει χιλιάδες φοιτητές και επαγγελματίες παγκοσμίως να βελτιώσουν τις δεξιότητές τους και να διαπρέψουν στην καριέρα τους. Μέσω του ιστολογίου του, ο Hugh μοιράζεται τις γνώσεις του με τον κόσμο, προσφέροντας δωρεάν μαθήματα Excel και διαδικτυακή εκπαίδευση για να βοηθήσει άτομα και επιχειρήσεις να αξιοποιήσουν πλήρως τις δυνατότητές τους.