Inhaltsverzeichnis
Der Artikel zeigt Ihnen einige grundlegende Methoden, wie Sie Multiple Regressionsanalyse in Excel Sie hilft uns, eine abhängige Variable in Bezug auf eine oder mehrere abhängige Variablen vorherzusagen.
Im Datensatz haben wir einige Informationen über einige Autos: ihre Namen , Preise , Höchstgeschwindigkeiten in Meilen pro Stunde die Spitzenleistung ihr Motor leisten kann, und die maximale Bereich der Strecke, die sie zurücklegen können, ohne ihren Tank aufzufüllen.
Download Arbeitsbuch Praxis
Mehrfache Regressionsanalyse.xlsxWas ist multiple Regression?
Multiple Regression ist ein statistisches Verfahren, mit dem wir die Beziehung zwischen einer abhängige Variable und mehrere unabhängige Variablen Der Zweck der Regression ist die Vorhersage der Art der abhängige Variablen in Bezug auf die entsprechenden unabhängige Variablen .
2 Schritte zur Durchführung einer multiplen Regressionsanalyse in Excel
Schritt 1: Aktivieren Sie die Registerkarte "Datenanalyse
Die Registerkarte Daten enthält nicht die Datenanalyse Um dies zu aktivieren, gehen Sie wie folgt vor.
- Gehen Sie zunächst zu Datei >> Optionen
- Wählen Sie dann Add-ins >> Excel-Zusatzmodule >> Weiter
- Siehe Analyse-ToolPak im Add-ins verfügbar: Abschnitt und klicken Sie auf OK .
Danach wird die Menüband "Datenanalyse erscheint in der Registerkarte Daten .
Schritt 2: Erstellen der multiplen Regressionsanalyse in Excel
Hier zeige ich Ihnen, wie Sie Folgendes analysieren können Mehrfachregression .
- Von der Daten tab>> auswählen Datenanalyse
- A Dialogfeld wird die Auswahl Regression und klicken Sie OK .
A Regression erscheint ein Dialogfeld.
- Wir werden das Auto vorhersagen Preis entsprechend ihrer Höchstgeschwindigkeit , Spitzenleistung und Bereich .
- Wählen Sie die Bereich von abhängige Variablen ( Eingabe Y Bereich In meinem Fall ist es C4:C14 .
- Wählen Sie anschließend die Bereich von unabhängige Variablen ( Eingabe X Bereich In meinem Fall ist es D4:F14 .
- Siehe Etiketten und wählen Sie Neues Arbeitsblatt Ply: im Ausgabe-Optionen Wenn Sie wollen, dass Ihr Regressionsanalyse auf dem aktuellen Blatt einen Zellverweis an der Stelle ein, an der Sie die Analyse im Leistungsbereich
Sie können wählen Rückstände wenn Sie noch mehr tun wollen Analyse .
- Danach sehen Sie die Regressionsanalyse in einem neues Blatt . das Format Analyse je nach Ihren Wünschen.
Sie können also Folgendes tun multiple Regressionsanalyse in Excel.
Ähnliche Lektüre
- Wie man eine einfache lineare Regression in Excel durchführt (4 einfache Methoden)
- Interpretation der Regressionsergebnisse in Excel (detaillierte Analyse)
Eine kurze Diskussion über die multiple Regressionsanalyse in Excel
Die Regressionsanalyse hinterlässt mehrere Werte bestimmter Parameter, deren Bedeutung wir uns ansehen wollen.
Regressionsstatistik
In der Regressionsstatistik Teil sehen wir die Werte einiger Parameter.
- Mehrere R: Dies bezieht sich auf die Korrelationskoeffizient die bestimmt, wie stark die lineare Beziehung zwischen den Variablen ist. Der Wertebereich für diese Koeffizient ist (-1, 1). Die Stärke der Beziehung ist proportional zum absoluten Wert von Mehrere R .
- R-Quadrat: Es ist eine weitere Koeffizient um festzustellen, wie gut die Regressionslinie Sie zeigt auch, wie viele Punkte auf die Regressionslinie fallen. In diesem Beispiel ist der Wert von R 2 ist 86 was gut ist, denn es impliziert, dass 86% der Daten wird die Mehrfachregressionsgerade .
- Bereinigtes R-Quadrat: Dies ist die bereinigtes R-Quadrat Wert für die unabhängige Variablen Es ist geeignet für multiple Regressionsanalyse und so auch für unsere Daten. Hier ist der Wert von Bereinigtes R-Quadrat ist 79 .
- Standardfehler: Dies bestimmt, wie perfekt Ihr Regression Da es sich um eine zufällige Gleichung handelt, wird die Regressionsanalyse der Wert von Standardfehler ist hier ziemlich hoch.
- Beobachtungen: Die Anzahl der Beobachtungen im Datensatz ist 10 .
Analyse der Varianz ( ANOVA )
In der ANOVA Analyseabschnitt sehen wir auch einige andere Parameter .
- df: Die ' Freiheitsgrade ' ist definiert durch df Der Wert von df hier ist 3 denn wir haben 3 Arten von unabhängige Variablen .
- SS: SS bezieht sich auf die Summe der Quadrate. Wenn die Residuale Summe der Platz ist viel kleiner als die Gesamtsumme von Platz passen Ihre Daten in den Regressionslinie Hier ist die Restliche SS ist viel kleiner als SS insgesamt Wir können also davon ausgehen, dass unsere Daten in die Regressionslinie auf eine bessere Art
- MS: MS ist das mittlere Quadrat. Der Wert von Regression und Restbetrag MS ist 78 und 5372210.11 beziehungsweise.
- F und Bedeutung F: Diese Werte bestimmen die Zuverlässigkeit der Regressionsanalyse Wenn die Signifikanz F ist kleiner als 05 die mehrere Regressionsanalyse geeignet ist. Andernfalls müssen Sie möglicherweise Ihre unabhängige Variable In unserem Datensatz ist der Wert von Signifikanz F ist 0.01 was gut für die Analyse ist.
Ausgabe der Regressionsanalyse
Hier werde ich die Ausgabe von Regressionsanalyse .
- Koeffizienten und andere
In diesem Abschnitt erhalten wir den Wert von Koeffizienten für die unabhängige Variablen - maximale Geschwindigkeit , Spitzenleistung und Bereich Außerdem finden wir folgende Informationen für jeden Koeffizient : seine Standardfehler , t Zustand , P-Wert und andere Parameter.
2. Restliche Leistung
Die Residuale Werte helfen uns zu verstehen, wie sehr die voraussichtlicher Preis von seinem tatsächlichen Wert abweicht und die Standard Wert von Restwerte das wäre akzeptabel.
Die Art und Weise, wie die Vorhersage von Regressionsanalyse arbeitet, ist unten angegeben.
Angenommen, wir wollen die Preis des ersten Fahrzeugs entsprechend seiner unabhängige Variablen . die unabhängige Variablen sind die Max. Geschwindigkeit , Spitzenleistung und Bereich deren Werte sind 110 Meilen pro Stunde , 600 Pferdestärken und 130 Meilen Die entsprechenden Regressionskoeffizienten sind 245.43 , 38.19 und 94.38 . die y-Achsenwert ist -50885.73 Der voraussichtliche Preis wird also sein 245.43*110+38.19*600+94.38*130-50885.73≈11295 .
Nach dem Datensatz dieses Artikels kann man, wenn man das Fahrverhalten eines Autos vorhersagen will Preis die eine Höchstgeschwindigkeit von x mph , Spitzenleistung von y hp und Bereich von z Meilen wird der voraussichtliche Preis sein 245.43*x+38.19*y+94.38*z .
Lesen Sie mehr: Interpretation von Mehrfachregressionsergebnissen in Excel
Verwendung von Grafiken zum Verständnis der multiplen linearen Regression in Excel
Wenn Sie sich die Regressionslinie Ihrer Daten, lassen Sie uns das folgende Verfahren durchgehen.
Schritte:
- Erstens, von der Daten tab>> Gehe zu Datenanalyse
- A Datenanalyse erscheint, wählen Sie dann Regression .
- Klicken Sie schließlich auf OK .
Eine weitere Dialogfeld von Regression erscheinen wird.
- Wählen Sie Restbetrag und Line Fit Plots .
- Klicken Sie auf OK .
Danach sehen Sie die Grafik von die Regressionsgerade passt laut Max. Geschwindigkeit , Spitzenleistung und Bereich in einem neues Blatt zusammen mit der Analyse.
Hier unten steht sie für die Linienanpassung laut Max. Geschwindigkeit .
Und das folgende Bild zeigt die Linienanpassung laut Spitzenleistung .
Die folgende Abbildung zeigt die Linienanpassung laut Bereich .
Bitte laden Sie die Arbeitsmappe herunter und sehen Sie sich die Grundstücke für ein besseres Verständnis.
Lesen Sie mehr: Wie man eine lineare Regression in Excel durchführt (4 einfache Methoden)
Praxisteil
Hier stelle ich Ihnen den Datensatz dieses Artikels zur Verfügung, damit Sie ihn analysieren können multiple lineare Regression auf eigene Faust.
Schlussfolgerung
Dieser Artikel wird Ihnen helfen zu verstehen, wie Sie multiple Regressionsanalyse in Excel und es ist eine kurze Beschreibung der Parameter. Wenn Sie Ideen oder Feedback zu diesem Artikel haben, teilen Sie diese bitte im Kommentarfeld mit. Dies wird mir helfen, meine kommenden Artikel zu bereichern.