Τι είναι η πολλαπλή γραμμική παλινδρόμηση - MLR;
Η πολλαπλή γραμμική παλινδρόμηση (MLR), γνωστή και ως πολλαπλή παλινδρόμηση, είναι μια στατιστική τεχνική που χρησιμοποιεί αρκετές επεξηγηματικές μεταβλητές για να προβλέψει το αποτέλεσμα μιας μεταβλητής απόκρισης. Ο στόχος της πολλαπλής γραμμικής παλινδρόμησης (MLR) είναι να μοντελοποιήσει τη γραμμική σχέση μεταξύ της επεξηγηματικής (ανεξάρτητης) μεταβλητής και της απόκρισης (εξαρτώμενης) μεταβλητής.
Στην ουσία, η πολλαπλή παλινδρόμηση είναι η επέκταση της κανονικής παλινδρόμησης των ελάχιστων τετραγώνων (OLS) που περιλαμβάνει περισσότερες από μία επεξηγηματικές μεταβλητές.
Ο τύπος για την πολλαπλή γραμμική παλινδρόμηση είναι
Yi = β0 + β1 xi1 + β2 xi2 +… + βp xip + εwhere, για i = n παρατηρήσεις: yi = εξαρτώμενη variablexi = εξαπλωτικές μεταβλητέςβ0 =) βp = συντελεστές κλίσης για κάθε επεξηγηματική μεταβλητήε = ο όρος σφάλματος του μοντέλου (επίσης γνωστός ως υπολειμματικό)
Επεξήγηση πολλαπλής γραμμικής παλινδρόμησης
Μια απλή γραμμική παλινδρόμηση είναι μια συνάρτηση που επιτρέπει σε έναν αναλυτή ή στατιστικά να κάνει προβλέψεις για μια μεταβλητή με βάση τις πληροφορίες που είναι γνωστές για μια άλλη μεταβλητή. Η γραμμική παλινδρόμηση μπορεί να χρησιμοποιηθεί μόνο όταν έχουμε δύο συνεχείς μεταβλητές - μια ανεξάρτητη μεταβλητή και μια εξαρτώμενη μεταβλητή. Η ανεξάρτητη μεταβλητή είναι η παράμετρος που χρησιμοποιείται για τον υπολογισμό της εξαρτημένης μεταβλητής ή του αποτελέσματος. Ένα μοντέλο πολλαπλής παλινδρόμησης επεκτείνεται σε αρκετές επεξηγηματικές μεταβλητές.
Το μοντέλο πολλαπλής παλινδρόμησης βασίζεται στις ακόλουθες παραδοχές:
- Υπάρχει μια γραμμική σχέση μεταξύ των εξαρτημένων μεταβλητών και των ανεξάρτητων μεταβλητών. Οι ανεξάρτητες μεταβλητές δεν συσχετίζονται πολύ μεταξύ τους. Οι παρατηρήσεις επιλέγονται ανεξάρτητα και τυχαία από τον πληθυσμό. Οι επαναλήψεις θα πρέπει κανονικά να κατανέμονται με μέσο όρο 0 και διακύμανση σ.
Ο συντελεστής προσδιορισμού (R-τετράγωνο) είναι μια στατιστική μέτρηση που χρησιμοποιείται για να μετρήσει πόσο από τη μεταβολή του αποτελέσματος μπορεί να εξηγηθεί από τη μεταβολή στις ανεξάρτητες μεταβλητές. Το R 2 αυξάνεται πάντα καθώς προστίθενται περισσότεροι προγνωστικοί δείκτες στο μοντέλο MLR παρόλο που οι προβλεπόμενοι μπορεί να μην σχετίζονται με την μεταβλητή έκβασης.
Επομένως, το R2 δεν μπορεί να χρησιμοποιηθεί για τον προσδιορισμό των προγνωστικών που πρέπει να συμπεριληφθούν σε ένα μοντέλο και τα οποία πρέπει να αποκλειστούν. Το R 2 μπορεί να είναι μόνο μεταξύ 0 και 1, όπου το 0 υποδεικνύει ότι το αποτέλεσμα δεν μπορεί να προβλεφθεί από καμία από τις ανεξάρτητες μεταβλητές και το 1 υποδεικνύει ότι το αποτέλεσμα μπορεί να προβλεφθεί χωρίς σφάλμα από τις ανεξάρτητες μεταβλητές.
Κατά την ερμηνεία των αποτελεσμάτων μιας πολλαπλής παλινδρόμησης, οι συντελεστές βήτα είναι έγκυροι ενώ διατηρούνται όλες οι άλλες μεταβλητές σταθερές ("όλοι οι άλλοι ίσοι"). Η έξοδος από μια πολλαπλή παλινδρόμηση μπορεί να εμφανιστεί οριζόντια ως εξίσωση ή κάθετα σε μορφή πίνακα.
Παράδειγμα Χρησιμοποιώντας πολλαπλή γραμμική παλινδρόμηση
Για παράδειγμα, ένας αναλυτής μπορεί να θέλει να μάθει πώς η κίνηση της αγοράς επηρεάζει την τιμή της Exxon Mobil (XOM). Σε αυτή την περίπτωση, η γραμμική του εξίσωση θα έχει την τιμή του δείκτη S & P 500 ως ανεξάρτητη μεταβλητή ή πρόβλεψη και την τιμή του XOM ως εξαρτημένης μεταβλητής.
Στην πραγματικότητα, υπάρχουν πολλοί παράγοντες που προβλέπουν την έκβαση ενός γεγονότος. Η κίνηση των τιμών της Exxon Mobil, για παράδειγμα, εξαρτάται περισσότερο από την απλή απόδοση της συνολικής αγοράς. Άλλοι παράγοντες πρόβλεψης όπως η τιμή του πετρελαίου, τα επιτόκια και η μεταβολή των τιμών των συμβολαίων μελλοντικής εκπλήρωσης πετρελαίου μπορεί να επηρεάσουν την τιμή του XOM και τις τιμές των μετοχών άλλων πετρελαϊκών εταιρειών. Για να κατανοήσουμε μια σχέση στην οποία υπάρχουν περισσότερες από δύο μεταβλητές, χρησιμοποιείται μια πολλαπλή γραμμική παλινδρόμηση.
Η πολλαπλή γραμμική παλινδρόμηση (MLR) χρησιμοποιείται για τον προσδιορισμό μιας μαθηματικής σχέσης μεταξύ ενός αριθμού τυχαίων μεταβλητών. Με άλλους όρους, το MLR εξετάζει τον τρόπο με τον οποίο πολλές ανεξάρτητες μεταβλητές σχετίζονται με μία εξαρτώμενη μεταβλητή. Μόλις προσδιοριστεί ο κάθε ανεξάρτητος παράγοντας για την πρόβλεψη της εξαρτώμενης μεταβλητής, οι πληροφορίες για τις πολλαπλές μεταβλητές μπορούν να χρησιμοποιηθούν για να δημιουργηθεί μια ακριβής πρόβλεψη για το επίπεδο επίδρασης που έχουν στην μεταβλητή έκβασης. Το μοντέλο δημιουργεί μια σχέση με τη μορφή μιας ευθείας γραμμής (γραμμική) που προσεγγίζει καλύτερα όλα τα μεμονωμένα σημεία δεδομένων.
Αναφερόμενοι στην ανωτέρω εξίσωση MLR, στο παράδειγμά μας:
- y i = εξαρτώμενη μεταβλητή: τιμή XOMx i1 = επιτόκια x i2 = τιμή oilx i3 = τιμή S & P 500 indexx i4 = τιμή futures πετρελαίουΒ 0 = y-intercept στο χρόνο zeroB 1 = συντελεστής παλινδρόμησης που μετρά μια μεταβολή μονάδας μεταβλητή όταν οι μεταβολές x i1 - η μεταβολή της τιμής XOM όταν μεταβάλλονται τα επιτόκια B 2 = η τιμή του συντελεστή που μετρά μια αλλαγή μονάδας στην εξαρτημένη μεταβλητή όταν x i2 αλλάζει - η μεταβολή της τιμής XOM όταν αλλάζουν οι τιμές του πετρελαίου
Οι εκτιμήσεις των ελάχιστων τετραγώνων, B 0, B 1, B 2… B p, υπολογίζονται συνήθως με στατιστικό λογισμικό. Δεδομένου ότι πολλές μεταβλητές μπορούν να συμπεριληφθούν στο μοντέλο παλινδρόμησης στο οποίο κάθε ανεξάρτητη μεταβλητή διαφοροποιείται με αριθμό 1, 2, 3, 4… p. Το μοντέλο πολλαπλής παλινδρόμησης επιτρέπει σε έναν αναλυτή να προβλέψει ένα αποτέλεσμα βασισμένο σε πληροφορίες που παρέχονται σε πολλές επεξηγηματικές μεταβλητές.
Παρόλα αυτά, το μοντέλο δεν είναι πάντα απόλυτα ακριβές, καθώς κάθε σημείο δεδομένων μπορεί να διαφέρει ελαφρώς από το αποτέλεσμα που προβλέπεται από το μοντέλο. Η υπολειπόμενη τιμή, E, η οποία είναι η διαφορά μεταξύ του πραγματικού αποτελέσματος και του προβλεπόμενου αποτελέσματος, περιλαμβάνεται στο μοντέλο για να ληφθούν υπόψη αυτές οι μικρές μεταβολές.
Υποθέτοντας ότι χρησιμοποιούμε το μοντέλο μας XORM παλινδρόμησης τιμών μέσω ενός λογισμικού υπολογιστικής στατιστικής, το οποίο επιστρέφει αυτό το αποτέλεσμα:
Ένας αναλυτής θα ερμήνευε αυτό το αποτέλεσμα, αν οι άλλες μεταβλητές είναι σταθερές, η τιμή του XOM θα αυξηθεί κατά 7, 8% αν η τιμή του πετρελαίου στις αγορές αυξηθεί κατά 1%. Το μοντέλο δείχνει επίσης ότι η τιμή του XOM θα μειωθεί κατά 1, 5% μετά από αύξηση των επιτοκίων κατά 1%. Το R 2 δείχνει ότι το 86, 5% των διακυμάνσεων της τιμής της μετοχής της Exxon Mobil μπορεί να εξηγηθεί από τις μεταβολές του επιτοκίου, της τιμής του πετρελαίου, των προθεσμιακών συμβολαίων πετρελαίου και του δείκτη S & P 500.
Βασικές τακτικές
- Η πολλαπλή γραμμική παλινδρόμηση (MLR), γνωστή και ως πολλαπλή παλινδρόμηση, είναι μια στατιστική τεχνική που χρησιμοποιεί αρκετές επεξηγηματικές μεταβλητές για να προβλέψει το αποτέλεσμα μιας μεταβλητής απόκρισης. Πολλαπλή παλινδρόμηση είναι μια επέκταση της γραμμικής παλινδρόμησης (OLS) που χρησιμοποιεί μόνο μία επεξηγηματική μεταβλητή. Το MLR χρησιμοποιείται εκτενώς στην οικονομετρία και στο οικονομικό συμπέρασμα.
Η διαφορά μεταξύ γραμμικής και πολλαπλής παλινδρόμησης
Η γραμμική (OLS) παλινδρόμηση συγκρίνει την απόκριση μιας εξαρτώμενης μεταβλητής δεδομένης μιας μεταβολής σε κάποια επεξηγηματική μεταβλητή. Ωστόσο, είναι σπάνιο να εξηγείται μια εξαρτώμενη μεταβλητή από μία μόνο μεταβλητή. Σε αυτήν την περίπτωση, ένας αναλυτής χρησιμοποιεί πολλαπλή παλινδρόμηση, η οποία επιχειρεί να εξηγήσει μια εξαρτημένη μεταβλητή χρησιμοποιώντας περισσότερες από μία ανεξάρτητες μεταβλητές. Οι πολλαπλές παλινδρομήσεις μπορούν να είναι γραμμικές και μη γραμμικές.
Οι πολλαπλές παλινδρομήσεις βασίζονται στην παραδοχή ότι υπάρχει μια γραμμική σχέση μεταξύ των εξαρτημένων και των ανεξάρτητων μεταβλητών. Επίσης, δεν υπάρχει σημαντική συσχέτιση μεταξύ των ανεξάρτητων μεταβλητών.
