Τι είναι ο συντελεστής πληθωρισμού διακύμανσης;
Ο συντελεστής πληθωρισμού πληθωρισμού διακύμανσης (VIF) είναι ένα μέτρο της ποσότητας πολυκεντρικότητας σε ένα σύνολο πολλαπλών μεταβλητών παλινδρόμησης. Μαθηματικά, η μεταβλητή VIF για μια μεταβλητή μοντέλου παλινδρόμησης είναι ίση με την αναλογία της συνολικής διακύμανσης μοντέλου με τη διακύμανση ενός μοντέλου που περιλαμβάνει μόνο αυτή την ανεξάρτητη μεταβλητή. Αυτή η αναλογία υπολογίζεται για κάθε ανεξάρτητη μεταβλητή. Ένα υψηλό VIF υποδεικνύει ότι η σχετιζόμενη ανεξάρτητη μεταβλητή είναι πολύ συγγενής με τις άλλες μεταβλητές στο μοντέλο.
Βασικές τακτικές
- Ένας παράγοντας πληθωρισμού διακύμανσης (VIF) παρέχει ένα μέτρο πολυκεντρικότητας μεταξύ των ανεξάρτητων μεταβλητών σε ένα μοντέλο πολλαπλής παλινδρόμησης. Η διαπίστωση της πολυκεντρικότητας είναι σημαντική επειδή, ενώ δεν μειώνει την ερμηνευτική ισχύ του μοντέλου, μειώνει τη στατιστική σημασία των ανεξάρτητων μεταβλητών. Ένα μεγάλο VIF σε μια ανεξάρτητη μεταβλητή υποδηλώνει μια πολύ συσχετισμένη σχέση με τις άλλες μεταβλητές που πρέπει να ληφθούν υπόψη ή να προσαρμοστούν στη δομή του μοντέλου και την επιλογή ανεξάρτητων μεταβλητών.
Κατανόηση ενός συντελεστή πληθωρισμού διακύμανσης
Μια πολλαπλή παλινδρόμηση χρησιμοποιείται όταν ένα άτομο θέλει να ελέγξει την επίδραση πολλών μεταβλητών σε ένα συγκεκριμένο αποτέλεσμα. Η εξαρτημένη μεταβλητή είναι το αποτέλεσμα που επηρεάζεται από τις ανεξάρτητες μεταβλητές, οι οποίες είναι οι εισροές στο μοντέλο. Η πολυελαστικότητα υπάρχει όταν υπάρχει γραμμική σχέση ή συσχέτιση μεταξύ μιας ή περισσοτέρων από τις ανεξάρτητες μεταβλητές ή εισροές. Η πολυελαστικότητα δημιουργεί ένα πρόβλημα στη πολλαπλή παλινδρόμηση επειδή, δεδομένου ότι όλες οι εισροές επηρεάζουν το ένα το άλλο, δεν είναι στην πραγματικότητα ανεξάρτητες και είναι δύσκολο να δοκιμαστεί πόσο ο συνδυασμός των ανεξάρτητων μεταβλητών επηρεάζει τη εξαρτημένη μεταβλητή ή την έκβαση στο μοντέλο παλινδρόμησης. Από στατιστικής άποψης, ένα μοντέλο πολλαπλής παλινδρόμησης όπου υπάρχει μεγάλη πολυκεντρική γραμμικότητα θα κάνει πιο δύσκολη την εκτίμηση της σχέσης μεταξύ κάθε ανεξάρτητης μεταβλητής και της εξαρτώμενης μεταβλητής. Μικρές αλλαγές στα χρησιμοποιούμενα δεδομένα ή στη δομή της εξίσωσης μοντέλου μπορούν να προκαλέσουν μεγάλες και ασταθείς μεταβολές στους εκτιμώμενους συντελεστές στις ανεξάρτητες μεταβλητές.
Για να βεβαιωθείτε ότι το μοντέλο έχει καθοριστεί σωστά και ότι λειτουργεί σωστά, υπάρχουν δοκιμές που μπορούν να εκτελεστούν για πολυκλινικότητα. Ο παράγοντας πληθωρισμού διακύμανσης είναι ένα τέτοιο εργαλείο μέτρησης. Η χρήση παραγόντων πληθωρισμού διακύμανσης συμβάλλει στον εντοπισμό της σοβαρότητας κάθε προβλήματος πολυκεντρικότητας, έτσι ώστε να μπορεί να προσαρμοστεί το μοντέλο. Ο συντελεστής πληθωρισμού παραλλαγής μετρά πόσο επηρεάζεται η συμπεριφορά (διακύμανση) μιας ανεξάρτητης μεταβλητής από την αλληλεπίδραση / συσχέτιση της με τις άλλες ανεξάρτητες μεταβλητές. Οι συντελεστές πληθωρισμού διακύμανσης επιτρέπουν μια γρήγορη μέτρηση του ποσοστού μιας μεταβλητής που συμβάλλει στο τυπικό σφάλμα στην παλινδρόμηση. Όταν υπάρχουν σημαντικά προβλήματα πολυκεντρικότητας, ο συντελεστής πληθωρισμού διακύμανσης θα είναι πολύ μεγάλος για τις σχετικές μεταβλητές. Αφού εντοπιστούν αυτές οι μεταβλητές, μπορούν να χρησιμοποιηθούν διάφορες προσεγγίσεις για να εξαλειφθούν ή να συνδυαστούν οι κολλοειδείς μεταβλητές, επιλύοντας το ζήτημα της πολυκεντρικότητας.
Ενώ η πολυκεντρική συνάρτηση δεν μειώνει τη συνολική προβλεπτική ισχύ ενός μοντέλου, μπορεί να παράγει εκτιμήσεις των συντελεστών παλινδρόμησης που δεν είναι στατιστικά σημαντικοί. Κατά μία έννοια, μπορεί να θεωρηθεί ως ένα είδος διπλής μέτρησης στο μοντέλο. Όταν δύο ή περισσότερες ανεξάρτητες μεταβλητές συνδέονται στενά ή μετρούν σχεδόν το ίδιο πράγμα, τότε η υποκείμενη επίδραση που μετρούν υπολογίζεται δύο φορές (ή περισσότερο) στις μεταβλητές και καθίσταται δύσκολο ή αδύνατο να πούμε ποια μεταβλητή επηρεάζει πραγματικά ανεξάρτητη μεταβλητή. Αυτό είναι ένα πρόβλημα επειδή ο στόχος πολλών οικονομετρικών μοντέλων είναι να δοκιμάσουμε ακριβώς αυτό το είδος στατιστικής σχέσης μεταξύ των ανεξάρτητων μεταβλητών και της εξαρτημένης μεταβλητής.
Για παράδειγμα, εάν ένας οικονομολόγος θέλει να ελέγξει εάν υπάρχει στατιστικά σημαντική σχέση μεταξύ του ποσοστού ανεργίας (ως ανεξάρτητης μεταβλητής) και του πληθωρισμού (ως εξαρτημένης μεταβλητής). Η συμπερίληψη πρόσθετων ανεξάρτητων μεταβλητών που σχετίζονται με το ποσοστό ανεργίας, όπως ένας νέος αρχικός ισχυρισμός ανεργίας, θα ήταν πιθανό να εισαγάγει πολυκλαδικότητα στο μοντέλο. Το συνολικό μοντέλο μπορεί να παρουσιάσει ισχυρή στατιστικά επαρκή ερμηνευτική δύναμη, αλλά να μην είναι σε θέση να προσδιορίσει εάν το αποτέλεσμα οφείλεται κυρίως στο ποσοστό ανεργίας ή στις νέες αρχικές απαιτήσεις ανεργίας. Αυτός είναι ο λόγος που θα ανιχνεύσει το VIF και θα πρότεινε ενδεχομένως να αποσυρθεί μία από τις μεταβλητές από το μοντέλο ή να βρεθεί κάποιος τρόπος να τους παγιωθεί για να συλλάβει το κοινό τους αποτέλεσμα, ανάλογα με την συγκεκριμένη υπόθεση που ο ερευνητής ενδιαφέρεται να δοκιμάσει.
