Τι είναι η σταδιακή παλινδρόμηση;
Η ανάλυση παλινδρόμησης είναι μια ευρέως χρησιμοποιούμενη στατιστική προσέγγιση που επιδιώκει να προσδιορίσει τις σχέσεις μεταξύ μεταβλητών. Η ιδέα είναι να συγκεντρωθούν τα σχετικά στοιχεία για να ληφθούν καλύτερα ενημερωμένες αποφάσεις και είναι μια κοινή πρακτική στον κόσμο των επενδύσεων. Η σταδιακή παλινδρόμηση είναι η βήμα προς βήμα επαναληπτική κατασκευή ενός μοντέλου παλινδρόμησης που περιλαμβάνει την αυτόματη επιλογή ανεξάρτητων μεταβλητών. Η διαθεσιμότητα στατιστικών πακέτων λογισμικού καθιστά δυνατή τη σταδιακή παλινδρόμηση, ακόμη και σε μοντέλα με εκατοντάδες μεταβλητές.
Τύποι σταδιακής παλινδρόμησης
Ο υποκείμενος στόχος της σταδιακής παλινδρόμησης είναι, μέσω μιας σειράς δοκιμών (δοκιμές F, t-tests) να βρεθεί μια σειρά από ανεξάρτητες μεταβλητές που επηρεάζουν σημαντικά την εξαρτημένη μεταβλητή. Αυτό γίνεται με τους υπολογιστές μέσω της επανάληψης, η οποία είναι η διαδικασία επίτευξης των αποτελεσμάτων ή των αποφάσεων περνώντας από επαναλαμβανόμενους γύρους ή κύκλους ανάλυσης. Η διεξαγωγή των ελέγχων αυτόματα με τη βοήθεια στατιστικών πακέτων λογισμικού έχει το πλεονέκτημα της εξοικονόμησης χρόνου για το άτομο.
Βασικές τακτικές
- Η ανάλυση παλινδρόμησης είναι μια στατιστική προσέγγιση που επιδιώκει να κατανοήσει και να μετρήσει τις σχέσεις μεταξύ ανεξάρτητων και εξαρτημένων μεταβλητών. Η σταθερή παλινδρόμηση είναι μια μέθοδος που εξετάζει τη στατιστική σημασία κάθε ανεξάρτητης μεταβλητής μέσα στο μοντέλο. Η προσέγγιση της επιλογής προς τα εμπρός προσθέτει μια μεταβλητή και έπειτα εξετάζει στατιστική σημασία. Η μέθοδος απομάκρυνσης προς τα πίσω αρχίζει με ένα μοντέλο φορτωμένο με πολλές μεταβλητές και στη συνέχεια αφαιρεί μια μεταβλητή για να ελέγξει τη σημασία της σε σχέση με τα συνολικά αποτελέσματα. Η οπισθοδρόμηση έχει πολλούς κριτικούς, καθώς είναι προσέγγιση που ταιριάζει τα δεδομένα σε ένα μοντέλο για να επιτύχει το επιθυμητό αποτέλεσμα.
Η σταδιακή παλινδρόμηση μπορεί να επιτευχθεί είτε με τη δοκιμή μίας ανεξάρτητης μεταβλητής κάθε φορά και τη συμπερίληψή της στο μοντέλο παλινδρόμησης εάν είναι στατιστικά σημαντική είτε με την ενσωμάτωση όλων των πιθανών ανεξάρτητων μεταβλητών στο μοντέλο και την εξάλειψη εκείνων που δεν είναι στατιστικά σημαντικές. Κάποιοι χρησιμοποιούν έναν συνδυασμό και των δύο μεθόδων και ως εκ τούτου υπάρχουν τρεις προσεγγίσεις για τη σταδιακή παλινδρόμηση:
- Η επιλογή προς τα εμπρός ξεκινάει χωρίς μεταβλητές στο μοντέλο, ελέγχει κάθε μεταβλητή καθώς προστίθεται στο μοντέλο και στη συνέχεια διατηρεί εκείνες που θεωρούνται πιο στατιστικά σημαντικές - επαναλαμβάνοντας τη διαδικασία έως ότου τα αποτελέσματα είναι βέλτιστα. Η απομάκρυνση ξεκινά με ένα σύνολο ανεξάρτητων μεταβλητών, διαγράφοντας ένα κάθε φορά και στη συνέχεια εξετάζοντας εάν η μεταβλητή που έχει αφαιρεθεί είναι στατιστικά σημαντική. Η κατεύθυνση της απόσπασης είναι ένας συνδυασμός των δύο πρώτων μεθόδων που ελέγχουν ποιες μεταβλητές πρέπει να συμπεριληφθούν ή να εξαιρεθούν.
Ένα παράδειγμα μιας σταδιακής παλινδρόμησης που χρησιμοποιεί τη μέθοδο απομάκρυνσης προς τα πίσω θα ήταν μια προσπάθεια κατανόησης της κατανάλωσης ενέργειας σε ένα εργοστάσιο χρησιμοποιώντας μεταβλητές όπως ο χρόνος λειτουργίας του εξοπλισμού, η ηλικία του εξοπλισμού, το μέγεθος του προσωπικού, οι εξωτερικές θερμοκρασίες και η χρονική διάρκεια του έτους. Το μοντέλο περιλαμβάνει όλες τις μεταβλητές - στη συνέχεια το κάθε ένα αφαιρείται, ένα κάθε φορά, για να προσδιορίσει ποιο είναι το λιγότερο στατιστικά σημαντικό. Στο τέλος, το μοντέλο μπορεί να δείξει ότι η χρονική περίοδος και οι θερμοκρασίες είναι πιο σημαντικές, ενδεχομένως υποδηλώνοντας ότι η μέγιστη κατανάλωση ενέργειας στο εργοστάσιο είναι όταν η χρήση του κλιματιστικού είναι στο υψηλότερο σημείο.
Περιορισμοί της σταδιακής παλινδρόμησης
Η ανάλυση παλινδρόμησης, τόσο γραμμική όσο και πολυμεταβλητή, χρησιμοποιείται ευρέως στον κόσμο των επενδύσεων σήμερα. Η ιδέα είναι συχνά να βρεθούν πρότυπα που υπήρχαν στο παρελθόν και τα οποία θα μπορούσαν να επαναληφθούν και στο μέλλον. Μια απλή γραμμική παλινδρόμηση, για παράδειγμα, θα μπορούσε να εξετάσει τους δείκτες τιμών / κερδών και τα αποθέματα αποθεμάτων για πολλά χρόνια για να προσδιορίσει εάν τα αποθέματα με χαμηλές αναλογίες P / E (ανεξάρτητη μεταβλητή) προσφέρουν υψηλότερες αποδόσεις (εξαρτημένη μεταβλητή). Το πρόβλημα με αυτή την προσέγγιση είναι ότι οι συνθήκες της αγοράς συχνά αλλάζουν και οι σχέσεις που πραγματοποιήθηκαν στο παρελθόν δεν ισχύουν απαραίτητα στο παρόν ή στο μέλλον.
Εν τω μεταξύ, η διαδικασία σταδιακής παλινδρόμησης έχει πολλούς κριτικούς και υπάρχουν ακόμη και κλήσεις για να σταματήσετε να χρησιμοποιείτε τη μέθοδο εντελώς. Οι στατιστικοί σημειώνουν αρκετά μειονεκτήματα στην προσέγγιση, συμπεριλαμβανομένων των λανθασμένων αποτελεσμάτων, της εγγενής μεροληψίας στην ίδια τη διαδικασία και της ανάγκης για σημαντική υπολογιστική ισχύ για την ανάπτυξη σύνθετων μοντέλων παλινδρόμησης μέσω της επανάληψης.
