Τι είναι το Winsorized Mean?
Η μέθοδος Winsorized είναι μια μέθοδος μέτρησης του μέσου όρου, η οποία αρχικά αντικαθιστά τις μικρότερες και τις μεγαλύτερες τιμές με τις παρατηρήσεις που βρίσκονται πλησιέστερα σε αυτές. Αυτό γίνεται για τον περιορισμό της επίδρασης των ανώμαλων ακραίων τιμών ή των ακραίων τιμών στον υπολογισμό. Μετά την αντικατάσταση των τιμών, στη συνέχεια χρησιμοποιείται ο αριθμητικός μέσος όρος για τον υπολογισμό του μέσου κέρδους.
Η φόρμουλα για το Winsorized Mean Is
Winsorized Μέσος όρος = Nxn… xn + 1 + xn + 2… xn όπου: n = Ο αριθμός των μεγαλύτερων και μικρότερων datapoints που πρέπει να αντικατασταθούν από την παρατήρηση
Τα ενσωματωμένα μέσα εκφράζονται με δύο τρόπους. Ένας "k n " winsorized mean αναφέρεται στην αντικατάσταση των μικρότερων και μεγαλύτερων παρατηρήσεων «k», όπου το «k» είναι ένας ακέραιος αριθμός. Ένας μέσος όρος "x%", που είναι εγγεγραμμένος, περιλαμβάνει την αντικατάσταση ενός δεδομένου ποσοστού τιμών από τα δύο άκρα των δεδομένων.
Πώς να υπολογίσετε το Winsorized Mean
Ο winsorized μέσος υπολογίζεται με την αντικατάσταση των μικρότερων και μεγαλύτερων σημείων δεδομένων, αθροίζοντας τότε όλα τα σημεία δεδομένων και διαιρώντας το άθροισμα με τον συνολικό αριθμό σημείων δεδομένων.
Τι σημαίνει το Winsorized Mean σας λέει;
Ο winsorized μέσος όρος είναι λιγότερο ευαίσθητος στις αποκλίσεις επειδή μπορεί να τις αντικαταστήσει με λιγότερο ακραίες τιμές. Δηλαδή, είναι λιγότερο ευαίσθητο σε περιγράμματα έναντι του μέσου όρου. Ωστόσο, εάν μια κατανομή έχει ουρές λίπους, η επίδραση της αφαίρεσης των υψηλότερων και των χαμηλότερων τιμών στην κατανομή θα έχει μικρή επίδραση λόγω του μεγάλου αριθμού μεταβλητότητας στα στοιχεία κατανομής.
Βασικές τακτικές
- Μέθοδος μέσου όρου που περιλαμβάνει την αντικατάσταση των μικρότερων και των μεγαλύτερων τιμών με τις παρατηρήσεις που βρίσκονται πλησιέστερα σ 'αυτές. Μάλλον ευαίσθητες σε υπερβολικές τιμές, επειδή μπορούν να τις αντικαταστήσουν με λιγότερο ακραίες τιμές. Αντίθετα με τον μέσο καθαρισμού, που περιλαμβάνει την αφαίρεση σημείων δεδομένων - τείνουν να είναι κοντά.
Παράδειγμα τρόπου χρήσης του Winsorized Mean
Μπορούμε να υπολογίσουμε τον winsorized μέσον για το ακόλουθο σύνολο δεδομένων: 1, 5, 7, 8, 9, 10, 14. Σε αυτό το παράδειγμα, υποθέτουμε ότι ο winsorized μέσος είναι στην πρώτη σειρά, αντικαθιστούμε τις μικρότερες και τις μεγαλύτερες τιμές με τους πλησιέστερες παρατηρήσεις.
Το σύνολο δεδομένων εμφανίζεται τώρα ως εξής: 5, 5, 7, 8, 9, 10, 10. Λαμβάνοντας έναν αριθμητικό μέσο όρο του νέου συνόλου παράγεται ένας μέσος winsorized 7, 7 ή (5 + 5 + 7 + 8 + 9 + 10 + 10) διαιρούμενο με 7.
Ή θεωρήστε ένα 20% winsorized μέσο που παίρνει το κορυφαίο 10% και κάτω 10% και τις αντικαθιστά με την επόμενη πλησιέστερη αξία τους. Θα προβάλλουμε το ακόλουθο σύνολο δεδομένων: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, τα μικρότερα και τα μεγαλύτερα σημεία δεδομένων, ή 10%, θα αντικατασταθούν με την επόμενη πλησιέστερη τιμή. Έτσι, το νέο σύνολο δεδομένων είναι: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61. Ο winsorized μέση τιμή είναι 33, 9, ή το σύνολο των δεδομένων (678) διαιρείται με τον συνολικό αριθμό σημείων δεδομένων (20).
Η διαφορά ανάμεσα στο μέσο και το τρίψιμο
Ο winsorized μέσος όρος περιλαμβάνει την τροποποίηση των σημείων δεδομένων, ενώ ο μέσος όρος της αποκοπής περιλαμβάνει την αφαίρεση σημείων δεδομένων. Είναι σύνηθες για τον μέσο όρο και το κομμένο μέσο που είναι να είναι κοντά.
Περιορισμοί στη χρήση του Winsorized Mean
Ένα σημαντικό μειονέκτημα για τα winsorized μέσα είναι ότι εισάγουν προκατάληψη στο σύνολο δεδομένων. Χορηγηθεί, το σύνολο δεδομένων είναι ιδανικά λιγότερο μεροληπτικό μετά την τροποποίηση από ό, τι εάν είχαν απομείνει τα απομειωμένα.
Μάθετε περισσότερα για το Winsorized Mean
Για σχετικές πληροφορίες, σχετικά με τις διαφορές μεταξύ βασικών μέσων υπολογισμών.
