Τι είναι το διάστημα εμπιστοσύνης;
Ένα διάστημα εμπιστοσύνης, στα στατιστικά στοιχεία, αναφέρεται στην πιθανότητα ότι μια παράμετρος του πληθυσμού θα πέσει μεταξύ δύο καθορισμένων τιμών για ένα συγκεκριμένο χρονικό διάστημα. Τα διαστήματα εμπιστοσύνης μετρούν τον βαθμό αβεβαιότητας ή βεβαιότητας σε μια μέθοδο δειγματοληψίας. Ένα διάστημα εμπιστοσύνης μπορεί να πάρει οποιοδήποτε αριθμό πιθανοτήτων, με το πιο συνηθισμένο επίπεδο εμπιστοσύνης 95% ή 99%.
Το διάστημα εμπιστοσύνης και το επίπεδο εμπιστοσύνης αλληλοσυνδέονται, αλλά δεν είναι ακριβώς τα ίδια.
Κατανόηση του διαστήματος εμπιστοσύνης
Οι στατιστικοί χρησιμοποιούν τα διαστήματα εμπιστοσύνης για να μετρήσουν την αβεβαιότητα. Για παράδειγμα, ένας ερευνητής επιλέγει διαφορετικά δείγματα τυχαία από τον ίδιο πληθυσμό και υπολογίζει ένα διάστημα εμπιστοσύνης για κάθε δείγμα. Τα σύνολα δεδομένων που προκύπτουν είναι όλα διαφορετικά. μερικά διαστήματα περιλαμβάνουν την πραγματική παράμετρο πληθυσμού και άλλα όχι.
Ένα διάστημα εμπιστοσύνης είναι ένα εύρος τιμών που πιθανόν να περιέχει μια άγνωστη παράμετρο πληθυσμού. Το επίπεδο εμπιστοσύνης αναφέρεται στο ποσοστό πιθανότητας ή βεβαιότητας ότι το διάστημα εμπιστοσύνης θα περιέχει την πραγματική παράμετρο πληθυσμού όταν σχεδιάζετε ένα τυχαίο δείγμα πολλές φορές. Ή, στην τοπική γλώσσα, "Είμαστε 99% σίγουροι ( επίπεδο εμπιστοσύνης) ότι τα περισσότερα από αυτά τα σύνολα δεδομένων (διαστήματα εμπιστοσύνης) περιέχουν την πραγματική παράμετρο του πληθυσμού".
Βασικές τακτικές
- Ένα διάστημα εμπιστοσύνης υπολογίζει την πιθανότητα ότι μια παράμετρος πληθυσμού θα πέσει μεταξύ δύο καθορισμένων τιμών. Τα διαστήματα εμπιστοσύνης μετρούν τον βαθμό αβεβαιότητας ή βεβαιότητας σε μια μέθοδο δειγματοληψίας. Πολύ συχνά, τα διαστήματα εμπιστοσύνης αντανακλούν επίπεδα εμπιστοσύνης 95% ή 99%.
Υπολογισμός διαστήματος εμπιστοσύνης
Ας υποθέσουμε ότι μια ομάδα ερευνητών μελετά τα ύψη των μπάσκετ των γυμνασίων. Οι ερευνητές λαμβάνουν ένα τυχαίο δείγμα από τον πληθυσμό και καθορίζουν ένα μέσο ύψος 74 ίντσες. Ο μέσος όρος των 74 ιντσών είναι μια εκτίμηση σημείου του μέσου όρου του πληθυσμού. Μια εκτίμηση σημείων από μόνη της έχει περιορισμένη χρησιμότητα επειδή δεν αποκαλύπτει την αβεβαιότητα που συνδέεται με την εκτίμηση. δεν έχετε μια καλή αίσθηση για το πόσο μακριά αυτό το δείγμα των 74 ιντσών σημαίνει ότι μπορεί να είναι από τον μέσο πληθυσμό. Αυτό που λείπει είναι ο βαθμός αβεβαιότητας σε αυτό το μοναδικό δείγμα.
Τα διαστήματα εμπιστοσύνης παρέχουν περισσότερες πληροφορίες από τις εκτιμήσεις σημείων. Με την καθιέρωση ενός διαστήματος εμπιστοσύνης 95% χρησιμοποιώντας τη μέση και τυπική απόκλιση του δείγματος και υποθέτοντας μια κανονική κατανομή όπως αναπαρίσταται από την καμπύλη του καμπάνα, οι ερευνητές καταλήγουν σε ένα άνω και κάτω όριο που περιέχει το πραγματικό μέσο όρο του 95% του χρόνου. Υποθέστε ότι το διάστημα είναι μεταξύ 72 και 76 ίντσες. Αν οι ερευνητές λάβουν 100 τυχαία δείγματα από τον πληθυσμό των μπάτσελετ των γυμνασίων στο σύνολό τους, ο μέσος όρος θα πρέπει να κυμαίνεται μεταξύ 72 και 76 ίντσες σε 95 από αυτά τα δείγματα.
Εάν οι ερευνητές θέλουν ακόμα μεγαλύτερη εμπιστοσύνη, μπορούν να επεκτείνουν το διάστημα στο 99% της εμπιστοσύνης. Με αυτόν τον τρόπο, δημιουργείται ένα ευρύτερο φάσμα, καθώς δημιουργείται χώρος για μεγαλύτερο αριθμό δειγμάτων. Αν καθορίσουν το διάστημα εμπιστοσύνης 99% ως μεταξύ 70 και 78 ίντσες, μπορούν να αναμένουν ότι 99 από τα 100 δείγματα που αξιολογούνται θα περιέχουν μια μέση τιμή μεταξύ αυτών των αριθμών. Ένα επίπεδο εμπιστοσύνης 90% σημαίνει ότι αναμένουμε το 90% των εκτιμήσεων διαστήματος να περιλαμβάνει την παράμετρο του πληθυσμού. Ομοίως, ένα επίπεδο εμπιστοσύνης 99% σημαίνει ότι το 95% των διαστημάτων θα περιλαμβάνει την παράμετρο.
Κοινές παρανοήσεις σχετικά με το διάστημα εμπιστοσύνης
Η μεγαλύτερη παρανόηση όσον αφορά τα διαστήματα εμπιστοσύνης είναι ότι αντιπροσωπεύουν το ποσοστό των δεδομένων από ένα δεδομένο δείγμα που πέφτει μεταξύ των ανώτερων και κατώτερων ορίων. Για παράδειγμα, κάποιος μπορεί να ερμηνεύσει εσφαλμένα το προαναφερθέν διάστημα εμπιστοσύνης 99% 70 έως 78 ίντσες, υποδηλώνοντας ότι το 99% των δεδομένων σε ένα τυχαίο δείγμα πέφτει μεταξύ αυτών των αριθμών. Αυτό είναι λανθασμένο, αν και υπάρχει ξεχωριστή μέθοδος στατιστικής ανάλυσης για να γίνει αυτός ο προσδιορισμός. Κάτι τέτοιο συνεπάγεται τον προσδιορισμό της μέσης και τυπικής απόκλισης του δείγματος και τη σχεδίαση αυτών των αριθμών σε καμπύλη καμπάνας.
