Ο συνήθης τύπος κατανομής βασίζεται σε δύο απλές παραμέτρους - μέση και τυπική απόκλιση - οι οποίες ποσοτικοποιούν τα χαρακτηριστικά ενός δεδομένου συνόλου δεδομένων. Ενώ ο μέσος όρος υποδεικνύει την "κεντρική" ή τη μέση τιμή ολόκληρου του συνόλου δεδομένων, η τυπική απόκλιση υποδηλώνει την "εξάπλωση" ή τη μεταβολή των σημείων δεδομένων γύρω από αυτή τη μέση τιμή.
Εξετάστε τα ακόλουθα 2 σύνολα δεδομένων:
Το σύνολο δεδομένων 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Το σύνολο δεδομένων 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Για το σύνολο δεδομένων1, μέσος όρος = 10 και τυπική απόκλιση (stddev) = 0
Για το Dataset2, μέσος όρος = 10 και τυπική απόκλιση (stddev) = 2, 83
Ας σχεδιάσουμε αυτές τις τιμές για το DataSet1:
Ομοίως για το DataSet2:
Η κόκκινη οριζόντια γραμμή και στις δύο παραπάνω γραφικές παραστάσεις υποδεικνύει την "μέση" ή τη μέση τιμή κάθε συνόλου δεδομένων (10 και στις δύο περιπτώσεις). Τα ροζ βέλη στο δεύτερο γράφημα υποδηλώνουν την εξάπλωση ή τη μεταβολή των τιμών δεδομένων από τη μέση τιμή. Αυτό αντιπροσωπεύεται από τιμή τυπικής απόκλισης 2, 83 στην περίπτωση του DataSet2. Δεδομένου ότι το DataSet1 έχει όλες τις ίδιες τιμές (ως 10 το καθένα) και καμία παραλλαγή, η τιμή stddev είναι μηδέν και συνεπώς δεν ισχύουν ροζ βέλη.
Η τιμή stddev έχει μερικά σημαντικά και χρήσιμα χαρακτηριστικά τα οποία είναι εξαιρετικά χρήσιμα στην ανάλυση δεδομένων. Για μια κανονική κατανομή, οι τιμές των δεδομένων κατανέμονται συμμετρικά σε κάθε πλευρά του μέσου όρου. Για κάθε φυσιολογικά κατανεμημένο σύνολο δεδομένων, γράφοντας γράφημα με stddev στον οριζόντιο άξονα και όχι. των τιμών δεδομένων στον κατακόρυφο άξονα, λαμβάνεται το ακόλουθο γράφημα.
Ιδιότητες μιας κανονικής διανομής
- Η κανονική καμπύλη είναι συμμετρική ως προς τον μέσον · Ο μέσος όρος είναι στη μέση και διαιρεί την περιοχή σε δύο μισά · Η συνολική επιφάνεια κάτω από την καμπύλη είναι ίση με 1 για μέση τιμή = 0 και stdev = 1 · Η κατανομή περιγράφεται εντελώς με τη μέση τιμή και stddev
Όπως φαίνεται από το παραπάνω γράφημα, το stddev αντιπροσωπεύει τα εξής:
- Το 68, 3% των τιμών δεδομένων είναι εντός 1 τυπικής απόκλισης του μέσου όρου (-1 έως +1) 95, 4% των τιμών των δεδομένων είναι εντός 2 τυπικών αποκλίσεων της μέσης τιμής (-2 έως +2) 99, 7% των τιμών των δεδομένων είναι εντός 3 τυπικών αποκλίσεων του μέσου όρου (-3 έως +3)
Η περιοχή κάτω από την καμπύλη σχήμα καμπάνας, όταν μετριέται, υποδεικνύει την επιθυμητή πιθανότητα ενός δεδομένου εύρους:
- μικρότερη από X: - π.χ. πιθανότητα οι τιμές των δεδομένων να είναι μικρότερες από 70 μεγαλύτερες από το X - π.χ. πιθανότητα των τιμών των δεδομένων να είναι μεγαλύτερες από 95 μεταξύ Χ1 και Χ2 - π.χ. πιθανότητα τιμών δεδομένων μεταξύ 65 και 85
όπου το Χ είναι τιμή ενδιαφέροντος (παραδείγματα παρακάτω).
Η αντιστοίχιση και ο υπολογισμός της περιοχής δεν είναι πάντα βολικά, καθώς διαφορετικά σύνολα δεδομένων θα έχουν διαφορετικές τιμές μέσης και stddev. Για να διευκολυνθεί μια ομοιόμορφη τυποποιημένη μέθοδος για εύκολους υπολογισμούς και δυνατότητα εφαρμογής σε προβλήματα πραγματικού κόσμου, εισήχθη η τυπική μετατροπή σε τιμές Ζ, οι οποίες αποτελούν το μέρος του Πίνακα Κανονικής Διανομής.
Z = (X - μέση τιμή) / stddev, όπου X είναι η τυχαία μεταβλητή.
Βασικά, αυτή η μετατροπή αναγκάζει το μέσο και stddev να τυποποιηθούν στα 0 και 1 αντίστοιχα, γεγονός που καθιστά δυνατή τη χρήση ενός πρότυπου ορισμένου συνόλου τιμών Ζ (από τον Κανονικό Πίνακα Κατανομής) για εύκολους υπολογισμούς. Μια στιγμιαία απεικόνιση του τυποποιημένου πίνακα τιμών z που περιέχει τις πιθανότητες είναι η εξής:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0.0 |
0.00000 |
0.00399 |
0.00798 |
0.01197 |
0.01595 |
0.01994 |
… |
0.1 |
0.0398 |
0.04380 |
0.04776 |
0, 05172 |
0.05567 |
0.05966 |
… |
0.2 |
0, 0793 |
0.08317 |
0.08706 |
0.09095 |
0.09483 |
0.09871 |
… |
0.3 |
0, 11791 |
0, 12172 |
0.12552 |
0.12930 |
0.13307 |
0.13683 |
… |
0.4 |
0.15542 |
0.15910 |
0.16276 |
0.16640 |
0.17003 |
0.17364 |
… |
0, 5 |
0.19146 |
0.19497 |
0.19847 |
0.20194 |
0.20540 |
0.20884 |
… |
0.6 |
0.22575 |
0.22907 |
0.23237 |
0.23565 |
0, 23891 |
0.24215 |
… |
0.7 |
0.25804 |
0.26115 |
0.26424 |
0.26730 |
0.27035 |
0.27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
Για να βρείτε την πιθανότητα που σχετίζεται με την τιμή z του 0.239865, στρογγυλοποιήστε τον πρώτο γύρο σε 2 δεκαδικά ψηφία (δηλ. 0, 24). Στη συνέχεια, ελέγξτε τα πρώτα 2 σημαντικά ψηφία (0, 2) στις σειρές και για το λιγότερο σημαντικό ψηφίο (υπόλοιπο 0, 04) στη στήλη. Αυτό θα οδηγήσει σε αξία 0, 09483.
Ο πλήρης κανονικός πίνακας διανομής, με ακρίβεια έως και 5 δεκαδικά ψηφία για τις τιμές πιθανότητας (συμπεριλαμβανομένων εκείνων για τις αρνητικές τιμές), μπορεί να βρεθεί εδώ.
Ας δούμε μερικά παραδείγματα πραγματικής ζωής. Το ύψος των ατόμων σε μια μεγάλη ομάδα ακολουθεί ένα κανονικό μοτίβο διανομής. Ας υποθέσουμε ότι έχουμε ένα σύνολο 100 ατόμων των οποίων τα ύψη καταγράφονται και τα μέσα και stddev υπολογίζονται σε 66 και 6 ίντσες αντίστοιχα.
Ακολουθούν μερικές ερωτήσεις που μπορούν εύκολα να απαντηθούν χρησιμοποιώντας τον πίνακα τιμών z:
- Ποια είναι η πιθανότητα ότι ένα άτομο στην ομάδα είναι 70 ίντσες ή λιγότερο;
Ερώτηση είναι να βρούμε σωρευτική τιμή του P (X <= 70) δηλαδή σε ολόκληρο το σύνολο δεδομένων 100, πόσες τιμές θα είναι μεταξύ 0 και 70.
Ας αρχικά μετατρέψουμε την τιμή X των 70 στην αντίστοιχη τιμή Ζ.
Z = (X - μέση τιμή) / stddev = (70-66) / 6 = 4/6 = 0, 666667 = 0, 67 (στρογγυλοποίηση σε 2 δεκαδικά ψηφία)
Τώρα πρέπει να βρούμε P (Z <= 0.67) = 0. 24857 (από τον πίνακα z παραπάνω)
δηλαδή υπάρχει πιθανότητα 24, 857% ότι ένα άτομο στην ομάδα θα είναι μικρότερο ή ίσο με 70 ίντσες.
Αλλά παραμένετε - τα παραπάνω είναι ελλιπή. Θυμηθείτε, ψάχνουμε για πιθανότητα όλων των πιθανών ύψους μέχρι 70, δηλ. Από το 0 έως το 70. Τα παραπάνω σας δίνουν μόνο το μερίδιο από τη μέση έως την επιθυμητή τιμή (δηλαδή 66 έως 70). Πρέπει να συμπεριλάβουμε το άλλο μισό - από το 0 έως το 66 - για να φτάσουμε στη σωστή απάντηση.
Από το 0 έως το 66 αντιπροσωπεύει το μισό τμήμα (δηλαδή ένα ακραίο έως μεσαίο μέσο όρο), η πιθανότητα του είναι απλά 0, 5.
Εξ ου και η σωστή πιθανότητα ενός ατόμου να είναι 70 ίντσες ή λιγότερο = 0.24857 + 0.5 = 0. 74857 = 74.857%
Γραφικά (υπολογίζοντας την περιοχή), αυτές είναι οι δύο αθροισμένες περιοχές που αντιπροσωπεύουν τη λύση:
- Ποια είναι η πιθανότητα ότι ένα άτομο είναι 75 ίντσες ή υψηλότερο;
δηλαδή Βρείτε συμπληρωματική αθροιστική P (X> = 75).
Ζ = (μέσος όρος Χ) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1.5) = 1 - Ρ (Ζ <= 1.5) = 1 - (0.5 + 0.43319) = 0.06681 =
- Ποια είναι η πιθανότητα ενός ατόμου να είναι μεταξύ 52 ίντσες και 67 ίντσες;
Βρείτε P (52 <= X <= 67).
Ρ (52 <= Χ <= 67) = Ρ = Ρ (-2.33 <= Ζ <= 0.17)
= Ρ (Ζ <= 0.17) -Ρ (Ζ <= -0.233) = (0.5 + 0.56749) - (.40905) =
Αυτός ο κανονικός πίνακας διανομής (και οι τιμές z) χρησιμοποιείται συνήθως για οποιονδήποτε υπολογισμό πιθανοτήτων για τις αναμενόμενες κινήσεις τιμών στη χρηματιστηριακή αγορά για αποθέματα και δείκτες. Χρησιμοποιούνται σε συναλλαγές με βάση το εύρος τιμών, προσδιορίζοντας την ανοδική τάση ή την πτωτική τάση, τα επίπεδα στήριξης ή αντοχής και άλλους τεχνικούς δείκτες που βασίζονται σε έννοιες κανονικής διανομής μέσης και τυπικής απόκλισης.
Σύγκριση επενδυτικών λογαριασμών × Οι προσφορές που εμφανίζονται σε αυτόν τον πίνακα προέρχονται από συνεργασίες από τις οποίες η Investopedia λαμβάνει αποζημίωση. Όνομα παροχέα ΠεριγραφήΣχετικά Άρθρα
Trading Βασική Εκπαίδευση
Έλεγχος υποθέσεων σε οικονομικά θέματα: Έννοια και παραδείγματα
Διαχείριση κινδύνου
Βελτιστοποιήστε το χαρτοφυλάκιό σας χρησιμοποιώντας την κανονική διανομή
Τεχνική Ανάλυση Βασική Εκπαίδευση
Η γραμμική παλινδρόμηση του χρόνου και της τιμής
Διαχείριση κινδύνου
Οι χρήσεις και τα όρια της μεταβλητότητας
Οικονομική ανάλυση
Πώς να υπολογίσετε την τιμή σε κίνδυνο (VaR) στο Excel
Εργαλεία θεμελιώδους ανάλυσης
Κατανόηση των μετρήσεων μεταβλητότητας
Συνδέσεις συνεργατώνΣχετικοί όροι
Ορισμός διαστήματος εμπιστοσύνης Το διάστημα εμπιστοσύνης, στις στατιστικές, αναφέρεται στην πιθανότητα ότι μια παράμετρος του πληθυσμού θα πέσει μεταξύ δύο καθορισμένων τιμών. περισσότερη διαχείριση κινδύνων στη χρηματοδότηση Στον οικονομικό κόσμο, η διαχείριση κινδύνων είναι η διαδικασία ταυτοποίησης, ανάλυσης και αποδοχής ή μετριασμού της αβεβαιότητας στις επενδυτικές αποφάσεις. Η διαχείριση κινδύνων συμβαίνει κάθε φορά που ένας επενδυτής ή διαχειριστής αμοιβαίου κεφαλαίου αναλύει και επιχειρεί να ποσοτικοποιήσει το ενδεχόμενο απώλειας μιας επένδυσης. περισσότερο Κατανόηση της καμπύλης επιτοκίων επιτοκίου επιτοκίων Η καμπύλη του ταμείου επιτοκίων επιτοκίου ορίζεται ως μια καμπύλη αποδόσεων που κατασκευάστηκε με τη χρήση των επιτοκίων spot Treasury αντί των αποδόσεων. Η καμπύλη διαθεσίμων επιτόκιο μπορεί να χρησιμοποιηθεί ως σημείο αναφοράς για την τιμολόγηση ομολόγων. περισσότερος ορισμός δείκτη Gini Ο δείκτης Gini είναι ένα στατιστικό μέτρο διανομής που χρησιμοποιείται συχνά ως δείκτης οικονομικής ανισότητας. περισσότερο μοντέλο τιμολόγησης ενεργητικού κεφαλαίου (CAPM) Το μοντέλο τιμολόγησης περιουσιακών στοιχείων κεφαλαίου είναι ένα μοντέλο που περιγράφει τη σχέση μεταξύ κινδύνου και αναμενόμενης απόδοσης. περισσότερα Κατανόηση του αρμονικού μέσου Ο μέσος όρος των αρμονικών είναι ένας μέσος όρος ο οποίος χρησιμοποιείται στη χρηματοδότηση ως μέσο όρο πολλαπλάσια όπως ο λόγος τιμής-κέρδους. περισσότερο