Διάλεξη 14 / Διάλεξη 14 / Διάλεξη 14

Διάλεξη 14: Υπόσχεσαι να μιλήσουμε για μια μέθοδο που μπορούμε να εκτιμήσουμε παραμέτρους, τη μέθοδο των ροπών που σας είπα ότι είναι λίγο παλαιομοδίτικη, τώρα θα προχωρήσουμε μία άλλη μέθοδο. Να θυμηθούμε λίγο τι κάναμε, δεν ξέρω αν βλέπετε από εκεί πέρα, φαίνεται από εδώ να γράψω, από εκεί παιδιά....

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος δημιουργός: Κουγιουμτζής Δημήτριος (Αναπληρωτής Καθηγητής)
Γλώσσα:el
Φορέας:Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Είδος:Ανοικτά μαθήματα
Συλλογή:Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών / Θεωρία Πιθανοτήτων και Στατιστική
Ημερομηνία έκδοσης: ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ 2015
Θέματα:
Άδεια Χρήσης:Αναφορά-Παρόμοια Διανομή
Διαθέσιμο Online:https://delos.it.auth.gr/opendelos/videolecture/show?rid=53fe09e3
Απομαγνητοφώνηση
Διάλεξη 14: Υπόσχεσαι να μιλήσουμε για μια μέθοδο που μπορούμε να εκτιμήσουμε παραμέτρους, τη μέθοδο των ροπών που σας είπα ότι είναι λίγο παλαιομοδίτικη, τώρα θα προχωρήσουμε μία άλλη μέθοδο. Να θυμηθούμε λίγο τι κάναμε, δεν ξέρω αν βλέπετε από εκεί πέρα, φαίνεται από εδώ να γράψω, από εκεί παιδιά. Θυμίζω ότι μιλάμε για μία παράμετρο χ, που έχει κάποια κατανομή σε ένα πληθυσμό, άρα είμαστε σε ένα πληθυσμό, τα έχω ξαναγράψει αυτά. Σας τα θυμίζω για να βάλουμε λίγο το πλαίσιο του προβλήματος που είμαστε πάλι, για να το θυμηθούμε. Είπαμε ότι δεν μπορούμε να μελετήσουμε ολόκληρη την κατανομή, πάμε σε κάποια παράμετρο της κατανομής που μας ενδιαφέρει να την προσδιορίσουμε, να την βρούμε. Και εδώ μιλάμε για τη μέση τιμή και τη διασπορά ή την τυπική απόκλυση. Θα πούμε και για κάνα δυο ακόμα και άλλες παραμέτρες την άλλη φορά, αλλά σήμερα θα μείνουμε εδώ πέρα πάλι. Για να προσδιορίσω λοιπόν αυτά, πηγαίνω σε ένα δείγμα, από εδώ είναι τα γνωστά που γνωρίζω δηλαδή, που έχει κάποιες παρατηρήσεις, αυτές εδώ, και υπολογίζουμε κάποιο στατιστικό. Και την προηγούμενη φορά είχαμε πει, εντάξει, σαν καλύτερο στατιστικό για τη μέση τιμή είχαμε πει ότι είναι ο μέσος όρος. Και για τη διασπορά είχαμε πει το S τετράγωνο. Αλλά τι γίνεται αν αυτά δεν τα γνωρίζω, δεν τα γνωρίζω, πώς τα βρήκα αυτά ό,τι είναι τα καλύτερα. Και είχαμε πει και για την τυπική απόκλυση το S. Τι γίνεται ας πούμε αν έχω μια ομοιόμορφη κατανομή που λέγαμε ότι έχω μια ομοιόμορφη κατανομή και θέλαμε να βρούμε εδώ πέρα τα άκρα της κατανομής, τα α και β. Το βγάλαμε μέσω των ροπών, δηλαδή μέσω της σχέση που έχουν τα α και β με τη μέση τιμή και τη διασπορά. Εδώ τώρα θα πούμε για μια άλλη μέθοδο που είναι πολύ γενική που θα μας βρει πάλι τέτοια στατιστικά. Δηλαδή θα δούμε ότι τελικά αυτό εδώ που το βγάλαμε κάπως αυθαίρετα το μέσο όρο, δεν το δικαιολογήσαμε πώς καταλήξαμε σε αυτό εδώ. Θα μας βγάλει αυτή η μέθοδος πάλι ότι το καλύτερο στατιστικό για να εκτιμήσουμε τη μέση τιμή είναι ο μέσος όρος. Το καλύτερο στατιστικό για τη διασπορά είναι αυτό εδώ, βέβαια δεν θα μας βγάλει ακριβώς αυτό που διαιρούμε με 1-1, αλλά θα μας βγάλει με 1 που είναι κάτι παρόμοιο, το κοιματάκι τετράγωνο που το λέγαμε, που είναι ασυπτωτικά αμερόλυπτο. Και φυσικά εδώ έχουμε την τετραγωνική ρίζα του S τετράγωνο. Τώρα αυτή η διαφάνεια σας είχα πει την προηγούμενη φορά ότι είναι η πιο δύσκολη διαφάνεια που έχουμε στο μάθημα. Για αυτό θα την ξεκινήσω λίγο με ένα παράδειγμα, για να τη δούμε. Ας δώσω όμως λίγο τα αρχικά που είναι πότε μπορούμε να χρησιμοποιήσουμε αυτή τη μέθοδο. Λέγεται μέθοδο μεγείς πιθανοφάνειας, maximum likelihood, τη λέμε στα αγγλικά. Και έχει εδώ πέρα τις συνθήκες, η πρώτη γραμμούλα εκεί πέρα μας λέει τις συνθήκες. Λέει δίνονται ανεξάρτητα X1, X2 και τα λοιπά X1, δηλαδή ανεξάρτητες παρατηρήσεις και επίσης δίνεται και αυτό το F κεφαλαίο. Το F κεφαλαίο ξέρετε τι είναι? Κάποιος το είπε το ψηθήρισε κάποιος. Η αθριστική. Η αθριστική συνάρτηση κατανομής, έτσι. Δηλαδή μας λέει ότι γνωρίζουμε τι περίπου κατανομή είναι, τι οικογένεια είναι. Αν είναι κανονική, ομοιόμορφη, εκθετική, αυτό μας λέει. Αυτές είναι οι δύο βασικές προϋποθέσεις. Το ανεξάρτητα το καταλαβαίνουμε? Τι σημαίνει ανεξάρτητα. Πώς το καταλαβαίνει το ανεξάρτητα. Αν πάρουμε το ύψος των φοιτητών που λέγαμε το χαζό παράδειγμα αυτό. Τι σημαίνει να έχω ανεξάρτητες παρατηρήσεις μπορώ να το θεωρήσω για το παράδειγμα με τα ύψη των φοιτητών. Είναι ανεξάρτητα τα ύψη μεταξύ τους. Το ύψος του Δημήτρια και το δικό σου Μίλτος. Μπορώ να θεωρήσω ότι είναι ανεξάρτητα. Αν δεν τους ξέρω λέω ότι είναι οι δύο πρώτοι που κάθονται στο θρανείο. Δεν ξέρω είναι ο Μίλτος και ο Βαγγέλης. Ναι. Αν είχα δηλαδή κάποια άλλη συνθήκη μέσα στα δεδομένα μου που να μου το υποδεικνύει αυτό. Άρα μπορώ να θεωρήσω ότι είναι ανεξάρτητα. Θα κελάτε εε. Θέλω να σας κάνω δύσκολη ερώτηση. Μαθηματικά πως θα το γράψω όταν έχω δύο τυχιές μεταβλητές που είναι ανεξάρτητες. Πως το προσδιορίζω μαθηματικά αυτό. Πως το ορίζω μαθηματικά. Να σε βοηθήσω λίγο. Αν έχω δύο γεγονότα πως μπορώ να δείξω ότι είναι ανεξάρτητα. Όχι ακριβώς όμως η τομή των γεγονότων. Πως το λέμε. Η πιθανότητα της τομής δύο γεγονότων είναι ίση με το γινόμενο των πιθανότητων. Σωστά. Αυτή ήταν η ανεξαρτησία για τα γεγονότα. Τα ξέρετε αυτά από τα πρώτα μαθήματα που κάνεις στην πιθανότητα. Εάν εδώ δεν βάλω γεγονότα και βάλω δύο μεταβλητές και ας βάλω χ1 χ2. Μου λέει η πιθανότητα να συμβεί το χ1 και το χ2. Και αυτό το και μπορώ να το βάλω και έτσι. Μπορώ να συμβεί και το χ1 και το χ2 ή να ίσο με την πιθανότητα να συμβεί το χ1 και την πιθανότητα να συμβεί το χ2. Άρα αυτή η ερμηνεία που βάζω εδώ πέρα στο ανεξάρτητα είναι ότι μπορώ να χρησιμοποιήσω κάτι τέτοιο. Και βέβαια επειδή μιλάω για συνεχείς στοιχές μεταβλητές δεν έχει νόημα να μιλάω για πιθανότητα αλλά για F δηλαδή συνάρτηση πυκνότητας πιθανότητας. Άρα η ανεξαρτησία τελικά μεταφράζεται σε αυτό εδώ. Το άλλο τώρα μου λέει ότι γνωρίζω την οικογένεια της κατανομής. Και ας πάω τώρα σε ένα παράδειγμα για να το δω αυτό. Στο χαζό παράδειγμα με το ύψος των φοιτητών αν βάλω ότι εδώ είναι το 1,60, εδώ είναι το 1,70, εδώ είναι το 1,80, εδώ είναι το 1,90 κτλ. Και έστω ότι παίρνω ένα δείγμα και κάθε γραμμούλα από εδώ πέρα είναι κάποιες παρατηρήσεις που έχω. Εντάξει. Και λέω τώρα, το ζητούμενο για μένα, οι παράμετρος που θέλω να προσδιορίσω είναι η μέση τιμή της κατανομής. Και λέω ποια είναι η πιο πιθανή τιμή για το θήτα, για τη μέση τιμή. Εάν θεωρήσω λοιπόν ότι η κατανομή είναι κανονική και έχω μια τέτοια κατανομή, κανονική, η κατανομή μου είναι πού να πάω να βάλω το κέντρο της, πού να πάω να την ορίσω. Το θήτα λοιπόν για μένα είναι το μή. Να το βάλω εδώ, εδώ, εδώ ή εδώ. Και ας πούμε ότι αυτό είναι το νούμερο 1, το νούμερο 2, το νούμερο 3 και το νούμερο 4. Καταλαβαίνετε ποιο είναι το πρόβλημα. Έστω ότι δεν έχω πρόβλημα με τη διασπορά της κατανομής, το άνοιγμα δηλαδή της καμπανούλας, το ξέρω. Αυτό που δεν ξέρω είναι το μή. Οι παράμετρος που με ενδιαφέρουν να εκτιμήσω είναι αυτή εδώ. Είναι ανεξάρτητες οι παρατηρήσεις, γνωρίζω ότι είναι κανονική η κατανομή, γνωρίζω τον τύπο της κατανομής, την οικογένεια της κατανομής, αλλά δεν γνωρίζω την παράμετρο μή. Και λέω τώρα πού να την βάλω την παράμετρο μή. Αν σας έλεγα να διαλέξετε ένα από αυτά τα τέσσερα, ποιο θα επιλέγατε. Το δύο, το τρία, αυτό εδώ, το τέσσερα, κανένας θα ψήφιζε τέσσερα, όχι, ναι, το μέσο ώρο πιανών. Όχι, σου λέω ποιά από τις τέσσερις θα υπέλεγες. Πες ότι την Κυριακή θα ψηφίσεις, τι θα πάρεις το μέσο ώρο από τους τέσσερους υποψήφους και θα βάλω αυτόν. Ένα θα διαλέξω από τους τέσσερους, τι να κάνουμε τώρα. Ένα υψηφοδέλδιο θα βάλεις. Εσύ, κύριε Βαγγέλα, πάρε τα άλλαξη, αφού το βάζουμε το πρόβλημα έτσι. Ότι έχουμε τέσσερους υποψήφιους εδώ. Ποιο θα ψηφίζατε. Ε, ναι. Τι δύο λες. Ωραία, και έρχεται το δύσκολο ερώτημα, γιατί. Πρώτα απ' όλα, συμφωνούμε πολύ για τη δύο. Ναι, γιατί όμως. Τι ξέρουμε για τις καμπάνες. Για πες. Φαίνεται να είναι καλύτεροι λες. Ναι, αυτό το καλύτεροι τελικά. Για δούμε κάποιον άλλο να μας το διατυπώσει, ναι. Έχει μέσα της τις περισσότερες παρατήσεις. Μέσα της εννοείς από κάτω από την καμπύλη αυτήν, τις περισσότερες γραμμούλες, ε. Τι σημαίνει να έχει από κάτω τις περισσότερες γραμμούλες. Διαισθητικά αυτό είναι και έχεις δίκιο. Ότι πράγματι και εγώ τη δύο θα έλεγα γιατί φαίνεται να καλύπτει περισσότερο τις παρατηρήσεις μου, τις γραμμούλες. Κάθε γραμμούλα θυμίζω είναι μια παρατήρηση. Παρατήρηση όπως η πρώτη ας πούμε και η τέταρτη, σωστά. Τώρα, το ότι έχω τη δύο που καλύπτει πολλές γραμμούλες, για να πάρω αυτή τη γραμμούλα, μια γραμμούλα εδώ πέρα, αυτή εδώ. Τι σημαίνει αυτή εδώ η τιμή και τι σημαίνει αυτή εδώ η τιμή, που αντιστοιχούν σε αυτή τη γραμμούλα, σε αυτή την παρατήρηση. Τι σημαίνει αυτή εδώ η τιμή. Τι είναι αυτό. Είναι η τιμή της συναρτής καμπανούλας, της πρώτης καμπανούλας. Δηλαδή, η τιμή της συναρτής της πυκνότητας, πιθανότητας, όταν υποθέτω το θ είναι αυτό. Το μ είναι αυτό εδώ πέρα. Ενώ οι άλλοι όταν είναι αυτό εδώ. Άρα, ποια από τις δύο αυτές είναι πιο πιθανή, με βάση αυτή την παρατήρηση. Είναι αυτή που έχει τη μεγαλύτερη τιμή. Είναι οι δύο. Η τρία έχει πολύ μικρή τιμή, είναι εδώ πέρα. Η τέσσερα έχει ασήμαντη τιμή, είναι εδώ κάτω. Ας πάρω και μια δεύτερη παρατήρηση. Ας πάρω και αυτήν εδώ την παρατήρηση. Η τιμή που έχω για την πρώτη συναρτήση είναι εδώ. Για την τρίτη συναρτήση είναι εδώ πέρα. Και για τη δεύτερη συναρτήση είναι εδώ πάνω. Εντάξει. Άρα, με βάση αυτή την παρατήρηση τώρα, ποια είναι η πιο πιθανή? Είναι η ένα, η δύο, η τρία ή η τέσσερα? Είναι πάλι αυτή που έχει τη μεγαλύτερη τιμή. Είναι οι δύο. Και αν πάω σε αυτήν εδώ, η πιο πιθανή είναι η τρία, σε αυτήν την περίπτωση. Εντάξει. Άρα, με βάση την κάθε παρατήρηση, μπορώ να βλέπω εγώ, ποια από τις τέσσερις συναρτήσεις που έχω, πυκνότητας, πιθανότητας, παίρνει τη μεγαλύτερη τιμή. Και είπαμε, με βάση την πρώτη έχουμε αυτές τις τιμές, με βάση τη δεύτερη, με βάση την τρίτη. Και τώρα έρχομαι εδώ. Αν πάρω τώρα να συμβαίνουν και οι δύο αυτές παρατηρήσεις, αν είχαμε μόνο αυτές τις δύο, ποια θα διαλέγαμε? Δεν θα διαλέγαμε αυτή που έχει μεγαλύτερη τιμή στην πρώτη και στη δεύτερη. Που είναι πάλι οι δύο. Γιατί, πώς το βγάλαμε? Αν θέλω να συμβαίνει και η 1 και η 2, τι μου λέει η ανεξαρτησία? Θα πάω να δω την τιμή που έχει για την 1 και την τιμή που έχει για τη 2 και θα πάρω το γινόμενό τους. Άρα εκεί που αυτό το γινόμενο είναι μεγαλύτερο, εκεί θα το πάρω. Και τελικά, με αυτό το σκεπτικό, καταλήγουμε ότι αυτό που είπατε και διαισθητικά, φτιάχνουμε αυτήν εδώ τη συναρτήση, που λέγεται συναρτήση πιθανοφάνειας, γιατί πάει και κάνει αυτή τη δουλειά που κάναμε για μία, δύο, τρεις, κτλ. Πάει και το κάνει για όλες και λέει, εάν πάρω να δω ποια είναι η πιο πιθανή τιμή που έχω, παίρνοντας για όλες τις παρατηρήσεις και επειδή αυτές εδώ είναι τώρα ανεξάρτητες, αυτό θα το γράψω έναν γινόμενο. Και άρα θα πάω να δω, πού έχω αυτές τις μεγαλύτερες τιμές. Και τελικά πράγματι αυτή η καμπύλη που είναι πάνω από τις περισσότερες γραμμούλες είναι αυτή που θα μου δώσει το μεγαλύτερο γινόμενο, γιατί θα έχει για κάθε μία από αυτές μεγαλύτερη τιμή. Άρα λοιπόν τελικά αυτό που κάνατε έτσι στο μυαλό σας, βλέποντας ποια καμπύλη είναι αυτή που καλύπτει τις περισσότερες γραμμούλες, ήταν να δείτε ποια έχει τη μεγαλύτερη τιμή. Γιατί το να καλύπτει γραμμούλες όπως εδώ, έχει μεγάλη τιμή. Άρα όσο πιο μεγάλη τιμή έχει, τόσο μεγαλύτερο θα είναι αυτό το γινόμενο. Και έτσι λοιπόν μπορούμε να πούμε ότι αν έχω δύο να συγκρίνω, τη θ1 και τη θ2, όπως ας πούμε αυτές τις δυο, θα πάρω εκείνη που το γινόμενο αυτό εδώ, που το ονομάζω συνάρτησης πιθανοφάνειας με το L κεφαλαίο, είναι μεγαλύτερο. Μέχρι εδώ εντάξει, προσπάθησα λίγο να σας το γράψω μαθηματικά. Δυνατά λίγο. Δεν έχουμε μία σκήφα. Α, όχι, εγώ είναι παράδειγμα είναι αυτό. Εγώ σας το έβαλα αυτό. Θα μπορούσα να κάνω και άλλη μία. Και θα κάνω σε λίγο. Με βάση την υπόθεση για το πού είναι το κέντρο. Γιατί σε κάθε μια καμπύλη έχω αλλάξει το κέντρο. Το ερώτημά μου είναι αυτό. Ποιο είναι το κέντρο που είναι το πιο πιθανό, με βάση στις παρατηρήσεις μου. Ξεκίνησα το πρόβλημα με τέσσερις δυνατές περιπτώσεις για το κέντρο. Τέσσερις τιμές για το μία έβαλα. Μία εδώ, μία εδώ, μία εδώ και μία εδώ. Και λέω, αν είχα το πρόβλημα μου μόνο για αυτές τις τέσσερις, ποια θα διάλεγα. Διαισθητικά είπα τη δεύτερη. Και προσπαθήσαμε να το συζητήσουμε γιατί είναι η δεύτερη, γιατί καλύπτει τις περισσότερες, η καμπύλη καλύπτει τις περισσότερες γραμμούλες. Περισσότερες γραμμούλες τελικά σημαίνει ότι αυτό το γινόμενο είναι το μεγαλύτερο για αυτή την περίπτωση. Ωραία, άρα συμφωνούμε ότι η δεύτερη φαίνεται να είναι η καλύτερη, γιατί δίνει ένα τέτοιο γινόμενο εδώ, μεγαλύτερο από ό,τι δίνουν οι άλλες. Αν πάω τώρα και πάρω μία άλλη, θα την κάνω κάπως έτσι. Τώρα έρχομαι, Ευαγγέλι, σε αυτό που έλεγα, θα κάνω άλλη μία. Ποια από αυτές τις δύο θα διαλέγατε? Τρομερά δύσκολο, δεν είναι για να πείτε. Πολύ ρε ψοκίνδυνο, δεν είναι να πείτε. Ποια από τις δύο? Με το μάτι δεν μπορείς να το κάνεις. Και αν το κάνω ακόμα λίγο δύσκολο το ερώτημα, ποια είναι η καλύτερη τιμή που μπορούσαμε να δώσω στο μη? Πού να τη βάλω την καμπύλη, το κέντρο της, για να μου δώσει τη μεγαλύτερη τιμή για αυτό το γινόμενο. Πώς μπορώ να τη βρω, τη τιμή του κέντρου, το μη, που θα μου δώσει τη μεγαλύτερη τιμή για αυτό το γινόμενο. Το ξέρετε, ναι, όχι. Θα ξαναπώ την ερώτηση. Λέω, πού πρέπει να βάλω το μη, τη μέση τιμή, αυτό το θ που ψάχνω γενικά, πρέπει να το βάλω για να έχω τη μεγαλύτερη τιμή για αυτό το γινόμενο. Ή για αυτή τη συνάρτηση. Το ξέρετε, ναι. Άμα σας έλεγα για ποιο θ η συνάρτηση έχει το μέγιστο, θα το ξέρατε. Τώρα που το παράθρασα λίγο, σας δυσκόλεψε. Τελικά αυτό δεν ψάχνω. Γιατί είπαμε ότι αυτή η καμπύλη, δηλαδή για αυτό το κέντρο, εκεί που θα το βάλω έτσι ώστε αυτό το γινόμενο, αυτή η συνάρτηση να παίρνει τη μεγαλύτερη τιμή, είναι αυτό που θέλω. Άρα μαθηματικά για να το βρω πλέον και όχι με το μάτι, γιατί δεν μπορώ να το βλέπω αυτό με το μάτι, μαθηματικά το πρόβλημά μου είναι να πάρω την συνάρτηση αυτήν, να την παραγωγήσω και να το βάλω ίσο με το μηδέν. Αυτό που κάνω βέβαια εδώ πέρα, λέω ότι μπορώ να πάρω την ίδια τη συνάρτηση ή να πάρω το λογάριθμό της. Και εδώ βάλετε ό,τι λογάριθμο θέλετε, βάλετε ενεπέριο αν θέλετε, βάλετε δεκαδικό λογάριθμο, βάλετε με βάση του δύο. Μπορώ να το κάνω, έχω δικαίωμα να το κάνω, αντί να πάρω την συνάρτηση την ίδια, την L, την συνάρτηση πιθανοφάνειας, να πάρω το λογάριθμο. Ή θα μου δώσει άλλη λύση. Τι λες εσύ? Την ίδια θα μου δώσει, γιατί? Γιατί ο μετασχηματισμός του λογαρίθμου είναι μονότονος, δεν αλλάζει. Οπότε το σημείο καμπίς, το σημείο που θα έχω εγώ το μέγιστο ή το ελάχιστο, το ακρότατο, παραμένει το ίδιο. Η τιμή θα αλλάξει τη συνάρτηση, δεν θα αλλάξει όμως το σημείο. Αυτό τώρα γιατί το κάνω, γιατί σε κάποια προβλήματα μπορεί να με συμφέρει, αντί να πάρω την συνάρτηση πιθανοφάνειας, να πάρω το λογάριθμο. Γιατί αυτή η καμπανούλα, αν σας γράψω εδώ πέρα, έχει, ακριβώς, έχει την εκθετική. Δηλαδή, αν γράψω εδώ πέρα τον τύπο, διότι δεν με φτάνει και ο χώρος, διότι επί σύγμα, έχει ένα εκθετικό εις το μίον χί μίον μη, στο τετράγωνο, δια δύο σύγμα τετράγωνο. Οπότε, καταλαβαίνετε, θα έχω γινόμενα εκεί πέρα τέτοια γινόμενα. Άρα, πριν να κάνω την παραγώγηση, άμα πάρω το λογάριθμο, με συφέρει, γιατί θα φύγει αυτό το ε, αν πάρω τον επέριο λογάριθμο. Και έλυσα το πρόβλημά μου. Αυτή ήταν η δύσκολη διαφάνεια που λέγαμε. Δηλαδή, εδώ πέρα πλέον μπορούμε, μ' αυτόν τον απλό τρόπο, να λύσουμε το πρόβλημά μας. Γιατί θα έχουμε μία εξίσωση και έναν άγνωστο, το θ. Άρα, θα παραγωγήσουμε, θα πάρουμε τη συνάρτηση της παραγώγου, ίσο με το μηδέ, και θα λύσουμε το σύστημα. Εάν τώρα δεν σας έδινα το άνοιγμα της καμπανούλας και σας έλεγα ότι και αυτό θέλω να το βρω, θέλω να βρω και πια και πού θα βάλω το καλύτερο άνοιγμα. Δηλαδή, την καλύτερη τιμή να εκτιμήσω για το σίγμα ή το σίγμα τετράγωνο. Πώς θα το έκανα αυτό τώρα? Δεν είχα μόνο άγνωστο το κέντρο, το μη, αλλά είχα και το σίγμα τετράγωνο. Θέλω να βρω τη μεγαλύτερη τιμή, το μέγιστο της συνάρτησης, αλλά πλέον ως προς δύο παραμέτρους. Τι θα κάνουμε? Μερικές παραγώγους. Θα κάνουμε και για την μία και για την άλλη. Άρα, όσοι είναι οι άγνωστοι μας, παραγωγίζουμε ως προς κάθε έναν από αυτούς. Εδώ δηλαδή, θα είχα ένα σύστημα, γενικά αν έχω M παραμέτρους, θα έχω ένα σύστημα M εξισώσεις και M παραμέτρους. Και αυτή η μέθοδος είναι η θεμελιώδης μέθοδος της στατιστικής, γιατί μπορείς να την εφαρμόσεις πάντα. Οι μόνοι οι μόνες δύο προϋποθέσεις είναι να είναι ανεξάρτητες οι παρατηρήσεις και να γνωρίζεις τι είδους κατανομή είναι αυτή στην οποία αναφέρεις. Εάν το γνωρίζεις αυτό, εφαρμόζεται, ενώ των ροπών δεν εφαρμόζεται πάντα. Και κοιτάξτε τι γράφει εδώ. Η εκτιμήτρια της μέγης πιθανοφάνειας είναι αμερόληπτη ασυπτωτικά, συνεπής αποτελεσματική επαρκής. Δηλαδή έχει όλες τις καλές ιδιότητες. Ξέρεις δηλαδή ότι εδώ πέρα, αν κάνεις αυτή τη δουλειά και βρεις τη λύση για το θ-καπελάκι σου, όποια κι αν είναι η παράμετρος, θα έχεις βρει μια πολύ καλή εκτίμηση. Εκεί που μπορεί λίγο να ιστερεί, είναι ότι δεν είναι απευθείας αμερόληπτη, άμεσα αμερόληπτη, αλλά ασυπτωτικά. Για να το δούμε λοιπόν γρήγορα έτσι με το παράδειγμα αυτό με την κανονική κατανομή. Ήδη το είδαμε το παράδειγμα. Εδώ είναι πάλι η μορφή της συνάρτησης. Θεωρώ ότι γνωρίζω το σίγμα τετράγωνο, αλλά δεν γνωρίζω το μη. Άρα τι μου λέει η μέθοδος μεγείς πιθανοφάνειας. Θα πάρω το γινόμενο αυτό εδώ. Άρα θα έχω τέτοιους όρους που θα πολλαπλασιάζονται. Το μόνο που θα αλλάξει θα είναι εδώ το χ. Τη μία φορά θα είναι 1, την άλλη φορά 2. Άρα ο πρώτος όρος θα γίνει δύναμη στο 1. Αυτός ο όρος θα γίνει εδώ πέρα άθεσμα. Αυτό το 6 σημαίνει ότι είναι το εκθετικό πάλι. Άρα έχω εκθετικό και μέσα έχω ένα άθεσμα. Θα πάρω αυτήν λοιπόν να την παραγωγήσω. Και αντί να παραγωγήσω αυτήν θα πάρω το λογάριθμό έτσι ώστε να μου φύγει το εκθετικό. Έχω αυτήν την έκφραση εδώ πέρα. Λύνω ως προς το 0. Φυσικά το μη καπελάκι είναι ο μέσος όρος που είχα. Αλλά αυτή μέθος μπορεί να έχει χρωμαστεί παντού τώρα. Μπορεί να πάτε αργότερα σε ένα πρόβλημα που το παρατηρήσατε το πρόβλημα και είδατε ότι η κατανομή φαίνεται να είναι ας πούμε μία παράξενη. Διπλή εκθετική. Οτιδήποτε. Τι θα κάνετε. Αν ξέρεις τι κατανομή είναι, αν ξέρεις την έκφρασή της, ό,τι παράμετρο και να έχει μέσα μπορείς να πάρεις μέσα των παραγώγων και να βρεις το αποτέλεσμα. Εδώ είναι λίγο πιο δύσκολα τα πράγματα στο ότι μας λέω ότι και η διασπορά είναι άγνωστη. Άρα έχω ένα σύστημα δύο εξισώσεων με δύο αγνώστους. Λύνω το σύστημα. Από το πρώτο φεύγει το σίγμα τετράγωνο γιατί πολλαπλασιάζεται έχουμε γινόμενο ίσο με το μη. Άρα έχω πάλι την ίδια λύση για το μη, το αντικαθιστώ στη δεύτερη εξίσωση και βρίσκω τελικά το σίγμα τετράγωνο καπελάκι. Δεν είναι το 1-1-1 που είχαμε, αλλά είναι το 1-1. Είναι οι ασυπτωτικά αμερόληπτοι λύση. Λοιπόν, αυτή ήταν, όπως είπαμε, η βασική μέθοδος που έχουμε στην εκτιμητική, που μας λύνει τα χέρια. Και θα περάσουμε τώρα να εμπλουτίσουμε λίγο τις γνώσεις μας, γιατί μέχρι τώρα αυτά που είπαμε ήταν για το πώς βρίσκω ένα στατιστικό. Δηλαδή, το πώς πάω εδώ πέρα να προσδιορίσω, να εκτιμήσω την άγνωστη παράμετρό μου με ένα στατιστικό. Με μια σημιακή εκτίμηση. Τι σημαίνει σημιακή εκτίμηση? Ότι αν μου δώσεις ένα δείγμα, θα υπολογίσω εγώ στον στατιστικό την τιμή του και θα έχω μία τιμή, μία σημιακή εκτίμηση, μία τιμή που να μου προσδιορίζει αυτό εδώ. Τώρα, αν εμείς έχουμε ένα δείγμα από 20 φοιτητές και πάρουμε το ύψος τους και βγάλουμε ένα μέσο ύψος 1.70, μπορεί κανένας να πιστέψει ότι αυτό το 1.70 που βγάλαμε εμείς, πραγματικά αποτυπώνει το μέσο ύψος για τους 70.000 φοιτητές. Είναι πολύ απίθανο, γιατί έτυχε στο δείγμα μας να βγάλουμε 1.70. Αν πάμε σε μία άλλη τάξη και πάρουμε 20 φοιτητές, μπορεί να κάνουμε το ίδιο να βγάλουμε 1.75 και ούτω καθεξής. Άρα, με το να δώσω μόνο μία σημιακή εκτίμηση με έναν αριθμό, από μόνο του δεν λέει τίποτα. Όπως και τα ποσοστά που κάνουν τώρα στις δημοσκοπήσεις πριν τις εκλογές, το να πεις ένα 20% ποσοστό από μόνο του δεν λέει τίποτα, αν δεν δώσεις και την ακρίβεια γύρω από αυτό. Τι είναι η ακρίβεια? Η ακρίβεια είναι, λοιπόν, να μπορούμε σε κάποιο επίπεδο εμπιστοσύνης, όπως το λέμε, να βγάλουμε ένα διάστημα εμπιστοσύνης. ΔΑΕ σημαίνει διάστημα εμπιστοσύνης. 1-α% όπου το 1-α μπορεί να είναι 0.95. Άρα, μιλάμε για 95% διάστημα εμπιστοσύνης, που σημαίνει ότι με σιγουριά είναι 95%. Να βγάλω εγώ, για παράδειγμα, ένα μη 1 μη 2, ένα διάστημα και να πω ότι μέσα σε αυτό είναι η πραγματική μέση τιμή. Για παράδειγμα, από τους 20 φοιτητές μπορεί να βγάλω ένα διάστημα 1,67 με 1,73. Αυτό τώρα τι μου λέει, ότι είμαι σχεδόν σίγουρος, 100%, όχι 100%, 95%, ότι μέσα στο 1,67 με 1,73 βρίσκεται αυτό εδώ. Το μέσο ύψος όλων των φοιτητών. Αυτό τώρα έχει μια σημαντική αξία, γιατί το αποτέλεσμα που βγάζω αναφέρεται στον πληθυσμό για τους 70.000 φοιτητές. Και λέω ότι μέσα σε αυτό το διάστημα θα βρίσκεται η πραγματική μέση τιμή. Δεν είναι εντυπωσιακό να φτάσετε να αναφέρετε τέτοια διαστήματα. Και να μην μπορεί να σας αφησβητήσει κανένας, γιατί λέτε είμαι 95%, σίγουρος με βάση στο δείγμα που βρήκα. Αυτό θα κάνουμε συνέχεια. Θα εκτιμήσουμε λοιπόν διαστήματα εμπιστοσύνης. Για να το κάνουμε αυτό όμως, δεν είναι το σαπλό, πώς θα φτάσω εγώ να βρω ένα διάστημα. Για να το κάνω λοιπόν αυτό, θα πρέπει να το προχωρήσω βασιζομένως σε κάποια κατανομή για να βρω αυτό το διάστημα. Και η ιδέα είναι... τώρα θα την πούμε. Κρύβεται σε αυτό εδώ που λέμε. Να βρούμε την κατανομή του εκτιμητή. Αν μιλάω λοιπόν για τη μέση τιμή, όπου έχω συμφωνήσει ότι ο καλύτερος εκτιμητής της μέσης τιμής είναι ο μέσος όρος, το χ με την παρά, τότε για να βρω το διάστημα εμπιστοσύνης για τη μέση τιμή, η ιδέα είναι να πάω να βρω την κατανομή της χ. Άρα ας κρατήσουμε εδώ πέρα, έχουμε την τυχαία μεταβλητή χ και εδώ κάτω έχω το μέσο όρο. Και με ενδιαφέρει να βρω για τη μέση τιμή που δεν την ξέρω, εδώ έχω κάποια κατανομή για την τυχαία μεταβλητή χ. Θέλω να βρω την κατανομή που έχει ο μέσος όρος. Γιατί εγώ θέλω να βρω στο τέλος το πρόβλημά μου ποιο είναι. Να βρω αυτό το διάστημα και να πω ότι μέσα εδώ θα βρίσκεται η πραγματική μέση τιμή. Αυτό δεν το ξέρω το μ που είναι. Αν πάρω όμως το μέσο όρο και βρω μια κατανομή ότι έχει μια τέτοια κατανομή, τότε μπορώ να αφήσω εδώ τη σουρέσα απέξω ότι αυτό είναι, για παράδειγμα δεν το έχω κάνει και καλά, ας το βάλω λίγο πιο εδώ. Για παράδειγμα έχω ένα α δεύτερα να είμαι από εδώ απέξω, ένα α δεύτερα να είμαι από εδώ απέξω, άρα έχω ένα α να είμαι έξω από αυτό το διάστημα και αφού με μια πιθανότητα α είμαι έξω από αυτό το διάστημα, με μια πιθανότητα 1-α είμαι μέσα στο διάστημα. Τι ήθελα εγώ να βρω εδώ πέρα, θέλω να βρω ένα διάστημα εμπιστοσύνης 1-α τα 100. Εάν μπορώ εγώ να βρω εδώ πέρα αυτά τα άκρα, τα ονομάζω μη 1 και μη 2 και έχω βρει το διάστημα και λέω ότι εδώ μέσα θα βρίσκεται η πραγματική μέση τιμή. Άρα η ιδέα είναι να πάω στον εκτιμητή μου που αν μιλάω για τη μέση τιμή ο εκτιμητής είναι ο μέσος όρος, γενικά αν μιλάω για μια παράμετρο θ ο εκτιμητής είναι θ καπελάκι και να βρω την κατανομή. Εάν βρω την κατανομή του εκτιμητή μπορώ να βρω και αυτά τα όρια. Αυτή είναι η μεθοδολογία δηλαδή που θα ακολουθήσουμε τώρα εδώ πέρα. Δεν είναι τόσο απλά άμως τα πράγματα. Το πρώτο ερώτημα που κάνω πριν να βρω όλη την κατανομή του χ με την παρά είναι μήπως γνωρίζω τη μέση τιμή και τη διασπορά του. Γνωρίζουμε τη μέση τιμή του μέσου όρου, τη μέση τιμή του χ με την παρά. Ναι. Θυμάστε που λέγαμε ότι είναι αμερόληπτη. Αμερόληπτη εκτιμήτρια ότι κατά μέσο όρο πέφτει πάνω στην πραγματική. Άρα αυτό το είχα δείξει την προηγούμενη φορά. Αυτό το είχα δείξει την προηγούμενη φορά ότι είναι αμερόληπτη. Άρα ξέρω ότι η μέση τιμή της κατανομής του χ με την παρά είναι ίδια με τη μή. Δηλαδή και εδώ αν είναι η μέση τιμή του είναι ίδια με το μή. Η διασπορά του πόσο θα είναι, πόσο θα είναι το άνοιγμα αυτής της κατανομής. Αν αυτής της κατανομής είναι σίγμα το άνοιγμα. Το άνοιγμα χρησιμοποιώ μία λέξη άνοιγμα, ίσως δεν είναι σωστή. Σωστός όρος ενώ την τυπική απόκλειση της κατανομής. Τυπική απόκλειση μας δίνει κατά κάποιο τρόπο το εύρωσης της κατανομής. Αν εδώ είναι σίγμα λοιπόν η τυπική απόκλειση. Εδώ πόσο λέτε να είναι μεγαλύτερο από το σίγμα για το μέσο όρο. Μιλάμε για το μέσο όρο. Εδώ είναι η τυχαία μεταβλητή, το ύψος των φοιτητών, εδώ είναι ο μέσος όρος από 20 φοιτητές για το ύψος. Θα είναι μεγαλύτερο από το σίγμα. Δηλαδή η κατανομή αυτή θα πλώνεται πιο πολύ από αυτή εδώ. Δεν μπορεί γιατί εδώ είναι η τυχαία μεταβλητή το ύψος ενώ εδώ είναι ο μέσος όρος του ύψους. Άρα θα περιμένω να είναι πιο στενή. Πόσο πιο στενή, για να το βρούμε μαθηματικά, τι κάνουμε, το δουλεύουμε. Παίρνουμε τη διασπορά του μέσου όρου. Παίρνω τη διασπορά του μέσου όρου που έχει αυτή την έκφραση. Επειδή τώρα είναι ανεξάρτητες οι παρατηρήσεις μου, γιατί πάντα μιλάω για ανεξάρτητες παρατηρήσεις εδώ πέρα, η διασπορά, ο τελεστής της διασποράς μπαίνει μέσα. Αυτός σαθερός όρος γίνεται τετράγωνο. Η διασπορά του χ είναι ίδια με τη διασπορά του χ, άρα είναι σίγμα τετράγωνο. Και τελικά έχω ότι είναι σίγμα τετράγωνο διά εν. Η διασπορά και άρα η τυπική απόκλειση που την λέω και σαθερό σφάλμα είναι σίγμα διαρίζα εν. Σωστό δεν είναι ότι μπαίνει και το εν εδώ μέσα. Διαισθητικά, για σκέφτετε, δεν θα το περιμέναμε να μπαίνει εδώ πέρα. Γιατί άλλο είναι να μιλάς για την κατανομή του μέσου όρου σε δείγματα 20 παρατηρήσεων και άλλο 200, 500, 1000. Όσο πιο πολύ μεγαλώνεις το δείγμα σου, θα περιμένουμε ο μέσος όρος να παίζει λιγότερο γύρω από τη μέση τιμή. Άρα όσο μεγαλύτερο είναι το δείγμα, η τυπική απόκλειση διαιρείται εδώ πέρα με τη τετραγωνική ρίζα του εν, που σημαίνει ότι μικραίνει. Καλά μέχρι εδώ λοιπόν. Μέχρι εδώ βρήκα μόνο πού είναι το κέντρο της κατανομής του μέσου όρου και ποια είναι η διασπορά. Δυστυχώς, για να προχωρήσω να βρω την κατανομή του μέσου όρου, πρέπει να εξετάσω αυτά τα τρία. Άρα δεν είναι και τόσο απλά τα πράγματα εδώ πέρα. Δηλαδή δεν μπορώ να πω τι κατανομή θα έχει ο μέσος όρος. Εξαρτάται από το αν γνωρίζω τη διασπορά της τυχίας μου μεταβλητής, το σίγμα τετράγωνο, εάν η τυχία μεταβλητή ακολουθεί κανονική κατανομή ή όχι και αν το δείγμα είναι μεγάλο ή μικρό. Μπλέξαμε λίγα λόγια. Το μεγάλο και το μικρό έχουμε ένα όριο και ένα κατόφλι στο 30. Κάτω από 30 το λέμε μικρό, πάνω από 30 το λέμε μεγάλο. Δεν είναι και τόσο απλό λοιπόν για το μέσο όρο να πω τι κατανομή θα έχει. Εξαρτάται από την κατανομή του χ, αν είναι κανονική ή όχι και αν έχω γνωστή διασπορά ή όχι, και από το δείγμα αν είναι μεγάλο ή μικρό. Θα πάμε λοιπόν να δούμε τώρα όλες αυτές τις περιπτώσεις. Και ξεκινάμε με την περίπτωση όπου γνωρίζουμε τη διασπορά. Αυτή η περίπτωση είναι πολύ απίθανη. Θα θα μου πεις γιατί την κάνουμε. Πρακτικά δεν έχει και τόσο μεγάλη αξία, γιατί πρακτικά αυτό που μας δίνεται σε ένα πραγματικό πρόβλημα είναι μόνο δεδομένα, είναι μόνο δείγμα. Κανένας δεν θα έρθει να μας πει, ξέρεις έχεις 20 φοιτητές, να το ύψος τους και γνωρίζουμε ότι διασπορά το ύψος του φοιτητή είναι, εγώ 25 τετραγωνικά εκατοστακά, δεν θα έρθει να μας το πει αυτό. Θα μας δώσουν μόνο παρατηρήσεις. Αλλά ξεκινάμε με την απλή περίπτωση όπου γνωρίζουμε τη διασπορά. Αν γνωρίζω λοιπόν τη διασπορά στον πληθυσμό, τότε έχω αυτή την πρόταση. Τι λέει αυτή η πρόταση. Αυτό εδώ πέρα είναι η. Αν συμβαίνει το 1 ή συμβαίνει το 2, τότε έχω φτάσει στο ζητούμενο. Το ζητούμενο για μένα είναι όπως είπαμε να βρούμε τι κατανομία ακολουθεί ο μέσος όρος. Γιατί τότε μπορώ να βάλω τα όρια και να βρω το διάστημα εμπιστοσύνης. Και μου λέει αν συμβαίνει το 1 ή συμβαίνει το 2, τότε συμβαίνει αυτό. Το 1 τι λέει? Το χ. Αν έχουμε κανονική κατανομία, αυτό μου λέει απλά. Με κάποια μέση τιμή και κάποια διασπορά. Αν λοιπόν αυτή είναι κανονική κατανομία, σου λέει τότε και αυτό θα έχει κανονική κατανομία. Το 2 λέει ανεξάδητα από τι κατανομία έχει το χ, μπορεί να έχει όσο λοξή κατανομία θέλει, όσο παράξενη κατανομία θέλει. Εάν το δείγμα είναι μεγάλο, τότε διασφαλίζω ότι θα έχει κανονική κατανομία το χ με την παρά. Το πρώτο, πώς μπορούμε να το δούμε. Α, ναι, αυτή είναι η αντίθεση της πρότασης, της προηγούμενης. Για όσους ξέρετε λίγο από λογική, όταν παίρνουμε την αντίθεση μιας πρότασης, αυτό το 1 ή το 2 συνεπάγεται αυτό, τότε αν δεν συμβαίνει το 1, η αντίθεση είναι αν δεν συμβαίνει το 1 και δεν συμβαίνει το 2, τότε δεν μπορούμε να πούμε ότι είναι κανονική. Δηλαδή, στην περίπτωση που έχουμε και μια κατανομή για την τυχαία μεταβλητή που δεν είναι κανονική και μικρό δείγμα, τότε δεν μπορώ να πω τι συμβαίνει με το μέσο όρο. Λοιπόν, το πρώτο. Για να το καταλάβουμε το πρώτο. Αν η κατανομή της χ είναι κανονική, τότε και η κατανομή του μέσου όρου είναι κανονική. Να πάρουμε δύο μεταβλητές, χ1 και χ2. Αν έχω χ1 και τη χ2 που ακολουθούν κανονική κατανομή, το άθρυσμά τους τι κατανομή ακολουθεί, ξέρει κανένας? Να το πω διαφορετικά. Η μέση τιμή για το άθρυσμα της χ1 και της χ2 πόσο θα είναι? Θα είναι το άθρυσμα των μέσων τιμών, δηλαδή εδώ πέρα θα έχω δύο μοι και η διασπορά θα είναι το άθρυσμα των διασπορών. Και δύο σίγμα τετράγωνο. Άρα θα ακολουθεί αυτήν εδώ την κατανομή. Εάν εδώ πέρα αντί για άθρυσμα 2 βάλω 3, 4, 5, τι θα έχω, ότι και το άθρυσμα θα ακολουθεί και αυτό κανονική κατανομή. Αυτό προκύπτει από το ότι η κανονική κατανομή είναι ευσταθής κατανομή, stable distribution το λένε στα αγγλικά, και γι' αυτό έχουμε ότι αν αθρήσουμε ή πάρουμε γενικά ένα γραμμικό συνδυασμό δύο τυχαίων μεταβλητών που ακολουθούν κανονική κατανομή, τότε και η τυχαία μεταβλητή που προκύπτει από το γραμμικό συνδυασμό τους ακολουθεί κανονική κατανομή. Έτσι λοιπόν, εξασφαλίζω ότι και το άθρυσμα ακολουθεί κανονική κατανομή. Τι θέλω εγώ όμως, ο μέσος όρος. Μπορώ να φτάσω το μέσο όρο. Τι έρκει να κάνω, να διαρέσω με 1, που είναι μια σταθερά. Άρα λοιπόν μπορεί με αυτόν τον τρόπο να δείξουμε ότι όταν η τυχαία μεταβλητή ακολουθεί κανονική κατανομή, τότε και ο μέσος όρος ακολουθεί κανονική κατανομή. Το άλλο τώρα το 2 είναι ζόρικο. Το 2 βασίζεται σε ένα θεόρημα που λέγεται κεντρικό οριακό θεόρημα, το οποίο είναι αυτό το ωραίο και λίγο παράξενο, που μας λέει ότι εάν αθρήσω, όπως εδώ πέρα είχα το άθρυσμα αυτό εδώ, αν πάρω ένα τέτοιο άθρυσμα τυχαίων μεταβλητών για μεγάλο n, τότε ανεξάρτητα από το τι κατανομή ακολουθούν αυτά εδώ, το άθρυσμα θα ακολουθεί κανονική κατανομή. Του πιστεύετε αυτό το πράγμα. Δύσκολα να το πιστέψουμε. Για να το λέω, σωστά θα είναι. Για να σας βάλω μια σκησούλα, μου επιτρέπετε λίγο να σας τυραννήσω. Αν πάρω δύο τυχιές μεταβλητές που ακολουθούν η χ1 και η χ2, ακολουθούν την ομοιόμορφη 0,1. Uniform 0,1. Καταλαβαίνουμε? 0 εδώ, 1 εδώ. Το άθρυσμα, τι κατανομή θα ακολουθεί? Το ίδιο λες? Να το κάνουμε λίγο πιο άπλο το πρόβλημα. Ας μην βάλουμε συνεχή ομοιόμορφη, ας βάλουμε μια διακριτή ομοιόμορφη. Όπου εδώ η κάθε μία είναι στο ένα τρίτο. Κατανοητό? Διακριτή. Τρεις τιμές μπορεί να πάρει. Μηδέν, μηδέν πέντε και ένα. Κατανοητό? Την έκανα ομοιόμορφη αλλά διακριτή, με ένα τρίτο. Τότε, το άθρυσμά τους, τι κατανομή θα ακολουθεί? Πρώτα απ' όλα, ποια είναι τα όρια της κατανομής. Τι τιμές μπορεί να πάρει αυτό το άθρυσμα. Από μηδέν έως δύο. Μηδέν έως δύο. Πότε μπορεί να είναι μηδέν το άθρυσμα. Το ξέρετε, μπράβο. Πότε μπορεί να είναι δύο και τα δύο ένα. Πότε μπορεί να είναι ένα. Άρα μπορεί να είναι ομοιόμορφη. Η πιθανότητα να είναι στα άκρα είναι ένα προς όλους τους συνδυασμούς που μπορεί να έχω. Εδώ όμως μπορεί να είναι όταν η μία είναι μηδέν και η άλλη ένα ή το αντίστροφο ή όταν και η δύο είναι μηδέν πέντε. Άρα έχω τέσσερις συνδυασμούς. Και φυσικά έχω επίσης την περίπτωση να έχω ένα και ενάμιση. Πότε μπορεί να έχω μηδέν κομμα πέντε. Άρα δύο φορές. Άρα εδώ έχω μία φορά, εδώ έχω δύο και εδώ έχω τέσσερις. Και αντίστοιχα έτσι. Άρα αν πάνω να το κάνω βγαίνει τριγωνικό. Βγαίνει δηλαδή να έχω αυτές τις πιθανότητες. Αν λοιπόν έχω τη συνεχή ομοιόμορφη φαντάζεστε πώς θα είναι αυτή. Θα είναι μία τριγωνική. Στις δύο λοιπόν θα έχω μία τριγωνική. Στις τρεις, αν πάρω το άθλισμα των τριών. Δυναμή. Λοιπόν, για να προσπαθήσω λίγο να ξυπνήσω το παλικάρι εδώ πέρα που μας κοιμήθηκε. Η ώρα είναι δύσκολη. Λοιπόν, θα σας δείξω κάποιες διαφάνειες από ένα άλλο μάθημα τελείωσα σχετό. Αφού είπαμε δεν θα κάνουμε Γιάννου, θα το πάρουμε σε ρίγκα και θα τελείωσουμε πιο νωρίς. Θα αλλάζετε τώρα? Θα σας το δείξω όχι αναλυτικά αλλά με προσομοίωση δηλαδή δημιουργώντας πολλές παρατηρήσεις. Εδώ λοιπόν είναι η ομοιόμορφη κατανομή που βλέπαμε πριν, οριζόντια γραμμή. Εδώ είναι η τριγωνική από άθλισμα δύο. Αυτό εδώ είναι που παίρνουμε από τρεις. Αυτό εδώ είναι που παίρνουμε από τέσσερις. Και αν το προχωρήσετε, εδώ είναι που αυξάνω. Τώρα βλέπετε μία μετά την άλλη όπου βέβαια είναι τρισδιάστατο. Εδώ έχω το άθλισμα που αυξάνει. Καταλαβαίνετε? Είναι μία, δύο, τρεις και συνεχίζει το άθλισμα έχει φτάσει μέχρι το πενήντα εδώ. Και το αντίστοιχο γράφημα που παίρνω από το ιστόγραμμα. Όταν παίρνω ένα μεγάλο, πολύ μεγάλο δείγμα. Εντάξει δεν είναι η αναλυτική μορφή από ένα ιστόγραμμα. Αλλά βλέπετε το ιστόγραμμα εδώ είναι οριζόντιο, εδώ γίνεται τριγωνικό. Σπάει με τρεις, με τέσσερις και σιγά σιγά τι γίνεται? Γίνεται καμπανούλα. Τι λέει λοιπόν το κεντρικό οριακό θεώρημα? Ότι όταν αθρίζω όχι μόνο δύο, τρεις, τέσσερις πάνω από τριάντα, εδώ είμαστε πάνω από τριάντα, θα έχω φτάσει σε κανονική κατανομή. Το πιστεύετε? Για την ομοίωμορφη φαίνεται να ισχύει. Για την εκθετική, εκθετική είναι πολύ στραβή, δύσκολο. Αυτή είναι η εκθετική. Καταλαβαίνετε, άθρισμα δύο τυχιών μεταβλητών από την ίδια εκθετική, τριών, τεσσάρων. Και αν κάνουμε το ίδιο όπως και πριν, βλέπετε ότι ενώ ξεκινάμε από μία κατανομή που είναι πάρα πολύ λοξή, αυτή εδώ, πάρα πολύ λοξή, σιγά σιγά καθώς αυξάνουμε τους όρους του αθρίσματος, αρχίζει και χάνει τη λοξοδιτά της, τί είναι να γίνει συμμετρική, και μετά από τριάντα όρους, από άθρισμα δηλαδή, τριάντα τυχιών μεταβλητών, βλέπουμε ότι η κατανομή πάλι έχει γίνει κανονική. Άρα λοιπόν αυτό μου λέει το κεντρικό οριακό θεόρημα, ότι όταν εγώ παίρνω άθρισμα από πολλές τυχαίες μεταβλητές, πάνω από τριάντα, τότε το άθρισμα θα είναι κανονική κατανομή. Υπάρχει μία συνθήκη, την οποία δεν τη γράφω κι εγώ εδώ, δεν τη γράφουν πολλά βιβλία, η συνθήκη αυτή λέει, ότι όταν αυτές οι τυχαίες μεταβλητές, ομοιόμορφοι, εκθετικοί, ό,τι θέλει ας είναι, έχουν μια ιδιότητα, ότι έχουνε πεπερασμένες διασπορές, έχει πεπερασμένη διασπορά. Λέει η διασπορά δεν φεύγει στο άπειρο. Και βέβαια τώρα κάποιος που το σκέφτεται αυτό θα πει, τι σαχλαμάρα μου λες τώρα, η διασπορά άπειρο, μπορεί να έχω άπειρη διασπορά, υπάρχει τέτοιο πράγμα. Πρακτικά δεν πάει το μυαλό μας ότι μπορεί να έχουμε. Αν έχω όμως μία κατανομή που έχει ουρές, που δεν σβήνουνε αυτό που λέμε παχές ουρές, αυτή είναι μια τέτοια κατανομή με άπειρη διασπορά. Για αυτή την περίπτωση δεν ισχύει το κεντρικό οριακό θεόρημα. Αν αθρίζω τυχές μεταβλητές που ακολουθούνε κατανομή με παχές ουρές, πάλι θα πάρω μία κατανομή με παχές ουρές και δεν θα πάρω την εκθετική πτώση που έχει η κανονική κατανομή. Άρα υπάρχει μια τέτοια σημείωση λοιπόν στον κεντρικό οριακό θεόρημα, ότι οι τυχές μεταβλητές στις οποίες αναφερόμαστε είναι τυχές μεταβλητές κατανομή με επεπερασμένη διασπορά, όχι άπειρη διασπορά, δηλαδή όχι παχές ουρές. Τότε, λοιπόν, αν πάρω μεγάλο άθερισμα πάντα θα συγκλίνει σε κανονική κατανομή μετά από 30 όρους. Δεν σας έπεισα και πολύ, ε? Και εδώ υπάρχει και ένα θέμα 7 που λέει «Αν ρίξουμε πολλά νομίσματα, ο συνολικός αριθμός των κεφαλών θα ακολουθεί κανονική κατανομή». Εάν ρίξετε πολλά νομίσματα, το νόμισμα φυσικά έχει μία κατανομή απλή που είναι κεφαλή γράμματα, εάν το κάνετε πολλές φορές και πάρετε τον αριθμό των κεφαλών, δηλαδή αν βάλετε 1 για το κεφάλι, 0 ας πούμε για τα γράμματα και αθρίσετε τα κεφάλια, θα δείτε ότι και αυτό θα ακολουθεί κανονική κατανομή. Μπορεί κάποιος να μας το παρουσιάσει. Λοιπόν, μέχρι τώρα τι έχω δείξει λοιπόν? Έχω δείξει με εκείνο το 1 και το 2 που έλεγα, ότι αν συμβαίνει το 1 δηλαδή να έχω κανονική κατανομή, ή συμβαίνει το 2 δηλαδή να έχω μεγάλο δείγμα, τότε φτάνω στο συμπέρασμα ότι ο μέσος όρος ακολουθεί κανονική κατανομή. Δηλαδή είμαι εδώ. Έχω φτάσει σε αυτό το συμπέρασμα. Ότι ο μέσος όρος ακολουθεί κανονική κατανομή με μέση τη μη μή και τυπική απόκλυση σίγμα δια ρίζα n. Δηλαδή ο μέσος όρος ακολουθεί κανονική κατανομή με μέση τη μη μή και διασπορά σίγμα τετράγωνο δια 1. Αυτό είναι το αποτέλεσμα που έχω φτάσει αν συμβαίνει το 1 ή το 2. Αν η τυχαία μεταβλητή ακολουθεί κανονική κατανομή, ή το δείγμα είναι μεγάλο. Λέω τώρα, αυτό που θέλω να κάνω είναι να βρω εδώ τα μη 1 και μη 2. Σας θυμίζω ότι ο πρωταρχικός μου στόχος είναι να βρω αυτό το διάστημα και να πω ότι με πιθανότητα 1-α αυτό το διάστημα θα μου περιέχει την πραγματική μέση τιμή. Και λέω τώρα, μπορώ να το λύσω το πρόβλημα εδώ πέρα? Μπορώ να πάω να βρω αυτό το μη 1 μη 2 που έχουν αυτήν την ιδιότητα ότι εδώ είναι οι ουρές με πιθανότητα για να είμαι στην κάθε ουρά α, δεύτερα και να είμαι εδώ μέσα 1-α. Δυστυχώς εδώ πέρα δεν μπορώ έτσι εύκολα να το βρω. Γιατί δεν έχω κάποιο τύπο, κάποιο εργαλείο που να μου δίνει αυτά τα κρίσιμα σημεία όπως τα λέω δηλαδή τα σημεία που αντιστοιχούν στις ουρές για αυτήν την γενική κατανομή που έχει κάποια μέση τιμή και διασπορά. Αν όμως, βέβαια αυτό δεν είναι ακριβώς αλήθεια γιατί σήμερα αν μου δώσεις εσύ το μή και το σίγμα τετράγωνο διέν μπορώ να το χτυπήσω στον υπολογιστή και να μου λύσει αυτό το ολοκλήρωμα και να μου το βρει. Τα παλιά τα χρόνια όμως που δεν υπήρχε ο υπολογιστής λέγανε ότι εδώ δεν μπορώ να δουλέψω. Όντως εδώ είναι λίγο δύσκολο να δουλέψω παρόλο που έχουμε τώρα γρήγορη αριθμητική επίλυση ολοκληρωμάτων. Και τι κάνανε, λέει θα κατέβω εδώ κάτω. Θα κατέβω κάτω στο ισόγειο που είναι απλά τα πράγματα. Και το ισόγειο είναι απλό γιατί, γιατί εδώ έχει μία κατανομή πάλι κανονική που έχει μέση τη μη 0 και τυπική απόκλειση 1. Αυτή είναι η πιο απλή κανονική κατανομή που μπορεί να σκεφτείτε. Και τη λέμε, της έχουμε δώσει και όνομα, τη λέμε τυπική κανονική κατανομή και μάλιστα τη μεταβλητή τη συμβολίζουμε και Ζ. Θυμάστε αυτά, γιατί ξεχωρίζουμε και την αθρηστική τη συμβολίζουμε όχι με F αγγλικό αλλά με ένα Φ κεφαλαίο. Γιατί τώρα είναι σημαντική αυτή η κατανομή, γιατί απ' τα παλιά τα χρόνια πήγαν εδώ πέρα και λένε τι πιθανότητα θέλεις εδώ, θέλεις μία πιθανότητα α, δεύτερα να είσαι στη νουρά, άρα αυτή η τιμή σε ποια πιθανότητα θρηστική αντιστοιχεί, η πιθανότητα να είμαι αριστερά απ' αυτήν εδώ την τιμή, τη Ζ μικρό, ας την βάλω Ζ μικρό, είναι το Φ του Ζ μικρό να είναι α δεύτερα ή μάλλον με συγχωρείτε 1-α δεύτερα. Γιατί πάντα τις πιθανότητες τις ορίζουμε να είναι αριστερά από την τιμή. Αριστερά από την τιμή και αυτό αντιστοιχεί στην αθρηστική. Θα θυμάστε αυτά, την αθρηστική την ορίζουμε την πιθανότητα να είμαστε αριστερά από την τιμή. Αφού θέλω εγώ να έχω α δεύτερα ουρά απ' τα δεξιά, άρα η πιθανότητα να είμαι αριστερά από την τιμή είναι 1-α δεύτερα. Κατανοητό? Αυτή η πιθανότητα αυτή ποια είναι? Είναι το Ζ που αντιστοιχεί στο α δεύτερα. Ενώ αυτό είναι το Ζ που αντιστοιχεί στο 1-α δεύτερα. Γιατί η πιθανότητα να είμαι αριστερά από αυτή την τιμή είναι ακριβώς το α δεύτερα. Ερώτηση bingo. Τι σχέση έχουν αυτά τα δύο, το Ζ του α δεύτερα και το Ζ του 1-α δεύτερα. Συμμετρικά έως προς το μηδέν. Γιατί αυτή η καμπάνουλα έχει αυτή την ωραία ιδιότητα της συμμετρίας και μάλιστα επειδή έχω πάρει κέντρο το μηδέν, είναι συμμετρικό έως προς το μηδέν. Άρα λοιπόν, αντί να μιλάω για δύο τιμές εδώ πάνω, εδώ κάτω στην ουσία έχω μία τιμή, τη μία με αρνητικό πρόσημο, την άλλη με θετικό. Και τα παλιά τα χρόνια παιδευτήκανε κάποιοι και λένε θα πάω εγώ να βρω για μια σειρά από εδώ πέρα τις τιμές, θα βρω τις αντίστοιχες πιθανότητες. Και φτιάξαμε ένα πινακάκι, έναν στατιστικό πίνακα και μπορούμε λοιπόν να χρησιμοποιούμε πλέον αυτόν τον στατιστικό πίνακα για να βρίσκουμε για κάθε Ζ την αντίστοιχη πιθανότητα ή για κάθε πιθανότητα το αντίστοιχο Ζ. Τώρα, το ερώτημα είναι πώς θα φτάσω εδώ κάτω. Να ξαναγυρίσω εδώ. Είπα ότι εδώ λοιπόν τώρα μπορώ να λύσω το πρόβλημα. Τώρα δεν έπρεπε να σας δείξω αυτή τη διαφάνεια γιατί σας έχω δείξει ήδη τον τρόπο πώς θα φτάω εδώ κάτω. Γιατί λέω ότι αν αφαιρέσω τη μέση τιμή, αν αφαιρέσω τη μέση τιμή, δηλαδή πάρω το μέσο όρο μίον τη μέση τιμή, αυτό θα ακολουθεί μία κατανομή, αφού ο μέσος όρος ακολουθεί μία κατανομή με μέση τιμή μη, θα ακολουθεί μία κατανομή με μέση τιμή μη δεν. Και η ίδια διασπορά. Λέω ότι αν μεταφέρω την κατανομή που είχα εδώ στο μηδέν, έχω φτιάξει μια άλλη μεταβλητία αυτή εδώ. Με αυτόν τον τρόπο λοιπόν άλλαξα τη μέση τιμή από μη και την πήγα στο μηδέν. Άρα έφτιαξα το πρώτο συστατικό εδώ πέρα. Το δεύτερο που θέλω να κάνω είναι να το κάνω αυτό να έχει μονάδα. Επειδή λοιπόν εδώ έχω ένα άνοιγμα σίγμα διαρίζα n, εάν πάρω αυτό εδώ και το διαιρέσω με το σίγμα διαρίζα n, αυτό θα μου δώσει το ζ που θέλω. Και θα έχω λοιπόν το ζ να ακολουθεί την ί0-1. Αυτός λέγεται ένας μετασχηματισμός που ονομάζεται κανονικοποίηση. Δηλαδή αφαιρούμε τη μέση τιμή, διαιρούμε την τυπική απόκληση και έτσι πάμε σε μία τυπική κανονική κατανομή. Εδώ τώρα λοιπόν ήδη έχω πει ότι έχω λύσει τα θεματάκια που είχα γιατί έχω ορίσει τις δύο οουρές α, δεύτερα και αριστερά και δεξιά και έτσι μπορώ να βρω αυτά τα δύο άκρα. Εδώ λοιπόν μπορώ να λύσω το πρόβλημα που είχα εδώ πάνω με το να βρω αυτά τα δύο άκρα. Εδώ έχουμε ένα στατιστικό σπίνακας που πας και του δίνεις εσύ την πιθανότητα, την πιθανότητα αυτή είναι εδώ και σου βρίσκει με την αντίστροφη της αθρηστική, σου βρίσκει το αντίστροχο Ζ. Εδώ λοιπόν μπορώ να λύσω το πρόβλημα και έστω ότι το βρίσκω το πρόβλημα. Αν πάτε και δώσετε εδώ πέρα μια πιθανότητα μπορείτε να βρείτε αυτή την τιμή του Ζ. Πώς θα γυρίσουμε τώρα πίσω? Πώς θα γυρίσω εδώ πέρα για να βρω τα μη ένα μη δύο? Θα προσθέσουμε το μη, αρκεί αυτό? Άρα θα κάνω τον αντίστροφο μετασχηματισμό δηλαδή. Αυτή είναι η ιδέα σε πολλά προβλήματα που έχουμε στην πράξη επειδή δεν μπορούμε να τα λύσουμε σε ένα πεδίο ορισμού του προβλήματος που έχουμε κάπου ψηλά που ζαλιζόμαστε που λέγαμε, κάνουμε ένα μετασχηματισμό, το πάμε σε μια απλή μορφή εκεί μπορούμε να το χειριστούμε το πρόβλημα να το λύσουμε και αφού το λύσουμε ξαναγυρνάμε πίσω. Τώρα είμαστε στην κατάσταση όπου έχουμε λύσει το πρόβλημα γιατί μπορώ να βρω τα άκρα που είπαμε και θέλω να γυρίσω πίσω. Το να γυρίσω πίσω σημαίνει να πάρω αυτά τα άκρα που αντιστοιχούν σε αυτήν εδώ το μετασχηματισμό και να λύσω πλέον ως προς μη. Ένα λύσω ως προς μη έχω πλέον αυτά τα μη ένα μη δύο και βρήκα το διάστημα εμπιστοσύνης. Αυτή λοιπόν είναι η λύση που μου λέει ότι στην περίπτωση που έχω γνωστεί διασπορά και μπορώ με κάποιο τρόπο να δεχτώ ότι ο μέσος όρος ακολουθεί κανονική κατανομή είτε γιατί η τυχαία μεταβλητή ακολουθεί κανονική κατανομή είτε γιατί έχω μεγάλο δείγμα τότε το διάστημα εμπιστοσύνης που λέγαμε το μη ένα μη δύο έχει αυτήν εδώ τη μορφή. Και αν το δούμε λίγο περισσότερο το διάστημα αυτό εμπιστοσύνης κάποιος θα μπορούσε να παρασιρθεί και να πει ότι το διάστημα αυτό μου λέει ότι με πιθανότητα 1-α ή εμπιστοσύνη 1-α η μέση τιμή βρίσκεται μέσα σε αυτό το διάστημα και λέω ότι αυτό δεν είναι σωστό γιατί δεν μπορούμε να μιλάμε με πιθανότητα για τη μέση τιμή. Θυμηθείτε ότι η μέση τιμή είναι όπως γράφω εκεί πέρα μια παράμετρος άγνωστη αλλά σταθερή. Άρα δεν έχει νόμιμο να μιλάω για πιθανότητα για το πού βρίσκεται η μέση τιμή. Αυτό που μπορώ να πω είναι πού βρίσκεται το διάστημα. Ότι το διάστημα η πιθανότητα ανεφέρεται στο διάστημα. Αυτό είναι που αλλάζει. Το διάστημα λοιπόν θα περιέχει με πιθανότητα 1-α την πραγματική μέση τιμή. Υπάρχει μια σταθερή τιμή και ένα διάστημα το οποίο αλλάζει από δείγμα σε δείγμα. Και λέω ότι με πιθανότητα 1-α θα περιέχει. Αν θέλουμε να το δούμε λίγο πιο πρακτικά αυτό σημαίνει ότι αν έκανα 100 πειράματα, αν έπαιρνα 100 δείγματα και σε κάθε δείγμα πήγαινα και υπολόγιζα αυτό που έγραψα με κόκκινο εδώ πέρα. Και έβρισκα δύο τιμές. Αυτό μου λέει ότι από τα 100 τέτοια διάστηματα εμπιστοσύνης που θα έφτιαχνα τα 1-α τα 100 θα περιέχανε την πραγματική μέση τιμή. Γιατί είχα ένα διάστημα εμπιστοσύνης 95% αυτό μου λέει ότι σε 100 επαναλήψεις, 100 δείγματα θα φτιάξεις 100 διάστηματα εμπιστοσύνης και τα 95 περίπου από αυτά θα σου περιέχουν την πραγματική τιμή. Η διαδικασία είναι αυτή εδώ. Και αυτό είναι το πρακτικό μέρος. Όλο αυτό που λέγαμε μέχρι τώρα με αυτό το σχεδιασμό εδώ πέρα ήταν για να φτάσουμε σε αυτό εδώ το αποτέλεσμα. Πρακτικά όμως στη στατιστική έχουμε κάποιους τύπους όπως αυτός με κόκκινα ό,τι είναι με κόκκινα υπάρχει στον τυπολόγιο που σημαίνει ότι υπάρχει στις εξετάσεις δεν χρειάζεται να θυμάσουν δηλαδή τύπους, θα δίνονται οι τύποι. Και η στατιστική είναι σχετικά εύκολο μάθημα γιατί δεν έχει να σκέφτεσαι πώς θα το αντιμετωπίσεις πώς θα το λύσεις το πρόβλημά σου γιατί έχεις τον τύπο, αν γνωρίζεις ποιο είναι το πρόβλημά σου πας στον αντίστοιχο τύπο και τον εφαρμόζεις. Εδώ λοιπόν τι χρειάζεται να ξέρουμε. Αν έχουμε γνωστή διασπορά και έχουμε κανονική κατανομή μεγάλο δείγμα θα πάμε σε αυτόν εδώ το τύπο. Πώς θα τον εφαρμόσεις το τύπο, τι χρειάζομαι χρειάζομαι το μέσο όρο, το βρίσκω από το δείγμα, το 1-α μου το δίνει η άσκηση το σ είναι γνωστό, άρα κάνω αντικατάσταση, μου λείπει αυτή η τιμή που την παίρνω από τον πίνακα και τελείωσα. Ευκολάκι δηλαδή. Να το δούμε και σε ένα παράδειγμα. Όλα είναι σωσ. Στατιστική χρειάζεται μόνο να λύσεις τα ασκήσεις, δεν έχει σωση. Αν λύσετε όπως έχει εδώ πέρα, αυτά τα παραδείγματα είναι ασκήσεις. Αν λύσετε μια-δυο τέτοιες ασκήσεις δεν έχετε άλλο τίποτα να κάνετε. Αυτή είναι η στατιστική. Γιατί θα καταλάβετε πώς λύνονται. Λοιπόν, αν θυμάστε είχαμε στο προηγούμενο παράδειγμα, είχαμε πάρει 25 ασφάλειες και πήγαμε και μετρήσαμε σε ποιο όριο κέγονται. Οι ασφάλειες είναι το 40 μΩ, οπότε κανονικά θα πρέπει να κέγονται εκεί γύρω στους 40 μΩ. Και πήγαμε και μετρήσαμε το όριο που κέγονται, 25 ασφάλειες, και τώρα θέλω να βγάλω ένα διάστημα εμπιστοσύνης, 95% για το μέσο όριο. Αυτή είναι η λέξη κλειδή. Μέσο όριο. Αφού μου λέει λοιπόν το μέσο όριο, 95% διάστημα εμπιστοσύνης, άρα θέλω διάστημα εμπιστοσύνης για τη μέση θυμή. Εντάξει. Και μου λέει δίνεται ότι η διασπορά είναι ένα αμπέρσιο τετράγωνο. Βέβαια τώρα θα μου πείτε καλά και πού το ξέρεις τώρα. Η διασπορά αυτή, θυμίζω, δεν είναι στο δείγμα. Η διασπορά αυτή είναι στον πληθυσμό, είναι αυτό εδώ. Δηλαδή αναφέρεται σε όλες τις ασφάλειες της εταιρείας. Και κάποιος βέβαια μπορεί να πει ότι αυτό δεν μπορούμε να το γνωρίζουμε. Έστω όμως ότι από παλιότερες μετρήσεις κτλ κτλ, γνωρίζουμε ότι η διασπορά είναι αυτή εδώ. Δεν μας απασχολεί. Πώς μπορώ να προχωρήσω. Είμαι στην περίπτωση λοιπόν της γνωστής διασποράς. Τι πρέπει να έχω, ή μεγάλο δείγμα, πάνω από 30, που δεν είναι γιατί εδώ έχω 25 παρατηρήσεις, ή κανονική κατανομή. Κάνω το θηκόγραμμα και το ιστόγραμμα. Τι λέει η μεγάλη σας εμπειρία τώρα μετά από τρία μαθήματα. Μπορώ να δεχτώ ότι είναι κανονική κατανομή. Εδώ μάλιστα είναι ιδανικά τα πράγματα. Δηλαδή οι ουρές έχουν περίπου το ίδιο μήκος, οι διάμεσες είναι περίπου στο μέσο του κουτιού εδώ πέρα. Άρα μπορώ να υποθέσω κανονική κατανομή. Και αφού μπορώ να υποθέσω ότι έχω κανονική κατανομή, μπορώ να υποθέσω ότι και ο μέσος όρος ακολουθεί κανονική κατανομή με κάποια μέση τιμή μη και διασπορά που είναι σίγμα τετράγωνο δια 1. Σίγμα τετράγωνο είναι 1, το 1 είναι 25. Τι χρειάζεται να κάνω εδώ λοιπόν, θα χρειαστεί και το μέσο όρο να βρω και κάνω αντικατάσεις στον τύπο. Γνωρίζω το 1-α είναι 0.95, το σίγμα είναι 1, το χ με την παρά 39.8. Εγώ τώρα πρέπει να βρω αυτή τη τιμή, το ζ του 1-α δεύτερα. Ποιο είναι το 1-α δεύτερα? Αφού μου λέει λοιπόν ότι το 1-α είναι 0.95, άρα το α είναι 0.05, άρα το α δεύτερα είναι 0.025 και άρα το 1-α δεύτερα είναι 0.975. Θα πάω λοιπόν εδώ να βρω το ζ που αντιστοιχεί σε πιθανότητα 0.975 από το στατιστικό πίνακα. Πηγαίνω λοιπόν στο στατιστικό πίνακα. Αυτός ο στατιστικός πίνακας θα σας δίνεται στις εξετάσεις. Είναι αυτός εδώ, υπάρχει στις σημειώσεις και στην ιστοσελίδα του μαθήματος. Λέει στατιστικός πίνακας τυπικής κανονικής κατανομής. Και θα τον έχετε στις εξετάσεις όπως το βλέπετε εδώ πέρα. Η πιθανότητα που είπαμε είναι 0.975. Λοιπόν παιδιά πρακτικές οδηγίες, βλέπετε ότι εδώ έχει παραδείγματα, μην πελαγώσετε. Αν σας εξετάσεις, το βρείτε προστάσεις και λέτε όχι πώς το έκανα και τι έκανα, έχει εδώ τις απαντήσεις. Για Z τόσο η πιθανότητα είναι αυτή. Ψάξτε να τα βρείτε μέσα για να είστε σίγουροι ότι το έχετε κάνει με το σωστό τρόπο. Ορίστε. Θέλουμε να βρούμε την τιμή του Z που αντιστοιχεί σε πιθανότητα 0.975. Οι πιθανότητες είναι εδώ μέσα. Όπως βλέπετε είναι σε αύξησα σειρά. Άρα θα κατέβω μέχρι το 0.975, βλέπετε 0.971, 0.977. Άρα συνεχίζω έως προς τη γραμμή και μάλιστα εδώ έχω τη τιμή την ίδια, 0.975. Εδώ είναι η τιμή της πιθανότητας. Πηγαίνω στη γραμμή 1.9 και η στήλη μου δίνει το δεύτερο δεκαδικό. Άρα είναι το 1.96. Κατανοητό? Χρειάζεται να το ξαναπώ? Όχι, έτσι, ναι. Είναι η στήλη, η αντίστοιχη στήλη. Βλέπεις ότι εδώ στις στήλες έχω το δεύτερο δεκαδικό. Η γραμμή μου δίνει μέχρι το πρώτο δεκαδικό ακρίβεια. Με ακρίβεια δεύτερο δεκαδικό πηγαίνω στη στήλη. Άρα εδώ στο 0.975 είναι το 1.9 και 6. Το 1.96. Εντάξει. Βλέπετε τι εύκολη που είναι η στατιστική. Γελία. Βρίσκεις τη τιμή. Άρα έχεις ότι χρειάζεσαι, ξέρεις και τον τύπο. Πας και κάνεις αντικατάσεις σε αυτόν τον τύπο. Το μέσο όρο, την κρίσιμη τιμή του Ζ, το σίγμα και το ρίζα 1. Και βρήκες το αποτέλεσμα. 39,4 με 40,2. Τι σημαίνει αυτό το αποτέλεσμα? Τι μου έχει δείξει αυτό το αποτέλεσμα? Μιχαλάκι. Μιχαλής. Μπράβο. Τι σημαίνει αυτό το αποτέλεσμα? 39,4 με 40,2. Θα είναι σε αυτό το διάστημα. Δηλαδή είμαι σίγουρος κατά 95% ότι αυτό το διάστημα θα περιέχει την πραγματική μέση τιμή. Εάν λοιπόν για να μπορεί αυτή η εταιρεία να πουλάει στο εμπόριο, υπήρχαν οι προδιαγραφές που λέγανε ότι θα πρέπει το μέσο όριο που καίγονται ασφάλειας να είναι 40, αφού η ονομαστική τιμή είναι τόσο, θα μπορούσε να πουλάει αυτή η εταιρεία. Με βάση αυτό το πείραμα. Ναι, γιατί είναι εδώ μέσα. Ενώ αν είχαμε βρει ένα διάστημα εμπιστοσύνης 39,4 με 39,8 ας πούμε, δεν θα μπορούσε να πουλά. Γιατί το μέσο όριο που καίγεται δεν περιέχει το 40. Το 40 είναι απέξω. Αυτό λοιπόν το διάστημα εμπιστοσύνης μας επιτρέπει να βγάζουμε κάποια συμπεράσμα. Δεν του αρέσει να του μιλήσω. Φυσάει. Δεν του αρέσει το συμπεράσμα. Είχες να τον πετάξεις έξω από την εταιρεία. Έχεις προσωπικά ενδιαφέροντα. Λοιπόν, αυτή ήταν η περίπτωση όπου έχουμε γνωστή διασπορά. Όπως σας είπα όμως, γνωστή διασπορά είναι πολύ δύσκολο να έχουμε στην πράξη. Συνήθως η διασπορά είναι άγνωστη. Πάμε λοιπόν σε άγνωστη διασπορά και η πρώτη περίπτωση είναι να έχω μεγάλο δείγμα και έρχεται τώρα και λέει κάτι πρακτικό. Κάποιος λέει αφού είναι μεγάλο το δείγμα, το σίγμα τετράγωνο που δεν το ξέρεις πήγε να αντικατέσεις έτω με το γνωστό που έχεις από το δείγμα και όλα ωραία και καλά. Λίγο μπακάλικο, δεν είναι? Εντάξει, για μεγάλο δείγμα μπορούμε να το δεχτούμε λοιπόν ότι ισχύει αυτό. Αν όμως είναι μικρό το δείγμα και έχω κανονική κατανομή, τότε το πρόβλημα είναι ότι αν είναι μικρό το δείγμα δεν μπορώ να εμπιστευτώ αυτή την εκτίμηση να αντικαταστήσω απλά το σίγμα τετράγωνο με το στετράγωνο. Γιατί αφού είναι μικρό το δείγμα δεν γνωρίζω το σίγμα τετράγωνο, έχω μια μεγαλύτερη ασάφια. Μεγαλύτερη ασάφια τι σημαίνει? Ότι ενώ εγώ θα περίμενα το διάστημα εμπιστοσύνης που φτιάχνουν να είναι 95% που σημαίνει σε 100 επαναλήψεις, 100 διαστήματα τα 95 να το περιέχουν, επειδή ακριβώς θα είναι μεγαλύτερη ασάφια μπορεί να το περιέχουν τα 93, τα 92 να μην είναι σωστό. Μιχαλάκι, ακούγεσαι Μιχάλη, Μιχαλάκι. Και ήρθε λοιπόν ένας τύπος ο οποίος έδωσε το όνομά του σε αυτήν την κατανομή. Τώρα είναι μια νέα κατανομή, η οποία όπως βλέπουμε εδώ μοιάζει με την αρχική κατανομή της τυπικής κανονικής κατανομής, γιατί η τυπική κανονική κατανομή είναι αυτή η καμπανούλα. Ε, αυτή η Student κατανομή που έχει εδώ πέρα βαθμούς ελευθερίας που σημαίνει ότι αλλάζει η μορφή της με αυτόν τον δίκτη, δεν είναι μία και τελειώσαμε όπως εδώ, είναι 0,1 και τελειώσαμε, αλλάζει με αυτόν τον δίκτη και λέει ότι όσο δίκτης αυτός μεγαλώνει, που το λέμε βαθμή ελευθερίας, τόσο πλησιάζει την καμπανούλα, αλλά για μικρή τιμή του δίκτη έχει πιο παχιά ουρά εδώ πέρα. Με το παχιά ουρά τι σημαίνει, ότι εάν εγώ θέλω να κρατήσω την ίδια πιθανότητα α δεύτερα εδώ πέρα σε μία τέτοια κατανομή με παχιά ουρά, πού πρέπει να το πάω αυτό το όριο, πιο έξω πρέπει να το πάω, έτσι δεν είναι πιο παχιά η ουρά. Είναι αυτό που λέγαμε ότι θέλω λόγω της ασάφιας που έχω που δεν γνωρίζω το σίγμα, θέλω να το ανοίξω, άρα αντίστοιχα ανοίγω και αυτό εδώ. Αυτή λοιπόν είναι πιο κατάλληλη η κατανομή, γιατί ανάλογα με το πόσο μεγάλο είναι το δείγμα, 1-1 είναι η βαθμή ελευθερίες, άρα αυτό ορίζεται από το μέγεθος του δείγματος το 1, ανάλογα λοιπόν με το πόσο μεγάλο είναι το δείγμα πλησιάζει ή δεν πλησιάζει την κανονική κατανομή. Τώρα το student είναι ένα παρατσούκλι που χρησιμοποιείς σε κάποιον, όλοι ξέρουν τι σημαίνει student, φοιτητής. Γιατί αυτός ο τύπος που βρήκε αυτήν την κατανομή, δούλευε σε μια ζηθοπία στο δουβλίνο, ξέρετε τι ζηθοπία στο δουβλίνο φαντάζομαι, δεν χρειάζεται να το συζητήσουμε και πολύ. Ποια? Μαύρη μπίρα με αφρό, βαρύ αφρό από πάνω, μπίρα με αφρό λέει, σαν κρέμα ρε που είναι αφρός ρε. Μιχάλη πες ποια είναι. Κάιζερ, Παναγία μου. Μαύρη μπίρα ρε παιδιά που έχει σαν κρέμα το αφρό από πάνω. Καλά ρε δεν πήρες εσείς. Κίνες, όχι Κάιζερ, Κίνες έτσι. Αυτός δούλευε στην Κίνες λοιπόν, Κίνες είναι παραδοσιακή, ήταν από το 19ο αιώνα. Δούλευε εκεί πέρα, δεν τον αφήνανε να παρουσιάσει άρθρο επιστημονικό γιατί φοβόταν να μην χάσουνε τα μυστικά το πώς φτιάχνεται η μπίρα και έστειλε ένα άρθρο που αντί να γράψει το επίθετο το από κάτω και από πού είναι έγραψε student. Και γι'αυτό έχει επικρατήσει να τη λέμε ή τι κατανομεί με βάση αυτό το γράμμα, το τι, ή student. Τι είπες Μηλτό. Δεν έγινε διάσημος γιατί θα μπορούσε να έχει ένα όνομα, δεν ξέρω πώς το λέγανε. Για να μείνει στην Κίνες. Για να μείνει στην Κίνες. Τι είδες, από τότε υπήρχε αυτή η κρίση με τις δουλειές. Βλέπουμε εδώ πέρα στο παράδειγμα αυτό όπου έχουμε 24 βαθμούς ελευθερίας δηλαδή το μέγεθος του δείγματος είναι 25 ότι ενώ η τιμή που είχαμε εδώ πέρα για 95% διάστημα εμπιστοσύνης δηλαδή για πιθανότητα 0,975 αυτή τη τιμή αν θυμάστε από τον πίνακα ήταν το 1,96 αυτή τη τιμή. Εδώ πέρα τώρα είναι 2,06 δηλαδή πήγε λίγο πιο έξω. Το ότι πήγε λίγο πιο έξω μας το κάνει πιο μεγάλο το διάστημα και αυτό έχει σαν αποτέλεσμα να είναι πιο ακριβές. Η διαδικασία λοιπόν είναι ίδια με την προηγούμενη μόνο που αντί να έχουμε την τιμή του z εδώ πέρα που είχαμε στην κρίσιμη τιμή βάζουμε την τιμή της student και φυσικά το σίγμα το άγνωστο έχετε κατασταθεί από το s. Αυτός είναι ο πιο γενικός τύπος για το διάστημα εμπιστοσύνης που είναι όταν έχουμε άγνωστη διασπορά και μικρό δείγμα αλλά κανονική κατανομή. Στην περίπτωση τώρα που έχω μικρό δείγμα αλλά δεν έχω κανονική κατανομή δεν μπορώ να χρησιμοποιήσω αυτόν τον τύπο και αυτά είναι τα προβλήματα. Θυμάστε που λέγαμε στην αρχή κάνουμε το ιστόγραμμα ή το θηκόγραμμα όταν έχουμε ένα δείγμα γιατί τα κάνουμε αυτά για να δούμε αν έχουμε κανονική κατανομή. Γιατί αν έχω κανονική κατανομή μπορώ να χρησιμοποιήσω τα εργαλείο μου και το εργαλείο σε αυτή την περίπτωση είναι αυτό εδώ. Να πάω να πω ότι μπορώ να πάρω το διάστημα εμπιστοσύνης με μέσο της student. Αν όμως δεν έχω κανονική κατανομή όπως εδώ δεν μπορώ να το χρησιμοποιήσω και πρέπει να πάω σε άλλη μέθοδο που δεν μου δίνει τόσο καλά διάστηματα εμπιστοσύνης και λέγεται μη παραμετρική. Και κάποιος λοιπόν μπορεί να μας μιλήσει για αυτήν την μη παραμετρική μέθοδος που λέγεται και Wilcoxon από το όνομα αυτήν που την είδε. Και υπάρχει και ένας άλλος τρόπος να φτιάξουμε διαστήματα εμπιστοσύνης με τη βοήθεια του υπολογιστή. Είναι η γνωστή μέθοδος bootstrap που δεν την έχετε ξανακούσει. Bootstrap σημαίνει boot, bota, strap, cordoni. Αυτή είναι μια ονομασία δεν μεταφράζεται στα ελληνικά γιατί δεν μπορείς να πεις κορδόνια bota δεν έχει κάποιο νόημα. Αλλά μπορεί κάποιος να μας την παρουσιάσει είναι μια μέθοδος που μπορούμε να την κάνουμε λόγω του υπολογιστή. Λοιπόν γυρνάω στο προηγούμενο παράδειγμα τώρα όπου έχω διάστημα εμπιστοσύνης επίπεδο 95% για το μέσο όριο έντασης του ελεκτρικού ρεύματος της ασφάλειας. Αλλά τώρα έχω άγνωστη διασπορά. Η διασπορά τώρα δεν είναι γνωστή. Προηγούμενος είχα γνωστή διασπορά τώρα έχω άγνωστη. Μικρό δείγμα είχα δείξει με το ιστόγραμμα και το θηκόγραμμα ότι έχω κανονική κατανομή άρα μπορώ να χρησιμοποιήσω τη student. Και έχω 24 βαθμούς ελευθερίας χρειάζομαι και τη δειγματική διασπορά κάνω τον υπολογισμό εδώ πέρα. Και πώς το διάστημα εμπιστοσύνης. Η στατιστική είναι απλή. Αφού λες ότι δεν σου δίνει το πρόβλημα τη διασπορά. Βρίσκεις ότι έχεις κανονική κατανομή με το ιστόγραμμα μικρό το δείγμα άρα θα πας αυτόν τον τύπο. Τι χρειάζεσαι εδώ πέρα το μέσο όρον τον υπολόγησες. Τι χρειάζεσαι τη δειγματική τυπική απόκλειση η δειγματική διασπορά από τον τύπο. Άρα η ρίζα αυτού νου είναι αυτό που χρειάζεσαι εδώ πέρα. Αυτό που λείπει τώρα είναι αυτή εδώ η τιμή. Η κρίσιμη τιμή για 25 μίον 1 24 βαθμούς ελευθερίας και 1 μίον α δεύτερα όπως το είδαμε και εδώ πέρα 0,975. Πώς βρίσκω αυτό το 2.064 όπως με τον προηγούμενο τύπο αλλά με διαφορετική διάταξη των τιμών. Στον προηγούμενο τύπο που είχα για την τυπική κανονική κατανομή η πιθανότητα ήταν εδώ μέσα. Τώρα δεν είναι η πιθανότητα εδώ μέσα αλλά εδώ πέρα έχω ένα πίνακα ο οποίος καθορίζεται από τις γραμμές που είναι η βαθμή ελευθερίας και αποστήλες που αντιστοιχούν σε πιθανότητες. Αν κατέβω λοιπόν εδώ πέρα εγώ θέλω 25 παρατηρήσεις που έχω μίον 1 24 βαθμούς ελευθερίας. Άρα θα έρθω εδώ στη γραμμή 24 και πιθανότητα όπως είπαμε 0.975 που είναι η τρίτη στήλη. Άρα θα διαβάσω την τιμή του T από την αντίστοιχη γραμμή και στήλη. Αχ Βαγγελάκι θα σε δώσεις εξετάσεις θα μου κάνεις κανένα μαργαριταράκι. Τα έχεις για τετριμένο δηλαδή αυτό. Άρα πάμε στη γραμμή που είναι η βαθμή ελευθερίας. Στις στήλη πιθανότητες βρίσκουμε την τιμή. Και αντικατάσταση στον τύπο. Απλή αντικατάσταση στον τύπο βρίσκω το αποτέλεσμα 39 και 42 με 40 και 18. Αυτό λοιπόν το αποτέλεσμα είναι το ακριβές δηλαδή το 95% διάστημα εμπιστοσύνης. Αν έπαιρνα εγώ τον τύπο που αγνοούσα αυτό τη Student που έχει πιο παχές ουρές και έπαιρνα από τη Z. Έβαζα το 1.96 αντί για το 2.64 θα έπαιρνα ένα διάστημα εμπιστοσύνης που θα ήταν πιο στενό. Και κάποιος μπορεί να πει εντάξει το δεύτερο είναι καλύτερο αφού είναι πιο μικρό. Είναι πιο μικρό αλλά δεν κάνει αυτό που λέει. Εμείς θέλουμε ένα 95% διάστημα εμπιστοσύνης. Δηλαδή στις 100 επαναλήψεις που λέγαμε τις 95 φορές να περιέχει. Αυτό επειδή είναι πιο στενό να περιέχει τη μέση τιμή. Αυτό επειδή είναι πιο στενό δεν θα ήταν ακριβές. Μπορεί να το βαφτίσαμε 95% αλλά δεν θα ήταν 95%. Γι' αυτό λοιπόν παίρνουμε αυτό με τη Student. Όχι δεν θα ήταν καλύτερο γιατί δεν θα ήταν 95%. Όχι λιγότερο θα ήταν. Θα ήταν πιο στενό το διάστημα οπότε περισσότερες τιμές θα σου βγαίναν απ' έξω. Και αυτό σωστό. Και αυτός είναι ο πίνακας με όλα μαζί εδώ πέρα. Τώρα επειδή είναι η ώρα δύσκολη και πέρασε 7,5 από ό,τι βλέπω. Πώς το καταλάβατε το σήμα ρε παιδιά. Δεν χρειάζεται και να πω τίποτα άλλο.