Διάλεξη 13: Είχαμε μιλήσει για πώς περιγράφουμε τα δεδομένα, είχαμε πει πώς κάνουμε ένα ιστόγραμμα και θα συνεχίσουμε σε αυτό, πώς περιγράφουμε τα δεδομένα, είχαμε μιλήσει επίσης για τα μέτρα θέσης, ε, καλά τα θυμάμαι ότι είχαμε φτάσει μέχρι εκεί, είχαμε μιλήσει για τα μέτρα θέσης, δηλαδή είχαμε μιλήσει για πώς περιγράφουμε τα δεδομένα, είχαμε πει πώς κάνουμε ένα ιστόγραμμα και θα συνεχίσουμε σε αυτό, πώς περιγράφουμε τα δεδομένα, είχαμε μιλήσει επίσης για τη διγματική μέση τιμή και τη διγματική διάμεσο, ε, τα θυμάστε αυτά, ωραία, τώρα θα περάσουμε να δούμε και τα μέτρα μεταβλητότητας, δηλαδή πώς, είδεν είχαμε μιλήσει για διάμεσο και διγματική μέση τιμή μιλήσαμε, ναι, σωστά, ένα δεύτερο χαρακτηριστικό στα εδομένα μας είναι πόσο σκόρπια είναι, αυτό μας λέει για τη μεταβλητότητα λοιπόν και δέστε λίγο αυτό το παράδειγμα, δεν το είχαμε δει την προηγούμενη φορά, ξεκινάμε με αυτό τώρα Εδώ έχουμε δύο δείγματα πάλι, η ράβδος είναι που δεν έχει καθόλου μάζα, οι μπαλίτσες αυτές είναι οι παρατηρείς από κάθε δείγμα, στην πάνω ράβδο είναι για το ένα δείγμα, στην κάτω για την άλλη Τι παρατηρούμε εδώ πέρα, ότι αυτή η ακίδα που ισορροπεί τη ράβδο είναι ακριβώς στο ίδιο σημείο, η ακίδα αυτή γεωμετρικά είπαμε αντιστοιχεί στη διγματική μέση τιμή στο μέσο όρο Έχει αυτή την ιδιότητα δηλαδή, οι αποκλείς από αριστερά και δεξιά αναθρίζονται στο ίδιο ποσό Άρα αν θα προσπαθούσα να χαρακτηρίσω τα δύο δείγματα αυτά με ένα μόνο χαρακτηριστικό, με τη διγματική μέση τιμή, θα έλεγα ότι δεν ενδιαφέρονται αυτά τα δύο δείγματα Φυσικά όμως και ενδιαφέρονται, δηλαδή με μια απλή ματιά κάποιος μπορεί να δει ότι πάνω είναι πιο σκόπιες οι τιμές Χρειαζόμαστε λοιπόν τώρα ένα άλλο χαρακτηριστικό που να μπορεί να μας ξεχωρίζει δύο δείγματα ως προς τη μεταβλητότητά τους Καμιά ιδέα, ο πράσινος, το όνομά σου? Δεν πειράζει, για το έκανες όμως Το όνομά σου? Φίλιππος Φίλιππος σκέφτεσαι έτσι κάποιο χαρακτηριστικό που να μπορεί να με μετράει πόσο σκόρπια είναι τα δεδομένα, οι παρατηρήσεις Η τυπική απόκλειση Η τυπική απόκλειση, τι ωραία λέξη, η τυπική απόκλειση Ακούγεται πολύ ωραίο, αλλά τι είναι αυτό, τυπική απόκλειση Ε, είναι σωστό, είναι η τυπική απόκλειση, αλλά Άμα σου έλεγα μπορείς εγώ που είμαι λίγο χαζούς και δεν το καταλαβαίνω να μου το εξηγήσεις έτσι με απλά λόγια Τι είναι η τυπική απόκλειση Μπορεί κάποιος να εξηγήσει τι είναι η τυπική απόκλειση, ας μην το δυσκολέψουμε το Φίλιππο Ναι, το όνομα σου Μιχάλης Μιχάλης ε, Μιχάλης, μην το έχεις πει την άλλη φορά Μιχάλη και σε είπε Μιχάλη, ναι Πόσο απέχουν οι διαφορετικές μέσες από την τυπική, από την μέση Ναι, αλλά αυτό είναι ένα πράγμα, πόσο απέχουν οι διαφορετικές μέσες Τι είναι ο μέσος όρους των αποστάσεων Το μέσος όρους των αποστάσεων Αν πάμε να το πούμε, δεν είναι τόσο απλό, έτσι Δεν ξέρω, υπάρχει ορισμός Για πέστε Τύπος υπάρχει Μας λέει καλά το ξεκίνησες, μια τυπική τιμή, γι' αυτό και λέγει τυπική απόκλειση, μια τυπική τιμή από το δείγμα Δηλαδή μια τυχαία τιμή να πάρουμε από το δείγμα Πόσο περιμένουμε να παίζει, να αποκλίνει από τη μέση τιμή, από τη δειγματική μέση τιμή Αυτό είναι η τυπική απόκλειση Βλέπετε όμως λίγο δύσκολο για να το προσδιορίσουμε. Κάτι άλλο? Ναι, το όνομα σου? Δημήτρης. Δημήτρης είναι ο ονόματος, ναι Πόσο απέχουν οι μπάλες με την εξήγη σου Οι μπάλες όλες? Κάτω μέσω Η μία με κάθε άλλη, με την επόμενη Αυτό όμως μου λέει για τη διασπορά, πόσο απέχουν με την επόμενη Θα παίζει ρόλο, πώς να το πούμε, μπορεί να είναι ισομερή εδώ πέρα, οι αποστάσεις δηλαδή Είναι ίδιες, αλλά αυτό δεν μου λέει και τίποτα Ναι, το όνομα σου? Ναι, αυτό είπαμε για την τυπική απόκλειση Ότι αυτό πάει να μας μετρήσει πόσο απέχουν από τη μέση τιμή Ναι, άλλος, το όνομα σου? Βασίλης Οι δύο ακραίες τιμές, έτσι? Τώρα βέβαια, σας έτρεψα λίγο να πείτε κάτι άλλο γιατί αυτό ήταν το πρώτο που είναι Το δειγματικό εύρος, δηλαδή το πιο απλό που μπορεί να σκεφτεί κάποιος Να πάρουμε τη μικρότερη, τη μεγαλύτερη τιμή, τις δυο ακραίες, να δούμε πόσο απέχουν Αυτό όμως έχει ένα πρόβλημα, δεν είναι και τόσο καλό μέτρο Να μας χαρακτηρίσει το σκόρπισμα, γιατί Θυμηθείτε αυτό που λέγαμε για το χρόνο που κάνει κάποιος φοιτητής να έρθει από το σπίτι του Στο πολιτεχνείο το πρωί Ή το χρόνο που κάνει ένα δρομολόγιο του τρένου το intercity Και αν πάρουμε ότι έχουμε 10-20 μέρες που μετρήσαμε το χρόνο που έκανε κάποιος φοιτητής να έρθει εδώ και παίρνει λεωφορείο Και για κάποιο λόγο το λεωφορείο φράκαρε κάπου στον δρόμο και άργησε πολύ κτλ Θα έχουμε μια τιμή η οποία μπορεί να είναι πολύ μακρινή σε σχέση με τις άλλες Ή το intercity κάπου να χάλασει μηχανή του πάνω στο λιανοκλάδι εκεί πέρα Που είναι τα βουνά, το ξέρετε αυτό ότι έχει κάτι βουνά εκεί στη Λαμία Και το χειμώνα μπορεί να έχει χιόνια και να αργήσει να φέρουν την άλλη μηχανή και τα λοιπά Μπορεί να μιλάμε αντί για 5,5 ώρες να κάνει 9 ώρες Σε αυτή την περίπτωση ο διγματικός ευρώς δεν θα είναι καλό για να μας δείξει το σκόρπισμα Γιατί θα επηρεαστεί από την ακραία τιμή Γι' αυτό λοιπόν πάμε να βρούμε κάτι άλλο Και το κάτι άλλο πηγαίνει σε αυτό που λέγατε για την τυπική απόκλυση Που δεν ξεκινάμε με την τυπική απόκλυση αλλά με την διασπορά ή διακύμαση Διασπορά ή διακύμαση είναι το ίδιο πράγμα Νομίζω πιθανότι στονομάζεται διακύμαση Βέβαια βάζουμε τη λέξη διγματική μπροστά για να ξεχωρίζει αυτό από την διασπορά στον πληθυσμό Το σίγμα τετράγωνο, αυτό που κάνατε στις πιθανότητες Αυτή είναι η θεωρητική διασπορά στον πληθυσμό Είναι η διασπορά του χρόνου όλων των διαδρομών του τρένου Ή όλων των διαδρομών που κάνει ένας φοιτητής Ή αν μιλάμε για το χαζό παράδειγμα με το ύψος του φοιτητή Είναι η διασπορά του ύψους όλων των φοιτητών Η διγματική αναφέρεται στο δείγμα Και για να την ορίσω τη διγματική διασπορά θα πρέπει να πάρω τις αποκλήσεις Αυτές τις αποκλήσεις που λέγαμε πώς τις μετράμε Δεν είναι η απόσταση της κάθε παρατήρησης χι-άι από το μέσο όρο Το έχει με την παρά Άντε και τις πήρα αυτές τις αποκλήσεις Τι θα γίνει άμα τις αθρίσω Άμα πάρω το άθρισμά τους Άμα δηλαδή πάρω για κάθε μία μπάλα από εδώ πέρα Τη διαφορά από τη θέση που έχει ο μέσος όρος Τι θα γίνει, ναι Μιχαλή Θα βγει μηδέν, έτσι, γιατί είπαμε ότι είναι τέτοια ιδιότητα του μέσου όρου Που αν αθρίσω από αριστερά και από δεξιά το ποσό που παίρνω είναι ίδιο Από αριστερά θα έχει πρόσιμο μίον, από δεξιά μηδέν Άρα τελικά αν πάρω το άθρισμα των αποκλήσεων Δεν φαίνεται, είναι με πράσινα εδώ πέρα και δεν φαίνονται καλά στην προπολεία Απλά λέει εδώ ότι θα βγει μηδέν Άρα αυτό δεν είναι καλό, να πάρω το άθρισμα των αποκλήσεων Τι να πάρω Ναι Βασίλης, ε Τετράγωνα να πάρω Συμφωνείτε όλοι Να πάρουμε τα τετράγωνα Να πάρουμε τα τετράγωνα όπως συμφωνείτε όλοι Και παίρνουμε τα τετράγωνα και μάλιστα δεν μένουμε μόνο στο άθρισμα των τετραγώνων Αλλά διαιρούμε εδώ γιατί για να μην επηρεάζεται από το πλήθος των παρατηρήσεων Από αυτό το N Είναι όλα καλά Πώς σε λένε Είδες, πολύ σιωπός Από εξυπνάδες πρότισσες, παίρνει και η κάμερα Πάλι σε την είπες Να γίνεις η μασκότου εδώ πέρα, πρόσεξε Ο Γιώργος λοιπόν λέει να πάρουμε την απόλυτη τιμή Αυτή δεν είναι καλή ιδέα, για σκέφτε το προηγούμενο παράδειγμα που λέγαμε με το εντερσίτ, το τρένο που χάλασε, καθυστέρησε κτλ Σε αυτή την περίπτωση ποιο θα ήταν πιο καλό το αποτέλεσμα που θέλουμε να μετρήσουμε την μεταβλητότητα Παίρνοντας τα τετράγωνα ή παίρνοντας τις τυπικές αποκλήσεις Γιώργο τι λες Είναι το πρώτο μάθημα που παρακολουθάω Δεν το πες το πτυχία έτσι αγόρι μου Για σκεφτείτε τι είπαμε ότι είχαμε μία ακραία τιμή, αντί να κάνει 5,5 ώρες έκανε 9 ώρες γιατί περίμενε να έρθει η μηχανή Άρα η απόσταση που θα έχουμε από τη μέση τιμή για αυτή την ακραία παρατήρηση θα είναι μεγάλη Αυτή η διαφορά θα είναι μεγάλη και θα πάει στο τετράγωνο Άρα θα επηρεάσει ακόμα περισσότερο στο άθρησμα και τελικά στην τελική τιμή που θα βγάλουμε Αν όμως παίρναμε απόλυτη τιμή θα παίρναμε μόνο τη διαφορά Άρα δεν θα επηρεάζει τόσο πολύ Γι' αυτό λοιπόν σε κάποιες περιπτώσεις η απόλυτη τιμή είναι καλύτερο μέγεθος Μου δίνει ένα καλύτερο μέγεθος για τη μεταβλητότητα από το τετράγωνο που έχω εδώ Παρ' όλα αυτά είναι παραμελημένο Δυστυχώς ή ευτυχώς δεν ξέρω μάλλον δυστυχώς δεν το χρησιμοποιούμε τόσο πολύ Δηλαδή αν ανοίξετε βιβλία δεν θα ακούσετε τίποτα για τη μέση απόλυτη απόκλειση Θα ακούσετε για τη διασπορά Όλοι γι' αυτό μιλάνε Γιατί είναι πολύ δύσκολο να το χειριστούμε Όπου μπαίνει απόλυτη τιμή δυσκολεύουν τα πράγματα Ε, είχα ακούσει ότι αυτό έχει να κάνει τη δασκίτητα των υπολογιστών Δηλαδή δεν μπορούν να υπολογίσουν την απόλυτη τιμή τόσο γρήγορα Δεν ξεκίνησαν αυτά από τώρα, αυτό τα είχαμε και από τότε που δεν είχαμε υπολογιστές Γενικά το να δουλέψουμε απόλυτη τιμή είναι πολύ δύσκολο Ενώ το δετράγωνο εντάξει παραγώγεις απόλυτη τιμή μπορείς να την παραγωγείς εύκολα Τώρα η διαφορά αυτών των δύο τώρα την καταλαβαίνετε είναι απλά αν κάνεις πράξεις εδώ πέρα μπορείς να καταλήξεις το δεύτερο τύπο Και θέλω να σας πω να μην χρησιμοποιείτε τον πρώτο τύπο τον έχω βάλει με χ Αλλά το δεύτερο γιατί είναι υπολογιστικά πιο εύκολος. Εάν θα δείτε εδώ πέρα για κάθε όρο πρέπει να κάνεις δύο πράξεις Μία διαφορά και ένα πολλαπλασιασμό, το τετράγωνο. Ενώ εδώ κάνεις μόνο μια πράξη Άρα υπολογιστικά είναι πιο γρήγορο Και σας βάζω λίγο και στο κλίμα των εξετάσεων ότι στις εξετάσεις θα έχετε μαζί σας απλό κομπιουτεράκι Αυτά που τώρα κάνουν τρία, τέσσερα, πέντε ευρώ δηλαδή, όχι κίνεται επιστημονικά Που δίνεις τα εδομένα και στα βγάζουν όλα. Που σημαίνει ότι όταν θα κάνετε πράξεις σας βοηθάει να χρησιμοποιήσετε το δεύτερο τύπο Όλα καλά, καμιά ερώτηση εδώ πέρα. Ναι, το όνομα σου Μπράβο, είδες το περίμενα να το πει κάποιος. Μπράβο Μιχάλη Γιατί είναι 1-1. Αν πάτε να τρέξετε στο βιβλίο της τρίτης ηλικίου που είχατε, νομίζω ότι διαιρούσατε εδώ με 1 Ενώ τώρα διαιρούμε με 1, δεν είναι φυσικά λάθος. Αυτό έχει να κάνει ότι εδώ μπαίνει μέσα ο μέσος όρος Και επειδή μπαίνει ο μέσος όρος, πλέον υπάρχει ας το πούμε έτσι μια μεγαλύτερη ανακρίβεια Γιατί δεν έχω την πραγματική μέση τιμή. Ποια θα είναι η πραγματική μέση τιμή. Η κοινοτομή. Τη μέση τιμή σε όλον τον πληθυσμό Πάω και προσεγγίζω τη μέση τιμή, γιατί θα ήθελα να βρω την τυπική απόκληση που έχει κάθε τιμή από τη μέση τιμή Δεν έχω τη μέση τιμή, αντικαθιστώ το μέσο όρο και επειδή έχω μια περισσότερη ανακρίβεια για το πόσο είναι η διασπορά Θα αυξηθεί λίγο και διαιρώμε 1-1 αφού μπαίνει στον παρονομαστή, αυξάνεται λίγο παραπάνω Τώρα αν θέλουμε να το πούμε λίγο διαφορετικά, αυτό το 1-1 εκφράζει τους λεγόμενους βαθμούς ελευθερίας Και δεν ακούσε αυτή τη λέξη ποτέ, τον όρο, βαθμή ελευθερίας Είναι οι ελεύθερες τιμές που μπορώ να έχω στο πρόβλημά μου, που δεν τις καθορίζω, είναι ελεύθερες, μπορεί να είναι ό,τι να είναι Όταν εγώ έχω ένα δείγμα 1 παρατηρήσεων, ας πούμε ότι παίρνω ένα δείγμα 30 παρατηρήσεων, έχω 30 ελεύθερες τιμές Αν είστε εδώ 30 άτομα και εγώ είμαι έξω από την πόρτα, λέω τι έχω μέσα εδώ, 60 φυδητές, τι με ενδιαφέρει το ύψος 60 είπα, 30 ήθελα να πω, 30 φυδητές, άρα έχω 30 διαφορετικά ύψη των φυδητών, είναι ελεύθερες τιμές που μπορεί να πάρουν Αν όμως πω ότι μέσα στην τάξη εδώ είναι 30 φυδητές και ο μέσος όρος τους, ο μέσος όρος αυτός εδώ των υψών είναι 1.70, είναι 30 ελεύθερες τιμές τώρα Έχω λοιπόν τις παρατηρήσεις μου, εδώ έχω το δείγμα, τα γράφω για να σας αφήσω λίγο χρόνο να το σκεφτείτε Με τις παρατηρήσεις x1, x2, xn και υπολογίζω το στατιστικό που είναι ο μέσος όρος, που δίνεται από αυτόν το γνωστό τίποτα, άθρησμα των παρατηρήσεων για το πλήθος Και αν λέω ότι έχω τέτοιες 30, το 1 είναι 30 εδώ, έχω 30 τιμές και λέω ότι οι 30 τιμές αυτές τώρα, δεν ξέρω, εγώ είμαι έξω από την πόρτα, δεν ξέρω ποια είναι τα 30 ύψη που έχετε εδώ πέρα Αλλά μου σφυράει κάποιος και λέει πήγα και τα μέτρησα και ο μέσος όρος τους είναι 1.70, θα είναι 30 οι ελεύθερες τιμές πλέον, Γιώργο τι λες Τουλάχιστον μια δεν θα είναι ελεύθερη, γιατί άμα πάω και μετρήσω έναν έναν και φτάσω στον 29, αφού ξέρω ότι ο μέσος όρος είναι 1.70, δεν θα ξέρω ποιος είναι το ύψος στην 30η παρατήρηση, βγαίνει από τα άλλα Ακριβώς το ότι έχω μια εξίσωση εδώ, μου δεσμεύει μία ελεύθερη τιμή, κάθε εξίσωση δεσμεύει μία τιμή Για αυτόν τον λόγο λοιπόν δεν έχω, επειδή την έχω βάλει αυτήν εδώ πέρα, την έχω χρησιμοποιήσει αυτήν τη συνθήκη εδώ πέρα μέσα στην εξίσωσή μου εδώ μέσα στον τύπο, πλέον δεν έχω 1 ελεύθερες τιμές και έχω 1-1 Και γι' αυτό διαιρούμε με 1-1, που σημαίνει δηλαδή ότι στις 3ης ηλικίου το βιβλίο, εάν εδώ δεν έβαζε το μέσο όρο αλλά έβαζε το μη, σωστά θα διαιρούσε με 1 Αν όμως αντικαταστήσουμε το μη που είναι στον πληθυσμό με το μέσο όρο, τότε θα βάλουμε το 1-1 Άρα λοιπόν για να πάμε σιγά σιγά και στο πρόβλημα που θα δούμε και στη συνέχεια του μαθήματος Από τη μία μεριά έχω τον πληθυσμό, αυτός είναι ο πληθυσμός για μία τυχαία μεταβλητή χη, η οποία έχει κάποια κατανομή, δεν ξέρω αν φαίνεται, φαίνεται από κει? Έχει κάποια κατανομή χ, αλλά δεν την γνωρίζω την κατανομή και πάω σε κάποια παράμετρο που μπορεί να είναι η μέση τιμή, η διασπορά ή η τυπική απόκληση Εάν λοιπόν γνώριζα την παράμετρο αυτή που είναι η μέση τιμή στον πληθυσμό, δηλαδή το μέσο ύψος όλων των φοιτητών, τότε θα το έβαζα αυτό εδώ πέρα και θα διαιρούσα με 1 Επειδή δεν το γνωρίζω όμως πάω και το προσδιορίζω, δηλαδή θεωρώ ότι αυτό το χ με την παρά μου προσδιορίζει το μη, το αντικαθιστώ λοιπόν και επειδή έχω κάνει αυτή την αντικατάσταση έχω χάσει ένα βαθμό ελευθερίας, γι' αυτό διαιρούμε 1-1 Και έτσι με αυτόν τον τρόπο υποστηρίζω ότι το s τετράγωνο, για να το συνεχίσω λίγο ακόμα, ότι το s τετράγωνο που το υπολογίζω με τον τύπο το συγκεκριμένο που διαιρώ με 1-1, με αυτόν εδώ τον τύπο, ότι μου προσδιορίζει καλά το σίγμα τετράγωνο Κάποιος βέβαια θα μπορούσε να πει και γιατί δεν παίρνεις αυτόν εδώ τον τύπο και τι έγινε τώρα με τους βαθμούς ελευθερίας, κάθεσαι και μου λες με βαθμούς ελευθερίας για να με ξεγελάσεις Εντάξει ας είναι 1-1 η βαθμή ελευθερίας, εγώ πάλι θα διαιρέσω με το 1 και θα πάρω το s κυματάκι τετράγωνο, γιατί να μην είναι αυτό το πιο κατάλληλο χαρακτηριστικό, το πιο κατάλληλο στατιστικό όπως το λέμε για να μου προσδιορίσει το σίγμα τετράγωνο Αυτό θα το δούμε στη συνέχεια λοιπόν, γιατί να πάρω αυτό και όχι αυτό εδώ πέρα. Μιλήσαμε και για το σίγμα τετράγωνο και τελικά μέτρησα τα ύψη από τους 30 εσάς εδώ πέρα και βρήκα ότι αυτό το s τετράγωνο η διγματική διασπορά είναι 25 τετραγωνικά εκατοστά Σωστό. Ναι. Το s τετράγωνο εγώ πήγα και μέτρησα, δεν μίλησα για ρίζα και λέω βρήκα 25 τετραγωνικά εκατοστά. Είναι σωστό σαν αποτέλεσμα, μπορεί να είναι σωστό. Σωστό έτσι. Αφού αν μετράω σε εκατοστά εδώ πέρα τα ύψη, αυτό που θα πάρω αφού είναι στο τετράγωνο θα είναι 25 τετραγωνικά εκατοστά. Έχει κάποιο φυσικό νόημα να πεις η διασπορά του ύψη είναι 25 τετραγωνικά εκατοστά. Αν κάνω όμως την τετραγωνική ρίζα, τι θα πάρω 5 εκατοστά, αυτό έχει νόημα. Η τετραγωνική ρίζα τι είναι ακριβώς είναι η τυπική απόκλυση. Η διγματική τυπική απόκλυση που είπε ο Φίλιππος. Κοιμηθείσαι λίγο Φίλιππος. Έτοιμος είσαι. Η διγματική τυπική απόκλυση λοιπόν. Το φυσικό μέγεθος που μας ενδιαφέρει για να μετρήσουμε τη μεταβλητότητα δεν είναι η διασπορά, δεν έχει κάποιο φυσικό νόημα διασπορά. Απλά για να φτάσουμε στην τυπική απόκλυση, το S, πάμε μέσω της διασποράς. Δηλαδή αυτό που με ενδιαφέρει εμένα τελικά είναι αυτό το S εδώ, το οποίο είναι η τετραγωνική ρίζα του S τετράγωνο. Αυτό με ενδιαφέρει να βρω για να προσδιορίσω το σίγμα, την τυπική απόκλυση στον πληθυσμό. Αυτά όμως είναι λίγο πολύ γνωστά πράγματα που τα είχατε κάνει από την τρίτη ηλικίου. Εδώ πέρα υπάρχει ένα θέμα νούμερο 4 που είναι γι' αυτό που λέγαμε για την απόλυτη τιμή. Υπάρχει ένα τέτοιο στατιστικό που λέγεται στα αγγλικά median absolute deviation, διάμεσης απόλυτης απόκλυσης. Και μπορεί κάποιος να μας παρουσιάσει αυτό το μέτρο, να μας μιλήσει γιατί ιδιότητες έχει αυτό το μέτρο και να μας δώσει και ένα παράδειγμα. Αυτό που λέγαμε για τις θεματικές εργασίες. Θυμάστε αυτά, Άννα, μην τα ξαναλέω. Εντάξει. Η διαδικασία να σας θυμίσω γιατί κάποιος ρώτησε είναι ότι ο πρώτος που στέλνει email για να ζητήσει ένα θέμα το κατοχυρώνει. Θυμηθείτε όμως να γράφετε στο email από ποιο τμήμα είστε. Γιατί κάνουμε και σε άλλα τμήματα το ίδιο μάθημα για να μην υπάρχει σύγχυση. Και επειδή για κάποιο λόγο δεν χρησιμοποιείτε το email του πανεπιστημίου, δεν ξέρω ότι σας έχει πιάσει όλους, όλοι έχουν Yahoo, Gmail, μπλα μπλα, eeauth.gr δεν βλέπω κανένα έχει. Το χρησιμοποιείτε βέβαια καθόλου. Λοιπόν αυτά για τα θέματα και πάμε τώρα σε κάτι καινούριο που δεν το έχετε ξανακούσει. Αυτά είναι τα εκατοστιαία σημεία. Βέβαια αυτό δεν είναι για τίποτα τόσο καινούριο και ριζοσπαστικό. Τι λέει αν είχα 100 παρατηρήσεις το δείγμα μου και τις αράδιαζα σε μια αύξησα σειρά η κάθε μία παρατήρηση θα αντιστοιχούσε στο εκατοστιαίο σημείο. Δηλαδή η 10η παρατήρηση θα ήταν το 10ο εκατοστιαίο σημείο και τα λοιπά. Η 50η παρατήρηση θα ήτανε η διάμεσος. Αυτά που με ενδιαφέρουν τώρα είναι αυτά τα δύο σημεία. Το πρώτο και τεταρτομόριο που είναι το 25% το παρατηρήσεις το 25ο εκατοστιαίο σημείο και το τρίτο. Πώς θα τα βρω αυτά τώρα και θα δούμε γιατί τα χρησιμοποιούμε. Πώς μπορώ να τα υπολογίσω αυτά. Τη διάμεσο θυμάστε πως την υπολογίζουμε. Αν είναι άρτιο το πλήθος. Τι γίνεται. Έχω δύο κεντρικά σημεία. Αν έχω 10 παρατηρήσεις τις βάζω σε αύξησα σειρά. Η διάμεσο είναι το ημιάθρισμα 5η και 6ης. Αν έχω 11 παρατηρήσεις πάει στην 6η κατευθείαν. Έχοντας αυτό σαν μπούσουλα μπορείτε να μου υποδείξετε πως θα ή να με βοηθήσετε πως θα υπολογίσω το Q1. Το πρώτο τεταρτομόριο. Όχι διάμεσος όχι το μεσαίο αλλά το ενός τετάρτου δηλαδή. Έλα Βασιλή. Ακριβώς. Δηλαδή να εφαρμόσω πάλι τον ίδιο κανόνα της διαμέσου αλλά στο μισό. Δηλαδή η ιδέα είναι το μισό του μισού ότι είναι το τέταρτο. Αυτός είναι και ο πιο απλός κανόνας και τον οποίο έχω υιοθετήσει εδώ και σημειώσεις. Σε άλλα βιβλία μπορεί να χρησιμοποιούν και κάτι λίγο πιο σύνθετο όπως το ίδιο κάνει και το SPSS που θα κάνουμε αργότερα. Αλλά νομίζω ότι για σας είναι πιο εύκολο να χρησιμοποιήσετε αυτόν τον κανόνα που λέει ακριβώς ότι εάν έχω άρτιο πλήθος παρατηρήσεων όπως εδώ τότε όπως είπαμε έχω δύο κεντρικές τιμές και παίρνω το ημιάθρησμά τους για να βρω τη διάμεσο τότε η μικρότερη παρατήρηση και η αριστερή κεντρική τιμή μου σχηματίζουν ένα νέο δείγμα που είναι αυτό το μισό που λέγαμε. Αντίστοιχα η δεξιά κεντρική τιμή και η μέγιστη παρατήρηση μου σχηματίζουν το δεύτερο δείγμα και πάω και βρίσκω τη διάμεσο στο πρώτο έχω το Q1, τη διάμεσο στο δεύτερο έχω το Q3. Αν τώρα το πλήθος το παρατηρήσεων είναι περιττό τότε έχω μία κεντρική τιμή και άρα τα δύο δείγματα τα μισά δηλαδή σχηματίζονται με την ελάχιστη τιμή και τη μεσαία και με τη μεσαία και τη μέγιστη τιμή. Κατανοητό δεν είναι. Άρα κάνεις δύο φορές τη μέθοδο της διαμέσου για να βρεις το Q1 και το Q3. Τώρα τι θα κάνουμε αυτά αν τα πάρουμε αυτά τα δύο τώρα και κοιτάξουμε την απόστασή τους που έχει το Q1 και το Q3 δηλαδή πάρουμε αυτή τη διαφορά. Αυτό έχει ένα πολύ πλοκό όνομα που λέγεται ενδοτεταρτομωριακό εύρος. Αλλά τι χαρακτηριστικό έχει αυτό. Αυτό το διάστημα από το Q1 στο Q3 τι περιέχει μέσα. 50% των κεντρικών παρατηρήσεων. Έχω διώξει το 25% των μικρότερων έχω διώξει το 25% των μεγαλύτερων και έχω κρατήσει το 50% των κεντρικών παρατηρήσεων. Άρα είναι ένα διάστημα που μου δείχνει τη μεταβλητότητα αλλά έχει το καλό ότι δεν επηρεάζεται από εκείνες τις ακραίες τιμές που λέγαμε. Γιατί το 25% των μικρότερων και των μεγαλύτερων το έχει βγάλει απέξω. Γι' αυτό λοιπόν το χρησιμοποιούμε και αυτό πλέον μπορούμε να το χρησιμοποιήσουμε είτε έχουμε απόμακρες τιμές είτε έχουμε λοξή κατανομή και τα λοιπά. Και έχοντας ορίσει λοιπόν τα Q1 και τα Q3 έχουμε τώρα χωρίσει, μπορούμε να χωρίσουμε μάλλον το δείγμα μας σε τέταρτα. Γι' αυτό χρειάζομαι πέντε αριθμούς. Ποιοι είναι οι πέντε αριθμοί. Η μικρότερη και η μεγαλύτερη παρατήριστο δείγμα, το Q1 και το Q3 που λέγαμε πριν και η διάμεσος και μας χωρίζει σε τέταρτα με τις πέντε τιμές αυτές. Και τώρα κάνω και ένα σχήμα που το λέω θυκόγραμμα, φτιάχνω μια θήκη, ένα κουτί από το Q1 στο Q3, γραμμούλες για το 25% των μικρότερων και των μεγαλύτερων παρατηρήσεων και μια γραμμούλα μέσα στο κουτί που μου δίνει τη διάμεσο. Δεν το έχετε ξαναδει αυτό, έτσι δεν είναι. Τώρα γιατί το κάνουμε λέτε. Τι μπορούμε να δούμε από ένα τέτοιο θηκόγραμμα με το να σπάμε σε τέταρτα. Για σκεφτείτε λίγο. Εγώ γιατί είχα κάνει το ιστόγραμμα, θυμάστε το ιστόγραμμα εκείνο που πήγαιναμε και σπάγαμε σε κατηγορίες, σε κλάσεις, βλέπαμε πόσες παρατηρήσεις έχουμε σε κάθε κλάση, βάζαμε τις ραύδους και τις ενώναμε και λέγαμε να δούμε. Για πες. Για να δούμε αν είναι την κατανομή. Τι κατανομή είναι. Και θυμάστε μια κατανομή που μας ενδιαφέρει είναι η καμπανούλα, η κανονική. Πώς μπορούμε να πούμε αν είναι μια κατανομή κανονική με βάση τώρα το θηκόγραμμα. Αν δηλαδή τα δεδομένα μας ήταν από κανονική κατανομή τι θα περιμέναμε. Για αυτές τις δύο γραμμές ας πούμε. Το όνομά σου. Κωνσταντίνε. Να έχουμε σχεδόν το ίδιο μήκο. Το ίδιο μήκο σχετικά να έχουν έτσι. Και άλλο τίποτα αυτή η γραμμούλα που να βρίσκεται. Στο κέντρο του κουτιού. Στο κέντρο του κουτιού. Τώρα έρχεται ο στατιστικός που είναι και λίγο διπλωμάτης. Και λέει εγώ δεν θέλω να δείξω ότι είναι κανονική κατανομή αλλά αυτό που θέλω είναι να δεχτώ ότι είναι κανονική κατανομή. Καταλαβαίνετε τη διαφορά του να δείξω κάτι και να δεχτώ κάτι. Να δεχτώ σημαίνει ότι δεν έχω κάποιες έντονες ενδείξεις που να μου το απαγορεύουνε να το δεχτώ ότι είναι κανονική κατανομή. Εδώ πέφτει διπλωματία τώρα. Και λέει οι συνθήκες για να αποδεχτώ τώρα ότι είναι κανονική κατανομή είναι όχι να πω ότι η γραμμούλα αυτή είναι στη μέση αλλά να πω ότι δεν είναι κοντά στο Q1 και στο Q3. Δηλαδή διάμεσως δεν είναι κοντά στα δύο άκρα. Το κοντά βέβαια θα το βάλουμε σε εισαγωγικά γιατί δεν έχουμε κάποιο μέτρο, κάποια κλίμακα για να πούμε τι είναι κοντά και μακριά και για τις γραμμούλες που λέγαμε όχι ότι είναι ίσες αλλά δεν διαφέρουν σημαντικά. Βλέπετε τη διπλωματικά που το γράφουμε. Δεν διαφέρουν σημαντικά. Και τι σημαίνει αυτό δηλαδή πότε θα πω ότι διαφέρουν σημαντικά ή δεν διαφέρουν ή ότι είναι κοντά στο Q1 και στο Q3. Και το τελευταίο να μην υπάρχουν ακριές τιμές με την έννοια ότι να μην υπάρχουν πολύ μακριές ουρές εδώ πέρα για μας. Τώρα το κοντά και το μακριά ή το να διαφέρουν και να μην διαφέρουν είναι σχετικά. Ο κανόνας εδώ είναι ότι όσο μικρότερο είναι το δείγμα τόσο πιο ελαστικοί είμαστε για να αποδεχτούμε την κανονική κατανομή. Ενώ όσο μεγαλύτερο είναι το δείγμα όσο μεγαλώνει το δείγμα τόσο πιο αυστηροί είμαστε για να το δεχτούμε. Και θα το δούμε και αυτό στη συνέχεια και μέσα από ένα παράδειγμα. Λοιπόν, το παράδειγμα αυτό μας λέει ότι δίνεται η περιεκτικότητα σε ραδιενέργεια. Έχετε καμιά ερώτηση? Όχι, έτσι? Ας δούμε λίγο επαναληπτικά ότι κάναμε σε αυτό το πρώτο κεφάλαιο για την περιγραφική στατιστική μέσα από αυτό το παράδειγμα. Λοιπόν, δίνεται η περιεκτικότητα σε ραδιενέργεια του Χάλιβα σε δέκα δοκίμια από ένα εργοστάσιο. Τι μας λέει αυτό εδώ πέρα? Ας αγγητάξουμε πρώτα τα εδομένα μόνο από το πρώτο εργοστάσιο. Έχουμε και από ένα δεύτερο εργοστάσιο εδώ πέρα. Έχουμε δέκα τιμές. Περιεκτικότητα σε ραδιενέργεια του Χάλιβα. Δηλαδή πήραμε δέκα κομμάτια από τον Χάλιβα που χρησιμοποιεί το εργοστάσιο και μετρήσαμε με κάποιο όργανο την περιεκτικότητα σε ραδιενέργεια όπου αυτά εδώ πέρα είναι νομίζω σε ποσοστά. Και τώρα θέλουμε να δούμε πως είναι η περιεκτικότητα σε ραδιενέργεια. Μπορείτε από εδώ να μου δώσετε μία τιμή για αυτό εδώ, για το μέσο όρο. Πόσο είναι ο μέσος όρος στο πρώτο δείγμα, στο α για την περιεκτικότητα σε ραδιενέργεια. Δεν χρειάζεται μολύβι. Αφού μου δίνει εδώ το σύνολο είναι 10,0,72. Η διάμεσος, τι πρέπει να κάνουμε, να δούμε αν είναι σε αύξησα σειρά, να τα βάλουμε. Εδώ τυχαίνει να είναι σε αύξησα σειρά, άρα πέμπτη και έκτη, ημιάδρισμα 0,57. Μπορεί να είναι από κανονική κατανομή. Αν ήταν από κανονική κατανομή, πού θα έπρεπε να βρίσκεται η διγματική διάμεσος και η διγματική μέση τιμή. Θα πρέπει να ήτανε κοντά. Εδώ πέρα έχουμε μεγάλες διαφορές, άρα έχουμε κάποια αμφιβολία. Από πού λέτε να οφείλετε αυτό το διαφορά. Φαίνεται από αυτό εδώ, ότι έχουμε μια ακραία τιμή. Οπότε, αν προχωρήσουμε να βρούμε και το εύρος, πάμε να περιγράψουμε τώρα τα δεδομένα μέσα από κάποια στατιστικά που μάθαμε. Τελείωσα με το κέντρο. Εδώ μου δίνει ένα κέντρο που είναι πολύ μεγάλο, στο 0,7, εδώ μου το κάνει πιο μικρό, πιο χαμηλά. Το εύρος εδώ είναι τεράστιο, είναι 1,70. Δηλαδή, παίζουν σε 1 εύρος, 1,70, οι τιμές που είναι πάρα πολύ μεγάλο. Πάω να υπολογίσω και τη διασπορά. Παίρνω τον τύπο που λέγαμε αυτόν εδώ, όπου χρησιμοποιώ το άθρησμα των τετραγώνων του x, άρα κάνω αυτή την πράξη πρώτα, το βάζω εδώ μέσα, έχω το μέσο όρο από το προηγούμενο υπολογισμό, τον αντικαθιστώ και βρίσκω 0,243 ποσοστά στο τετράγωνο, το οποίο δεν έχει καμιά σημασία, γι' αυτό παίρνω τετραγωνική ρίζα και μου βγάζει 0,5. Μου λέει δηλαδή, η τυπική αποκλεισή, μια τυπική τιμή, αν πάρω από το δείγμα, θα παίζει simply 0,5 από το 0,72. Μα, άμα κοιτάξουμε τα εδομένα, οι τιμές δεν είναι έτσι. Δεν παίζουν simply 0,5, μια τυπική τιμή εδώ πέρα γύρω από το 0,72, οι περισσότερες είναι μικρότερες από το 0,72 και σε πολύ μικρά διαστήματα εδώ πέρα, απλά έχουμε αυτή τη μεγάλη τιμή. Να προχωρήσουμε λοιπόν και στον υπολογισμό του θηκογράμματος των πέντε αριθμών. Τους τρεις αριθμούς τους έχω ήδη, η μικρότερη 0,40, η διάμεσος και η μεγαλύτερη. Επειδή είναι 10 οι παρατηρήσεις έχω δύο κεντρικές τιμές, από την πρώτη, τη μικρότερη μέχρι την αριστερή έχω αυτές τις πέντε τιμές, άρα η διάμεσος είναι η τρίτη και αντίστοιχα έχω άλλες πέντε τιμές. Πώς σας φαίνονται αυτά, απλά δεν είναι. Λοιπόν εσείς που παρακολουθείτε εδώ πέρα μην μου κάνετε τίποτα, σε εξετάσεις και δεν μου κάνετε τέτοια πράγματα. Ένα 10% πάει και το κάνει αυτό όταν οι παρατηρήσεις είναι ανακατωμένες, όπως δίνονται, δεν τις βάει σε αύξησα σειρά και βγάζει παπάδες μετά. Πρώτα λοιπόν τα βάζουμε σε αύξησα σειρά και μετά παίρνουμε τη διάμεσο, δύο κεντρικές τιμές αν είναι άρτιο το πλήθος, μία κεντρική τιμή αν είναι περιττό, δύο δείγματα μικρότερα και υπολογίζουμε πάλι τη διάμεσο για να βρούμε τα Q1 και τα Q3. Και έτσι φτάνω στο τεταρτομωριακό εύρος που είναι πολύ μικρό 0.16 και παίρνω αυτό το θηκόγραμμα. Το εύχο βάλει σε όρθια θέση όπως βλέπετε εδώ πέρα αλλά κανονικά εδώ είναι η μικρότερη τιμή το 0.40, αυτή η τιμή είναι στο Q1 που είναι το 0.51, η αρχή του κουτιού ας το πούμε έτσι και εδώ είναι το τέλος του κουτιού το Q3 που είναι 0.67. Η κόκκινη γραμμούλα είναι το 0.57 η διάμεσος και κανονικά θα έπρεπε να βάλω μια γραμμούλα που να ξεκινάει από το Q3 και να πηγαίνει μέχρι τη μέγιστη τιμή. Αυτή εδώ λοιπόν είναι η μέγιστη τιμή αλλά επειδή είναι πολύ μακριά από τις υπόλοιπες την έχει βάλει εδώ πέρα το πρόγραμμα αυτόματα με ένα στεράκι. Τώρα ας πω έτσι λίγο χωρίς να είναι αναγκαίο να τα θυμάστε αυτά ότι ο τρόπος που πάει και ξεχωρίζει μία τιμή τα προγράμματα αυτό είναι από το MATLAB το ίδιο κάνει και το SPSS είναι να υπολογίζει αυτή την απόσταση και αν είναι μεγαλύτερη από μιάμιση φορές από το ύψος του κουτιού τότε βάζει κυκλάκι. Θεωρεί υποπτοί ακραία τιμή ή απόμακρη τιμή. Αν είναι πάνω από τρεις φορές η απόσταση όπως εδώ βάζει αστεράκι που λέει ότι σίγουρα είναι απόμακρη τιμή. Και γιατί σταματάει η γραμμούλα εδώ. Δεύτερη μεγαλύτερη τιμή. Στην αμέσως προηγούμενη από τη μέγιστη που έβαλε. Και έτσι λοιπόν φτιάχνει το θηκόγραμμα. Αν έχουμε τέτοιες απόμακρες τιμές αυτή είναι μια ένδειξη ότι πάλι δεν μπορεί να είναι από κανονική κατανομή και να έχουμε τέτοιες μακρινές τιμές. Θα έβαζε και ένα άλλο εδώ και θα πήγαινε στην τρίτη από το τέλος και ούτω καθεξής. Τώρα συνεχίζει η άσκηση και λέει έστω ότι η ακραία τιμή που βρήκαμε το 2.10 οφείλεται σε σφάλμα μέτρησης. Δεν είναι πραγματική. Εδώ θέλει λίγο συζήτηση γιατί παλιότερα είχα βάλει στις εξετάσεις ένα τέτοιο πρόβλημα στο οποίο υπήρχαν δεδομένα από μία τιμή ξέφευγε πολύ. Και κάποια παιδιά πήγανε και λένε εντάξει τις σβήσανε. Πετάμε έξω αυτήν. Και πήραν τις υπόλοιπες και κάνανε τους υπολογισμούς στις τιμές εκτός από αυτή τη μία ακραία τιμή. Το οποίο φυσικά δεν είναι σωστό όταν δεν μας υποδεικνύει κάποιο λόγο να το κάνουμε. Και μετά μου λέγανε ότι το έκανα κι εγώ στις σημειώσεις. Στις σημειώσεις όμως έγραψα ότι έστω ότι οφείλεται σε σφάλμα μέτρησης. Και προχωράω και λέω ότι την βγάζω και τα λοιπά για να προχωρήσω την άσκηση. Που σημαίνει δηλαδή αν έχουμε κάποιο λόγο να πιστεύουμε ότι είναι σφαλμένη η τιμή, γιατί για παράδειγμα εδώ πέρα ενώ μετρούσαμε εμείς την περιεκτικότητα σε ραδιοενέργεια μπορεί να άλλαξε λίγο οι τάσεις στο ρεύμα και ξαφνικά η βελώνα του οργάνου να έκανε ένα έτσι και να πήγε σε μια μεγάλη τιμή το 2.10. Ή να πήγα να γράψω εγώ τα νούμερα και όπως τα έγραφα στο εξέλ ας πούμε ή οπουδήποτε τα έγραφα, αντί να γράψω 0,21 έγραψα 2,1. Αν δω δηλαδή ότι υπάρχει κάποιος λόγος, κάποιος να είναι σφαλμένη τότε την απαλήφω, όχι επειδή δεν μου αρέσει. Δεν κάνουμε Greek statistics δηλαδή όπως θα εννοούσανε, ό,τι δεν μας αρέσει το σημαζεύουμε όπως θέλουμε. Ξανακάνουμε τους υπολογισμούς λοιπόν τώρα με τις εννέα παρατηρήσεις και βλέπουμε ότι τα πράγματα γίνονται πιο ομαλά, δηλαδή η διγματική μέση τιμή και η διγματική διάμεσος πλέον είναι πολύ κοντά, η τυπική απόκλειση από 0,5 που ήταν περίπου πήγε στο 0,10 κι άρα γίνανε ωραία τα πράγματα και τώρα η εμπειρία σας τη λέει εδώ, μπορούμε να δεχτούμε κανονική κατανομή. Θυμηθείτε που λέγαμε ότι όσο πιο μικρό είναι το δίγμα τόσο πιο ελαστική είμαστε. Άρα εδώ έχουμε εννέα παρατηρήσεις, μάλιστα αυτές οι δύο γραμμές είναι ιδανικά κοντά, είναι σχεδόν, ή μπορεί να είναι ακριβώς και στο ίδιο μήκος. Η κόκκινη γραμμούλα είναι λίγο πιο κάτω από το κέντρο αλλά αυτό δεν μας επηρεάζει. Άρα εδώ μπορούμε να δεχτούμε ότι είναι κανονική κατανομή και αν πάρουμε τώρα και από το δεύτερο εργοστάσιο που έχουμε άλλες οχτώ παρατηρήσεις, ξανακάνουμε τους υπολογισμούς εδώ πέρα, να μη σας τα δείξω ένα-ένα και φτιάξουμε το θηκόγραμμα και για τα δύο δείγματα τώρα, αυτό ήταν το πρώτο που το είδαμε και μόνο του, εδώ είναι μαζί με το άλλο. Πάλι και στο άλλο δείγμα που έχουμε οχτώ παρατηρήσεις, εντάξει αυτή είναι λίγο πιο μεγάλη από αυτή εδώ, η διάμεσθος βέβαια είναι στο κέντρο, μπορούμε να δεχτούμε και εδώ κανονική κατανομή. Μπορούμε να πούμε κάτι για τη μεταβλητότητα, αν υπάρχει διαφορά στις δύο περιπτώσεις, στα δύο δείγματα. Τι λέτε, υπάρχει διαφορά σπρος τη μεταβλητότητα στα δύο δείγματα, κάποια δηλαδή σε κάποιο δείγμα να είναι πιο σκόρπιες οι τιμές από το άλλο. Στο δεύτερο φαίνεται να είναι έτσι, γιατί αν πάμε να μετρήσουμε τη μεταβλητότητα με το ενδοτεταρτομωριακό εύρος, με αυτό εδώ, εδώ είναι πολύ μεγαλύτερο από αυτό εδώ πέρα. Άρα μπορούμε να πούμε ότι υπάρχει. Υπάρχει διαφορά σπρος τη μέση τιμή ή γενικά σπρος την κεντρική τιμή. Μπορούμε να πούμε ότι είναι ίδια, ότι το μέσο επίπεδο τιμών είναι το ίδιο. Αυτό μπορούμε να το δούμε εδώ πέρα από τη διάμεσο, ότι εδώ είναι πιο ψηλά από εδώ πέρα. Παρ' όλα αυτά όμως, δηλαδή αυτό θα μας έλεγε ότι στο πρώτο εργοστάσιο το μέσο επίπεδο ραδιενέργειας είναι πιο υψηλό από το δεύτερο. Καλά και μπροστά στα μάτια μου, τι στις είσαι ρε. Αυτό όμως να σας δείξω εδώ πέρα ότι υπάρχει και μια ζώνη εδώ, 0.4 με 0.6 περίπου, όπου υπάρχουν επικάλυψη. Άρα, μια πρώτη εντύπωση που παίρνουμε κοιτώντας τα εδομένα, και αυτό κάναμε στο πρώτο κεφάλαιο, όλα αυτά που κάνουμε είναι για να πάρουμε μια πρώτη εντύπωση του τι συμβαίνει, είναι ότι στο δεύτερο εργοστάσιο φαίνεται το δείγμα να μας λέει ότι είναι καλύτερος ο χάλιβας, δηλαδή έχει μικρότερη περιεκτικότητα σε ραδιενέργεια. Αν όμως εγώ θέλω να γράψω μια στατιστική αναφορά και να πω από ποιο από τα δύο εργοστάσια να πάω να αγοράσω χάλιβα ή αν υπάρχει διαφορά ως προς την περιεκτικότητα σε ραδιενέργεια μεταξύ των δύο εργοστασίων, δηλαδή θέλω να αναφερθώ στις μέσες τιμές, στον πληθυσμό, σε όλο το χάλιβα που παράγει, τότε δεν μπορώ να απαντήσω με βάση αυτό. Γιατί αυτό δεν μου λέει τίποτα για το τι συμβαίνει εδώ πέρα. Μου λέει μόνο τι συμβαίνει εδώ. Αυτό λοιπόν θα είναι το αντικείμενο από εδώ και πέρα, το δεύτερο κεφάλαιο και μετά, να πάμε να βγάλουμε συμπεράσματα όπως είπαμε για τον πληθυσμό. Περνάμε τώρα στο δεύτερο κεφάλαιο που λέει εκτίμηση παραμέτρων. Τώρα αρχίζουν τα πράγματα και μπαίνουν λίγο στην ουσία του μαθήματος που είναι ακριβώς να προσδιορίσουμε το τι γίνεται εδώ πέρα στον πληθυσμό. Όπως ίσως θυμάστε από το προηγούμενο μάθημα, μας ενδιαφέρει από το δείγμα που έχουμε και τις παρατηρήσεις να βγάλουμε συμπεράσματα για τον πληθυσμό. Αν πάρουμε εκείνο το χαζό παράδειγμα με το ύψος των φοιτητών, παίρνω εγώ ένα δείγμα από κάποιους φοιτητές και θέλω να προσδιορίσω το ύψος όλων των φοιτητών. Έχετε στο μυαλό της δημοσκοπής που κάνουν το ίδιο πράγμα, παίρνουν ένα δείγμα από κάποια άτομα, χίλια άτομα και θέλουν να προσδιορίσουν την πρόθεση ψήφου, δηλαδή τι θα ψηφίσει κάποιος στις εκλογές. Η τυχαία μεταβλητή, για μας μια συνεχή τυχαία μεταβλητή, το ύψος των φοιτητών, έχει κάποια κατανομή. Μπορώ εγώ να προσδιορίσω όλη την κατανομή, τι είναι η κατανομή. Με ποια πυκνότητα, μπορώ να το πω και καταχρεστικά πιθανότητα, καταχρεστικά γιατί, γιατί η πιθανότητα για κάποια τιμή του χει δεν ορίζεται όταν είναι συνεχής, μπορώ να μιλάω όμως για κάποια τιμή, όχι τιμή, αλλά ένα διάστημα γύρω από κάποια τιμή. Άρα, ας μου επιτρέψει να λέω πιθανότητα, καταχρεστικά όπως είπαμε, η κατανομή λοιπόν μου λέει με ποια πιθανότητα παίρνει χείτη στις διάφορες τιμές της. Με ποια πιθανότητα μπορεί να έχω ένα ύψος 1,65, γιατί 1,65 και 5, χιλιοστά 1,70, 1,70, 1 και τα λοιπά. Όλο αυτό εδώ πέρα. Εάν πάρω εγώ λοιπόν 30 τιμές, μπορώ να πάω να προσδιορίσω αυτή την κατανομή. Αδύνατον, δεν μπορώ να προσδιορίσω. Αυτό είναι το θεμητό, αλλά δεν μπορώ να το κάνω γιατί η πληροφορία που έχω είναι πολύ λίγη, είναι μόνο κάποιες παρατηρήσεις. Για αυτό λοιπόν λέω ότι δεν έχω καμιά ελπίδα να βρω την κατανομή ολόκληρη, να δω δηλαδή με ποια πιθανότητα παίρνει όλες τις τιμές. Πάω λοιπόν και επικεντρώνομαι σε κάποια χαρακτηριστικά της κατανομής, τα οποία τα ονομάζουμε παραμέτρους, τα χαρακτηριστικά αυτά, που τα σημαντικά για μας είναι η μέση τιμή και η διασπορά. Γιατί είχαμε πει ότι η μέση τιμή μου λέει το κέντρο που βρίσκεται και η διασπορά μου λέει πόσο απλωμένη είναι η κατανομή. Είναι τα δύο βασικά χαρακτηριστικά. Αυτές λοιπόν τις ονομάζω παραμέτρους και της βάζω και ένα σύμβολο εδώ πέρα θ. Όπου θ είναι απλά ένα σύμβολο που συμβολίζει μια οποιαδήποτε παράμετρο. Βέβαια μπορεί να έχω και άλλες παραμέτρους ανάλογα με την κατανομή. Εάν γνωρίζω για παράδειγμα ότι η κατανομή είναι ομοιόμορφη, δηλαδή ομοιόμορφη τι σημαίνει να έχω μια κατανομή η οποία να είναι, να δίνεται δηλαδή από δύο άκρα διαστήματος α, β και όπου η πυκνότητα είναι σταθερή μέσα στο διάστημα μη μηδενική και έξω από το διάστημα μηδενική. Σε αυτή την περίπτωση, οι παράμετροι που έχω να εκτιμήσω, που θα ήθελα να γνωρίζω είναι τα α και β. Γιατί αν γνωρίζω τα α και β για την ομοιόμορφη κατανομή, ξέρω τα πάντα για την κατανομή αυτή. Αν είχα μια εκθετική κατανομή, εδώ η παράμετρος που θέλω μπορεί να είναι το λ. Για την εκθετική που δείχνει τον τρόπο της κλήσης της εκθετικής κατανομής. Άρα μπορεί να έχω ανάλογα με τον τύπο της κατανομής, εάν το γνωρίζω, να έχω και διαφορετικές παραμέτρους να εκτιμήσω. Γενικά όμως υπάρχουν δύο βασικές παράμετροι που είναι η μέση, τη μήκη, η διασπορά. Το πρόβλημα λοιπόν της εκτίμησης παραμέτρων είναι να μπορέσω να εκτιμήσω αυτές τις δύο από το δείγμα μου. Αυτό λοιπόν είναι το αντικείμενο του μαθήματος τώρα. Και όταν μιλάω για την εκτίμηση, εδώ υπάρχουν δύο πράγματα. Η σημειακή εκτίμηση, τι σημαίνει αυτό. Να πάω να εκτιμήσω εγώ την παράμετρο τη μέση τιμή, ας πούμε, με έναν αριθμό από το δείγμα. Ποιος αριθμός είναι αυτός, για παράδειγμα ο μέσος όρος. Με έναν αριθμό, ή να πάω να βρω ένα διάστημα. Και να πω ότι αυτό το διάστημα, γενικά θ1, θ2, όπου θ είπαμε γενικά μιλάμε για οποιαδήποτε παράμετρο, θα μου περιέχει, αυτό το διάστημα λοιπόν θα μου περιέχει την πραγματική τιμή. Το δεύτερο έχει μεγαλύτερη αξία. Δηλαδή, αν πω εγώ ένα δείγμα από 30 άτομα και πω ότι βρήκα έναν μέσο ώρα 1.70, αυτό μου προσδιορίζει τη μέση τιμή. Αλλά, άμα σας πω απλά από 30 άτομα βρήκα έναν μέσο ώρα 1.70, μπορείτε να πείτε με πόση ακρίβεια μπορείτε να δεχτείτε ότι το μέσο ύψος των 70.000 φοιτητών είναι 1.70. Δεν μου λέει και πολλά πράγματα. Άρα, έτυχε 30 άτομα να βγαίνει ένα 1.70, μπορεί άμα πήγαινα σε άλλα 30 άτομα αυτό να έβγαινε 1.73, σε άλλα να έβγαινε 1.65 και ούτω καθεξής. Άρα, από μόνο του αυτή η σημειακή εκτίμηση δεν είναι τόσο χρήσιμη. Αν βγάλω όμως ένα διάστημα και σας πω ότι είμαι σίγουρος σε ένα επίπεδο σιγουριά, σε ένα επίπεδο πιστωσύνης 95%, ότι το διάστημα 1.68 με 1.72 μου περιέχει την πραγματική μέση τιμή, αυτό έχει κάποιο μεγαλύτερο βάρος. Γιατί λες ότι κάπου εκεί μέσα είναι. Το έχεις περιορίσει. Ενώ με το να σου δώσω μια τιμή από μόνης δεν λέει τίποτα. Το ίδιο είναι και με τα ποσοστά που ακούτε, τώρα που μας έχουν επρύξει λίγο στιλεωράσεις με δημοσκοπήσεις, που ακούμε ποσοστά 18-20%, αυτή είναι μια σημειακή εκτίμηση, αλλά από μόνης δεν μου λέει τίποτα. Αν δεν ξέρεις πόσο είναι το δείγμα για να βγάλεις στην ακρίβεια το simpleen που θα σου δώσω εκείνο το διάστημα, δεν είναι και τόσο χρήσιμο από μόνο του. Λοιπόν, εδώ τώρα ερχόμαστε σε κάτι, μια παρατήρηση που είναι πολύ βασική, είναι το πώς θα αντιμετωπίσουμε το δείγμα. Αυτές εδώ τις παρατηρήσεις x1, x2, x1 που συμβολίζουμε εδώ πέρα. Αυτό είναι λίγο δύσκολο να το καταλάβετε, θέλει λίγο προσοχή. Έχω γράψει εδώ πέρα αυτά τα δύο, ότι μπορεί να είναι παρατηρήσεις ως τιμές, αριθμή δηλαδή, που σημαίνει ότι μπήκα ακόμα στην τάξη, λέω είσαι 30 άτομα, αρχίζω και μετράω 1,1 το ύψος και έχω 30 αριθμούς. Αυτή είναι μια περίπτωση όπου έχω ένα συγκεκριμένο δείγμα. Μπορώ όμως να μιλάω και γενικά για ένα δείγμα, είμαι έξω από την πόρτα, δεν έχω μπει μέσα να σας μετρήσω, και λέω εδώ μέσα είναι 30 άτομα, έχω ένα δείγμα 30 παρατηρήσεων. Σε αυτή την περίπτωση, η κάθε μία παρατήρηση, δηλαδή ο πρώτος που κάθεται στο θρανείο, που δεν ξέρω εγώ από πριν ότι είναι ο Γιώργος, φοράει και κίτρινη μπλούζα, δεν ξέρω τι ύψος θα έχει, άρα η κάθε παρατήρηση εδώ πέρα δεν είναι τίποτα άλλο παρά μία τυχαία μεταβλητή όπως και η Χ. Αυτά λοιπόν τα Χ1, Χ2, Χ1 στο δείγμα, όταν μιλάω γενικά για ένα δείγμα κάποιου συγκεκριμένου μεγέθους 1, είναι τυχαίες μεταβλητές όπως και η τυχαία μεταβλητή Χ. Και έχουν την ίδια κατανομή. Αυτή τη διαφοροποίηση πρέπει να κάνετε ότι δείγμα μπορεί να είναι ένα συγκεκριμένο δείγμα και να μιλάμε για αριθμούς, τις παρατηρήσεις, ή να μιλάμε για αυτές εδώ ως τυχαίες μεταβλητές. Και έχοντας πει αυτό, το θ-καπελάκι τώρα, που ας έχουμε στο μυαλό μας για να το κάνουμε έτσι πιο συγκεκριμένο, να μην το λέμε θ-καπελάκι, ας πάρουμε την περίπτωση που η παράμετρος θ είναι η μέση τιμή. Άρα, ως μία εκτίμηση της μέση τιμής, μπορώ να πάρω εγώ το μέσο όρο. Είχαμε πει πριν για αυτό το τοξάκι, που λέει ότι μπορώ να χρησιμοποιήσω αυτό για να προσδιορίσω να εκτιμήσω τη μέση τιμή. Αυτό λοιπόν, ο μέσος όρος, και εδώ είναι το πιο ίσως δύσκολο σημείο του μαθήματος, είναι τυχαία μεταβλητή. Ο μέσος όρος αυτός είναι τυχαία μεταβλητή. Εσείς μέχρι τώρα μέσο όρο σκεφτόσατε πάντα μία τιμή, να παίρνει μία τιμή. Σκεφτείτε όμως τώρα ότι αυτός ο μέσος όρος εδώ υπολογίζεται από τις παρατηρήσεις, οι οποίες είναι τυχαίες μεταβλητές, είπαμε. Γιατί, αν αλλάξω εγώ το δείγμα, αν πάω σε μία άλλη τάξη, θα υπολογίσω πάλι εκεί το μέσο όρο. Ο μέσος όρος που θα έχω απολογίσει εδώ θα έχει μία τιμή, ο μέσος όρος στην άλλη τάξη, πάλι με 30 άτομα, θα έχει μία δεύτερη τιμή. Και αν το κάνω αυτό σε διαφορετικά δείγματα των 30 ατόμων, θα παίρνω συνεχώς διαφορετικές τιμές. Άρα, μπορώ να μιλάω για μία τυχαία μεταβλητή, όπου ο πληθυσμός που αναφέρεται είναι όλα τα δείγματα των 30 παρατηρήσεων, και πηγαίνοντας από στοιχείο σε στοιχείο του πληθυσμού, αλλάζοντας το δείγμα, αλλάζει και η τιμή του. Αυτός ήταν και ο ορισμός που δώσαμε στην τυχαία μεταβλητή, ότι είναι ένα χαρακτηριστικό που αλλάζει την τιμή του από στοιχείο σε στοιχείο του πληθυσμού, καθώς αλλάζει το στοιχείο του πληθυσμού. Αυτό, λοιπόν, είναι τυχαία μεταβλητή. Και κάθε θ τακαπελάκι είναι τυχαία μεταβλητή. Τι σημαίνει αυτό? Ότι θα έχει μία κατανομή. Με κάποια μέση τιμή τη συμβολίζουμε με μη και από κάτω βάζουμε σαν δίκτη το θ τακαπελάκι και κάποια διασπορά. Και αυτά τα δύο ήδη τα έχουμε πει εδώ πέρα, ότι για τη μέση τιμή, όταν η παράμετρος δηλαδή είναι η μέση τιμή, τότε έχω ως ένα καλό υποψήφιο στατιστικό το μέσο όρο. Και όταν μιλάμε για τη διασπορά, έχω ένα καλό υποψήφιο το s τετράγωνο, αλλά έχω και ένα άλλο υποψήφιο, όπως λέγαμε, το σκηματάκι τετράγωνο, που η διαφορά αυτών των δύο είναι ότι στο ένα διαιρώμαι 1, στο άλλο διαιρώμαι 1-1. Για να το κάνω λίγο πιο σύνθετο, ας βάλω και εδώ έναν άλλο υποψήφιο, αυτόν εδώ. Αυτό εδώ, έτσι όπως το έφτιαξα, δεν μπορεί και αυτό να μου προσδιορίσει τη μέση τιμή. Τι λέτε, δεν είναι καλός υποψήφιος, θα το βάζετε έτσι χαμηλό βαθμό, δεν θα μπορούσε και αυτό εδώ να μου προσδιορίσει τη μέση τιμή. Ίσως αν η διακύμασή ήταν πολύ μικρή, τότε θα ήταν πιο ακριβές, έτσι. Αλλά γενικά όμως, πάλι το κέντρο δεν πάει να βρει και αυτό. Παίρνει την μικρότερη, την μεγαλύτερη και λέει να πάρει το ημιάθυσμα. Άρα προσπαθεί να βρει το κέντρο. Είναι ένα υποψήφιο, δεν μπορούμε να το αρνηθούμε αυτό, ίσως όχι τόσο καλό βέβαια. Αλλά τι σημαίνει καλό, δεν το έχουμε πει. Από αυτά εδώ πέρα, ποιο θα διαλέγατε, ξέρατε το S τετράγωνο ή το σχηματάκι τετράγωνο. Ποιο είναι πιο καλό πάλι, σε εισαγωγικά. Για να βρούμε ποιο είναι πιο καλό, πρέπει να βγάλουμε κάποια κριτήρια. Για παράδειγμα, αν εδώ το κριτήριο το δικό μου, για να βρω τη μέση τιμή, είναι να το βρω όσο το δυνατό πιο γρήγορα, πιο εύκολα, τότε θα διαλέγα αυτό εδώ. Γιατί υπολογίζεται πιο γρήγορα. Δεν πάει να κάνω όλες αυτές τις πράξεις εδώ πέρα. Άρα, αν το κριτήριό μου ήταν να βρω γρήγορα στα γρήγορα μια εκτίμηση για τη μέση τιμή, θα χρησιμοποιούσα αυτό εδώ. Αν όμως ήταν να είναι πιο ακριβές, μάλλον αυτό δεν θα ήταν τόσο καλό, γιατί επηρεάζεται από ακρίες τιμές. Χρειάζεται λοιπόν να βάλω κάποια κριτήρια για το πότε μια εκτίμηση, ένα τέτοιο στατιστικό είναι καλό. Και μπαίνουμε τώρα στα κριτήρια. Άρα τώρα τι πάμε να κάνουμε. Είμαστε στη σημειακή εκτίμηση. Θέλω από το δείγμα λοιπόν να φτιάξω εγώ κάποια στατιστικά. Τα έχω ήδη έτοιμα από προηγούμενη γνώση που είχα, από την τρίτη ηλικίου. Λέω το μέσο όρο, έβαλα κι αυτόν από δίπλα το ημιάστισμα των ακραίων τιμών. Έχω το S τετράγωνο, έχω και το άλλο που έλεγα που διαιρούσαμε με 1. Και λέω τώρα ποιο είναι το πιο καλό. Για να τα βάλω σε μια ζυγαριά και να τα ζυγίζω, πρέπει να γνωρίσω τη ζυγαριά. Το πρώτο κριτήριο λοιπόν για να δούμε πότε έχουμε με έναν καλό εκτιμητή, έναν καλό στατιστικό, είναι η αμεροληψία. Τι λέει η αμεροληψία. Τη λέξη αμεροληψία την ξέρετε νομίζω. Γνωστός όρος. Τη χρησιμοποιούν πολύ στα δικαστήρια, εκεί με το δικαστή. Αμεροληψία, να είναι αμερόληπτος πρέπει ο δικαστής. Να μάθουν οι δικαστές να είναι αμερόληπτοι, δηλαδή να μην γέρνει η ζυγαριά. Εκείνη η ζυγαριά της δικαιοσύνης. Τι σημαίνει όμως αυτό για μας, να είναι αμερόληπτοι. Σημαίνει η μέση τιμή του εκτιμητή να πάει πάνω στην πραγματική τιμή. Πω πω, τι είναι αυτό τώρα ε. Ο εκτιμητής είναι αυτός εδώ είπαμε. Έχουμε το θ και το θ καπελάκι είναι ένα οποιοδήποτε από αυτά. Και για να το κάνουμε λίγο έτσι πιο συγκεκριμένο ας πάρω εδώ πέρα ότι έχω μία τυχαία μεταβλητή με κάποια κατανομή χ. Και εδώ κάτω έχω το μέσο όρο ας πούμε. Και αυτή έχει κάποια μέση τιμή μη. Αυτό εδώ πέρα τώρα αν σκεφτούμε ότι αναφέρεται τώρα στη μέση τιμή. Το θ καπελάκι είναι ο μέσος όρος και το θ είναι η μέση τιμή. Τι μου λέει αυτό τώρα. Ότι η μέση τιμή του μέσου όρου αυτονού εδώ θα πέφτει πάνω στην πραγματική μέση τιμή του μη. Μπλέξαμε με τις μέσες τιμές εδώ πέρα. Αυτή είναι η διγματική μέση τιμή αυτή είναι η πραγματική. Θυμηθείτε αυτό που λέγαμε ότι αυτός εδώ ο μέσος όρος είναι τυχαία μεταβλητή. Αλλάζει από δείγμα σε δείγμα. Αν πάρω εγώ λοιπόν ένα δείγμα από τον πληθυσμό τα 30 άτομα που λέγαμε πάω και υπολογίσω με εκείνον τον τύπο το μέσο όρο. Βρίσκω ότι πέφτει εδώ τη μία φορά. Αυτή η γραμμούλα λοιπόν μου λέει ποια είναι η τιμή του μέσου όρου για ένα δείγμα. Και ξανακάνω για δεύτερο δείγμα. Για τρίτο δείγμα. Για τέταρτο, πέμπτο, έκτο, έβδονο και τα λοιπά. Το κάνω για πολλά δείγματα. Και πώς καταλαβαίνουμε τώρα τι σημαίνει αυτό εδώ. Τι σημαίνει ότι η μέση τιμή του μέσου όρου θα είναι με μη. Ότι αν το κάνω για άπειρα δείγματα ο μέσος όρος των τιμών που θα βγάλω εδώ που θα πέσει πάνω στο μη. Αυτό το ε είναι ένας τελεστής όπως λέγεται. Τελεστής μέσης τιμής. Ένας τρόπος να το μεταφράσουμε αυτό είναι ότι αν είχα άπειρες τιμές αυτό θα έκφραζε το μέσο όρο αυτών των άπειρων τιμών. Με λίγα λόγια μου λέει ότι όταν έχω την αμεροληψία τότε το στατιστικό μου, η εκτίμησή μου θα μου δίνει τιμές που θα παίζουνε γύρω από την πραγματική μέση τιμή. Έτσι ώστε να είναι συμμετρικά γύρω από την πραγματική μέση τιμή έτσι ώστε η μέση τους τιμή να μου δίνει το μη. Κοταλάβαμε. Τι σημαίνει αυτό. Άρα με λίγα λόγια η έννοια της αμεροληψίας είναι η τιμή που παίρνω εγώ από το στατιστικό μου να ξέρω ότι θα βρίσκεται κάπου γύρω από την πραγματική τιμή. Δεν θα έχω αυτό που λέμε ένα συστηματικό σφάλμα. Αυτά θα τα ακούσετε αργότερα στα μαθήματα που θα κάνετε για συστηματικό σφάλμα που είναι ακριβώς αυτή η αμεροληψία του συστηματικού σφάλμα. Είναι το μπαϊας. Για να το σκεφτείτε λίγο καλύτερα ξέρετε ότι παλιά στα Luna Park υπήρχε σκοποβολή. Πήγαν με τα όπλα, κάποιο όπλο που σκοπεύαν ένα στόχο. Το συστηματικό σφάλμα ποιο ήτανε. Ότι αυτός που καθόταν εκεί στο κησέ τι είχε κάνει. Τα είχε στραβώσει λίγο τις σκάνες. Πήγαινε εσύ στο κέντρο νόμιζε ότι θα χτυπήσει στο κέντρο και πήγαιναν όλα λίγο δεξιά ας πούμε. Αυτό είναι το συστηματικό σφάλμα. Ότι η μέση τιμή από όλους τους στόχους που είχες χτυπήσει απήχε λίγο από την πραγματική τιμή. Δηλαδή είχες κάτι τέτοιο με λίγα λόγια. Είχες μια τέτοια περίπτωση. Πήγαιναν όλα λίγο αριστερά ας πούμε ή λίγο δεξιά. Σε μια τέτοια περίπτωση λοιπόν η μέση τιμή που έχεις είναι εδώ. Η πραγματική τιμή είναι αυτή εδώ. Άρα αυτό εδώ πέρα το B είναι το bias, είναι η μεροληψία. Αυτό που λέμε το συστηματικό σφάλμα που κάνεις. Βέβαια εμείς θα θέλαμε ο εκτιμητής που έχουμε να μην έχει τέτοια ιδιότητα, να μην είναι μεροληπτικός, να μην έχει τέτοιο σφάλμα. Για να ξέρουμε ότι όταν εμείς παίρνουμε από ένα δείγμα μία γραμμούλα μόνο γιατί δεν έχουμε την πολυτέλεια να έχουμε και δεύτερο και τρίτο και λοιπά. Να ξέρουμε ότι αυτή η γραμμούλα θα πέφτει κάπου κοντά στη μέση τιμή. Είτε από αριστερά είτε από δεξιά. Και κοιτάξτε τώρα ρε παιδιά ότι μπορεί να το δείξει κιόλας αυτό. Παρ' όλο που το μη δεν το ξέρω, είναι το άγνωστο μου. Μπορώ όμως να δείξω ότι ο μέσος όρος δεν τον διάλεξα έτσι τυχαία επειδή μ' άρεσε, αλλά επειδή έχει αυτή την ιδιότητα της αμεροληψίας. Ποια ιδιότητα αυτή είναι εδώ. Πώς μπορείτε να δείξετε αυτή την ιδιότητα. Πώς μπορούμε να δείξουμε μια ισότητα ότι ισχύει. Έστω ότι δεν ισχύει, είναι το ισάτοπον απαγωγή. Αυτός είναι ένας τρόπος, σωστά. Ένας άλλος τρόπος, ο απευθείας τρόπος. Ακριβώς. Αρχίζουμε λοιπόν από το ένα μέρος της ισότητας και πάμε στο δεύτερο. Και μέσα χρησιμοποιούμε ό,τι γνώση έχουμε για το πρόβλημά μας. Άρα εδώ πέρα να το κάνουμε αυτό. Τι έχουμε, ξεκινάμε από το πρώτο μέρος. Εγώ τι γνωρίζω όμως. Η έκφραση για το μέσο όρο είναι αυτή που έγραψα και εκεί πέρα. Τι βάζω μέσα. Τώρα τι έχω. Έχω τον τελεστή αυτών της μέσης τιμής που είναι γραμμικός. Που σημαίνει δηλαδή ότι ο σταθερός όρος βγαίνει απ' έξω και μπαίνει και μέσα στο άθρησμα. Άρα είμαι εδώ πέρα. Και τώρα έρχεται εκείνο που λέγαμε ότι κάθε παρατήρηση εδώ πέρα που είχα. Ότι κάθε μια από αυτές παρατηρήσοντα, δεν μιλάω για ένα συγκεκριμένο δείγμα. Δεν είναι τίποτα άλλο παρά τυχαία μεταβλητή όπως και η χ. Άρα αφού είναι τυχαία μεταβλητή όπως και η χ, θα έχει τη μέση τιμή που έχει και η χ. Δηλαδή αυτό εδώ θα είναι μη. Και έφτασα τελικά να αποδείξω ότι πραγματικά ο μέσος όρος είναι αμερόληπτος εκτιμητής της μέσης τιμής. Δεν σας αρέσουν τα θεωρητικά αποτελέσματα. Ναι, για πες. Όχι, λέμε ότι η μέση τιμή είναι γραμμικός τελεστής. Είναι από τις ιδιότητες θεωρητικά. Δεν ξέρω αν το έχατε κάνει στο πρώτο μέρος του μαθήματος όταν μιλήσατε για τη μέση τιμή και τη διασπορά. Γραμμικός τι σημαίνει, ότι άμα πάρεις ένα γραμμικό συνδυασμό και βάλεις μέσα το ε, θα σου δώσει το ε δηλαδή του αx συν βυ ψ, είναι α επί ε του χ συν βυ επί ε του ψ. Αυτό σημαίνει γραμμικός. Τώρα, η διγματική διασπορά είναι αμερόλυπτη. Δηλαδή το ε στετράγωνο. Πάλι η ίδια διαδικασία θα κάνουμε. Θα ξεκινήσουμε λοιπόν από τη μέση τιμή του ε στετράγωνο. Πράξεις, πράξεις, πράξεις και θα φτάσουμε τελικά να βρούμε το σίγμα τετράγωνο. Το ερωτηματικό σημαίνει ότι μπορείτε να το κάνετε μόνοι σας. Άρα λοιπόν φτάσαμε στο αποτέλεσμα ότι η μέση τιμή του ε στετράγωνο είναι σίγμα τετράγωνο. Δηλαδή ο ε στετράγωνο, αυτός εδώ που διαιρούσαμε με 1-1 είναι αμερόλυπτος. Να τελικά γιατί διαιρούσαμε με 1-1. Γιατί θέλαμε να το κάνουμε έτσι που να μην έχει συστηματικό σφάλμα. Να μην πηγαίνει να μας υποεκτιμάει την διασπορά. Γιατί αν διαιρούσαμε με 1, αφού το 1 είναι μεγαλύτερο από το 1-1 θα μας μίκραινε τον αριθμό, άρα θα έκανε μια υποεκτίμηση. Αν διαιρήσουμε λοιπόν με 1 και πάρουμε το ε σκηματάκι τετράγωνο, δεν μπορεί να είναι και αυτό αμερόλυπτο, θα έχει κάποιο σφάλμα, κάποια αμερολυψία και αυτό το σφάλμα μπορείτε να υπολογιστεί και να δείτε ότι είναι μίον σίγμα τετράγωνο. Δηλαδή κάνει μια υποεκτίμηση κατά αυτό εδώ το ποσό. Σίγμα τετράγωνο 2n. Εντάξει δεν χάλασε και ο κόσμος, γιατί είναι 2n. Τι σημαίνει 2n εδώ πέρα, ότι εξαρτάται το μέγεθος του δείγματος. Άρα καθώς μεγαλώνει το δείγμα, αν πάρω 10 παρατηρήσεις, εντάξει, το να έχω, να διαιρέσω με το 9 ή με το 10 έχει διαφορά. Αλλά αν έχω 100, το να διαιρέσω με το 100 με το 99 δεν θα μου δώσει τόσο διαφορά, γιατί, επειδή μπαίνει εδώ το 100 θα είναι μικρός ο αριθμός. Καθώς το 1 είναι στο άπειρο, όταν δηλαδή βλέπουμε την ασυπτωτική συμπεριφορά, η λέξη ασυπτωτικά σημαίνει όταν κάτι το αφήνουμε να φύγει προς το άπειρο, να δούμε πού πηγαίνει. Τότε μπορούμε να πούμε ότι είναι αμερόληπτη. Άρα και το έσχημα τετράγωνο να πάρετε δεν είναι και τόσο άσχημα τα πράγματα. Γιατί το 1 αυτό πάει στο άπειρο και η μεροληψία πάει στο 0. Τώρα επειδή σας βλέπω λίγο ανήσυχους, θα πρέπει να σας ρωτήσω τι σημαίνει αυτό εδώ. Για να το δουν οι πιο ανήσυχοι να δούμε αν μπορούν να πού είναι. Σε εσύ γιατί κάθεις τόσο κάτω ρε. Βολεύεις να μη σε βλέπω έτσι. Λες και να δίνεις εξετάσεις. Το όνομά σου? Αποστόλη. Αποστόλη. Μπορείς να μας βοηθήσεις λίγο να το διαβάσουμε αυτό. Για πες Αποστόλη. Όταν 1 είναι στο άπειρο, τι σημαίνει πρακτικά αυτό. Όταν παίρνω εγώ το 1 αυτό και το μεγαλώνω, δηλαδή όταν μεγαλώνει το δείγμα. Εντάξει. Μέχρι εδώ καλά. Τι συμβαίνει όταν μεγαλώνει το δείγμα. Το π καταλαβαίνεις τι είναι έτσι. Τι είναι Αποστόλη. Πιθανότητα. Μπράβο πολύ καλά. Έχουμε λοιπόν μέσα μια πιθανότητα. Τι μας λέει που πάει η πιθανότητα. Στο 1. Τι λέμε όταν η πιθανότητα είναι 1 τι έχουμε. Ένα βέβαιο γεγονός. Συμβαίνει δηλαδή σίγουρα. Τι συμβαίνει. Έχουμε αυτό εδώ πέρα το έψινο. Βέβαια δεν ξέρω τι είναι να σας βοηθήσω. Εντάξει Αποστόλη το ξέρεις τι είναι το έψινο. Μπράβο Αποστόλη. Βλέπετε τον Αποστόλη τον υποτίμησα. Ένας μικρός θετικός. Αυθαίρετα μικρός θετικός αριθμός. Που κάνετε και στα μαθηματικά της τρίτης ηλικίου. Και της δευτέρας. Άρα σημαίνει ότι όσο θέλω μπορώ να το κάνω μικρό. Αυτό. Αυτό εδώ πέρα τι είναι τώρα. Εδώ είναι τα δύσκολα Αποστόλη. Αυτή είναι η παράμετρος. Το θ καπελάκι. Η εκτίμηση που έχουμε. Έτσι. Όπως είχαμε τη μέση τιμή και το μέσο όρο. Τι μου λέει αυτό. Ότι η διαφορά αυτών των δύο. Θα είναι αυθαίρετα μικρή. Και αυτό το πράγμα θα συμβαίνει με βεβαιότητα. Καθώς αυξάνω το 1. Η ελεύθερη μετάφραση εδώ. Είναι ότι καθώς μεγαλώνει το δείγμα. Ο εκτιμητής μου το θ καπελάκι. Θα πλησιάζει στην πραγματική τιμή. Αυτό λοιπόν μου λέει αυτή η ιδιότητα. Γιατί δεν φτάνει μόνο να ξέρω. Σύμφωνα με την αμεροληψία. Ότι θα πέφτει η τιμή κάπου κοντά δεξιά αριστερά. Από την πραγματική τιμή. Αλλά και καθώς μεγαλώνει το δείγμα. Θα πέφτει όλο και πιο κοντά στην πραγματική τιμή. Αυτό μου λέει η συνέπεια. Και μπορεί να δείξει κάποιος ότι. Οι άλλοι εκτιμητές εδώ πέρα είναι συνεπείς. Ενώ αυτός εδώ δεν θα είναι. Γιατί δεν θα είναι. Γιατί επειδή καθώς μεγαλώνει το δείγμα. Μπορεί να μπει και μια ακραία τιμή μέσα. Από την ουρά της κατανομής. Ήταν από εδώ ή από εδώ. Και να την τραβήξει την τιμή αυτήν προς τα αριστερά ή προς τα δεξιά. Έτσι ώστε να μην πλησιάζει υποχρεωτικά. Προς την πραγματική τιμή καθώς μεγαλώνει το δείγμα. Και εδώ μπαίνει και ένα θέμα που λέγεται η συνέπεια και ο νόμος των μεγάλων αριθμών. Νομίζω ότι το έχετε ακούσει και από την τρίτη ηλικία αυτό, έτσι δεν είναι. Για το νόμο των μεγάλων αριθμών. Μπορεί κάποιος να μας παρουσιάσει αυτό το θέμα. Και πάμε και στην τρίτη ιδιότητα που είναι η αποτελεσματικότητα. Την οποία τη δηλώνουμε συγκριτικά. Θυμάστε που όταν εξετάζαμε ένα δείγμα. Λέγαμε να βρούμε το κέντρο του. Αλλά το δεύτερο που κοιτάξαμε να βρούμε είναι το πόσο σκόρπιο είναι. Το κέντρο μας το έδωσε η αμεροληψία. Μας λέει ότι το κέντρο του η μέση τιμή του εκτιμητή θα είναι πάνω στην πραγματική. Τώρα χρειαζόμαστε και κάτι για τη διασπορά του. Και έρχεται η αποτελεσματικότητα ως κριτήριο και σου λέει. Να πάρεις αν έχεις δύο εκτιμητές θ1 καπελάκι θ2 καπελάκι. Διάλεξε αυτόν που έχει τη μικρότερη διασπορά. Αυτό είναι να είναι πιο αποτελεσματικός λοιπόν. Αυτός που έχει τη μικρότερη διασπορά είναι ο πιο αποτελεσματικός. Άρα η αμεροληψία μου λέει για το κέντρο να πέφτει πάνω στην πραγματική τιμή. Και η αποτελεσματικότητα μου λέει να έχει μικρή αν είναι δυνατόν τη μικρότερη διασπορά. Και τέταρτο και τελευταίο είναι η επάρκεια την οποία τη λέμε με λόγια. Γιατί είναι δύσκολο να τη γράψουμε με μαθηματικούς όρους. Ότι είναι επαρκής ένας εκτιμητής όταν χρησιμοποιεί όλη την πληροφορία από το δείγμα. Δηλαδή δεν αφήνει κάποια πληροφορία απ' έξω. Όπως για παράδειγμα αυτός εδώ που δεν χρησιμοποιεί όλη την πληροφορία και παίρνει μόνο τη μικρότερη και τη μεγαλύτερη τιμή. Και έχοντας όλα αυτά τώρα, αυτά τα παραδείγματα τα είπαμε ήδη, μια παρατήρηση είναι, βέβαια μια καλή εκτιμήτρια θα πρέπει να πληρεί όλες τις ιδιότητες, αλλά συνήθως ως βέλτιστη εκτιμήτρια ή βέλτιστο εκτιμητή θεωρούμε αυτόν που έχει αμεροληψία και ελάχιστη διασπορά. Δηλαδή μένουμε σ' αυτές τις δύο ιδιότητες από τις τέσσερις. Την αμεροληψία και την ελάχιστη διασπορά. Τι σημαίνει αυτό δηλαδή ότι θέλουμε έναν εκτιμητή ο οποίος να είναι και αμερόληπτος. Τι σημαίνει αμερόληπτος όπως είπαμε. Αν έχω δύο εκτιμητές, αυτός που έχει τη μικρότερη διασπορά, αν αυτό είναι το ένα και το δύο, αυτός που έχει τη μικρότερη διασπορά είναι αυτός εδώ. Άρα αυτός ο δεύτερος είναι πιο αποτελεσματικός. Και οι δύο είναι αμερόληπτοι, γιατί είναι γύρω από τη μέση στιγμή. Εάν πάμε τώρα σε μια περίπτωση που έχω κάτι τέτοιο. Ποιο από τους δύο θα διαλέγατε, τον έναν ή τον δύο. Τον έναν, το όνομα σου. Ο Νίκος λέει τον έναν. Καμιά άλλη πρόταση όλη για τον έναν, να υποθέσω. Αυτό δεν μιλάει κανένας. Είπε κάτι ο Νίκος, κατευθείαν όλοι από πίσω, έτσι. Μη χάσετε. Όλοι θα λέγατε τον έναν, γιατί είναι Νίκο. Γιατί ο δύος είναι αμερόληπτος, δεν είναι κανό. Ναι, δεν είναι αμερόληπτος, έχει αυτό το συστηματικό σφάλμα που λέγαμε. Εκείνο που έγραψα πριν. Μας διώξετε. Μας διώξετε. Κάντε κάλεπτο. Δεν μας διώχνουν ακόμα, μη χαίρεστε. Λοιπόν, εδώ λοιπόν έχω αυτή τη μεροληψία που λέγαμε, εντάξει. Άρα ο Νίκος λέει, δεν ξέρω τι θα κάνεις, εγώ δεν θέλω μεροληψία. Ναι, αλλά ο έναν έχει και μια καλή ιδιότητα σε σχέση με το δύο. Ποια είναι η καλή ιδιότητα? Είναι πιο αποτελεσματικός, έχει μικρότερη διασπορά. Ορίστε. Ο δύος σε σχέση με τον ένα, σωστά, ο δύος σε σχέση με τον ένα. Ο κάτω σε σχέση με τον πάνω. Άρα λοιπόν, είμαστε σε μια περίπτωση όπου δεν έχουμε το ιδανικό. Έχουμε δύο υποψήφιους που έχουν και προτερήματα και ελαττώματα. Ο πρώτος έχει το προτέρημα να είναι αμερόληπτος, αλλά έχει το ελάττωμα ότι έχει μεγάλη διασπορά. Ενώ ο δεύτερος έχει το προτέρημα να έχει μικρή διασπορά, αλλά έχει το ελάττωμα να έχει κάποια αμεροληψία. Το ερώτημα λοιπόν είναι ποιον από τους δύο θα διαλέγατε. Και αν κρινώ από αυτά που μου λέτε, όλοι θα διαλέγατε το δεύτερο γιατί είναι αμερόληπτος. Σωστά. Όλοι. Ε, τι πάθαμε. Κανέας δεν θέλει να πει το δεύτερο. Λοιπόν, να σας πω ένα παράδειγμα, το είχα πει και στην άλλη τάξη. Για σκεφτείτε λίγο ένα παράδειγμα για να σας πω ότι δεν είναι πάντα έτσι ωραία τα πράγματα. Ο αδερφός μου έχει έναν τυπογραφείο και στα τυπογραφεία όπως όλα τα μαγαζιά έχουν και συναγερμούς μέσα. Που σημαίνει ότι όταν πας να μπεις μέσα θα πρέπει να πας να πατήσεις ένα κουμπί με κωδικό για να απενεργοποιήσεις το συναγερμό. Κατανοητό. Ο συναγερμός αυτός είναι ένα μηχάνημα που μέσα έχει ένα χρονοδιακόπτη. Που λέει ότι από τη στιγμή που κάποιος ανοίγει την πόρτα, μπαίνει μέσα, αρχίζει και μετράει ο χρόνος και του δίνει ας πούμε 10 δευτερόλεπτα. Μέσα στα 10 δευτερόλεπτα θα πρέπει να πάει να απενεργοποιήσει το συναγερμό γιατί αλλιώς θα ενεργοποιηθεί και θα αρχίζει να τσιρίζει. Κατανοητό όλο αυτό. Έστω λοιπόν ότι ο χρονοδιακόπτης πρέπει να χτυπήσει στα 10 δευτερόλεπτα και έχουμε δύο όργανα να μετράμε το χρόνο, ο ένας είναι τέτοιου τύπου, το ένα όργανο είναι τέτοιου τύπου και το άλλο είναι τέτοιου τύπου. Ποιο από τα δύο θα θέλατε να πάρετε εσείς να έχετε στο γραφείο σας? Το δύο θα θέλατε, δεν θέλατε το ένα. Γιατί? Γιατί κάθε μέρα πας. Αλλά έχεις κάθε μέρα μια γραμμούλα. Οποίες γραμμούλες παίζει εδώ πέρα. Κάποια στιγμή μπορεί η γραμμούλα σου να είναι αυτή. Τι σημαίνει να είναι αυτή? Ότι εκεί που περιμένεις εσύ ωραίος και καλός, μπήκα, έχω χρόνο να πατήσω τα κουμπάκια, στα 5 δευτερόλεπτα μπορεί να αρχίζει το ίου ίου ίου και θα σε κυνηγάω από πάνω από την πολυκατοικία. Άρα λοιπόν υπάρχουν περιπτώσεις όπου δεν θέλουμε τη μεγάλη διασπορά και δυστυχώς στα προβλήματα που έχουμε δεν θέλουμε μεγάλης διασποράς. Η μεγάλη διασπορά σημαίνει αστάθεια. Δεν θέλετε να έχετε ένα σύστημα που να είναι ασταθές, να σου δίνει ασταθές λύσεις. Γι' αυτό πολλές φορές στην πράξη αυτό που συμβαίνει έχουμε μια εκτίμηση, γιατί μιλάμε για εκτιμήση εδώ πέρα, η οποία είναι μεναμερόληπτη αλλά έχει μεγάλη διασπορά, είναι πολύ ασταθής η λύση της. Και γι' αυτό τι κάνουμε, πάμε και την αλλάζουμε λίγο, την τροποποιούμε, της βάζουμε, της προσθέτουμε μια μεροληψία αλλά ταυτόχρονα μειώνουμε τη διασπορά και έτσι πάμε σε μια τέτοια λύση που παρόλο που ξέρω εγώ ότι δεν είναι αμερόληπτη, έχει ένα συστηματικό σφάλμα, το συστηματικό σφάλμα είναι μικρό. Βέβαια πότε θα το εφαρμόσετε το ένα ή το άλλο, δηλαδή πότε το συστηματικό σφάλμα τελικά έχει μεγάλο κόστος, είναι αρκετά μεγάλο και δεν συμφέρει να πάμε στη δεύτερη λύση γιατί η απόκλειση που έχουμε είναι μεγάλη. Άρα κάπου πρέπει να ισορροπούμε τη διασπορά με τη μεροληψία και αυτό εδώ γίνεται με το λεγόμενο στα αγγλικά mean square error, δεν ξέρω αν το έχετε ακούσει ποτέ, το μέσο τετραγωνικό σφάλμα που ακριβώς είναι αυτό που ισορροπεί τη μεροληψία και τη διασπορά. Άρα στην ουσία στα προβλήματα που έχουμε αυτό που θέλουμε να ελαχιστοποιήσουμε είναι το μέσο τετραγωνικό σφάλμα που έχει μέσα του και τη μεροληψία, είναι στην ουσία η μεροληψία στο τετράγωνο συν τη διασπορά το μέσο τετραγωνικό σφάλμα. Είναι το μπ αυτό που λέγαμε μεροληψία στο τετράγωνο συν το εσ τετράγωνο που είναι η διασπορά του εκτιμητή. Αυτό επειδή δεν υπάρχει στην ύλη δίνεται σαν εργασία μπορεί κάποιος να μας προσουσιάσει αυτή την εργασία για το μέσο τετραγωνικό σφάλμα. Λοιπόν και θα κλείσουμε με κάτι έτσι σχετικά απλό για να συμβαδίσουμε και με το άλλο τμήμα. Αν τώρα έρθω εδώ και πω ότι δεν γνωρίζω το στατιστικό, το στατιστικό δεν το έχω από πριν. Δηλαδή τα σβήνω όλα αυτά εδώ πέρα. Κάνω ένα ντιλίτο όπως λέτε εσείς στο τι γνωρίζω εδώ πέρα και λέω έχω τη μέση τιμή. Πώς μπορώ από τις παρατηρήσεις να βρω την πιο κατάλληλη έκφραση μαθηματική, το πιο κατάλληλο τύπο όπως αυτός εδώ, ένας τύπος έτσι που να μου προσδιορίζει καλύτερα τη μέση τιμή. Πώς μπορώ να κάνω το ίδιο για τη διασπορά. Βέβαια εδώ είπαμε ότι ο καλύτερος τύπος φαίνεται να είναι ο μέσος όρος γιατί έχει όλες αυτές τις καλές ιδιότητες όπως και το S τετράγωνο. Αλλά αν σας δώσω ρε παιδιά ένα πρόβλημα και κυρίως εκείνα τα παιδιά εκεί πέρα που χαμογελάνε γιατί τα ξέρουν όλα και σας πω παιδιά πάρε 10 παρατηρήσεις αγόρι μου εσύ πώς θα λένε. Λοιπόν αριστοτέλη μου σου δίνω 10 τιμές και σου λέω ξέρεις αυτές οι τιμές είναι από ένα πρόβλημα με ομοιόμορφη κατανομή έβγαλα τιμές από μια ομοιόμορφη κατανομή που έχει άκρα α και β. Αριστοτέλη ξέρεις τι είναι ομοιόμορφη κατανομή δεν την κοιτάς κανένα τη βλέπεις. Ωραία και σου πω πήρα τις 10 τιμές μπορείς να μου εκτιμήσεις τα άκρα της ομοιόμορφης κατανομή στα α και β. Έχεις κανέναν τύπο να το κάνεις. Δεν είναι όπως εδώ που σου λέω βρες μου τη μέση τιμή εκτίμησέ μου τη μέση τιμή και λες μέση τιμή μέση τιμή θα πάρω το μέσο όρο. Το κάνω ή για τη διασπορά για τη διασπορά είχα ένα τύπο αυτό με το ες τετράγωνο εδώ δεν ξέρεις τίποτα. Άρα πως θα εκτιμήσεις τα άκρα της κατανομής. Κάποιος μπορεί να πει το αρκετά λογικό να πάρω τη μικρότερη τιμή του δείγματος και αυτό να μου δίνει το α και τη μεγαλύτερη τιμή του δείγματος να μου δίνει το β. Δεν είναι όμως έτσι αυτό δεν είναι η καλύτερη λύση. Ερχόμαστε λοιπόν τώρα να δούμε ένα τρόπο έτσι ώστε από τα δεδομένα που έχουμε εάν μου πεις εσύ τι κατανομή είναι να πάω εγώ και να σου βρω τις παραμέτρεις της κατανομής. Δεν είναι ευκολά και αυτό δεν είναι κάτι απλό. Αριστοτέλη τι λες θα μπορούσε εύκολα να το κάνεις. Ζόρικα από τα πράγματα όπως και με το λάμδα της εκθετικής πως θα το κάνουμε. Η πρώτη μέθοδος που θα κάνουμε σήμερα και θα σταματήσουμε εδώ πέρα είναι αρκετά απλή είναι μια παλαιομοδίτικη μέθοδος. Δεν τη χρησιμοποιούμε πλέον τώρα αλλά υπάρχει στην βιβλιογραφία είναι μια πρώτη προσέγγιση η οποία λέει κάτι πολύ απλό. Λέει ξέρεις μην κάνεις delete αυτά τα δύο ας τα να ζήσουνε. Δηλαδή έχεις το μή μέση τιμή χρησιμοποίησε ως προσδιορισμό της μέση τιμής ως εκτίμηση μέση τιμής το μέσο όρο. Διασπορά πάρε το s τετράγων κράτα αυτούς τους δύο τύπους. Άρα λέει εδώ πέρα χρησιμοποιήσω όπου έχω μη θα σκέφτομαι εγώ ότι έχω το αντίστοιχό του από το δείγμα. Όπου έχω σιγμα τετράγων έχω αυτό εδώ. Αυτό είναι το πρώτο. Πρώτα εκτιμούμε αυτό που λέει τις ροπές. Γιατί λέει ροπές. Ροπές είναι μία λέξη που χρησιμοποιούμε στις πιθανότητες για να χαρακτηρίσουμε την κατανομή. Έχουμε τη ροπή πρώτου βαθμού δευτέρου βαθμού. Στην ουσία είναι πρώτη δύναμη του χ, δεύτερη δύναμη του χ, τρίτη δύναμη του χ και ούτω καθεξής. Εντάξει. Η ροπή πρώτου βαθμού είναι το ε χ, δευτέρου βαθμού είναι ε χ τετράγων, τρίτη βαθμού είναι ε χ στην τρίτη, ούτω καθεξής. Η διασπορά είναι η κεντρική ροπή γιατί αφορούμε με το ε στο χ στις τετράγων. Με μάση περιπτώση, εμείς θα χρησιμοποιήσουμε μόνο αυτά τα δύο. Άρα το πρώτο βήμα για εμάς είναι να υπολογίσουμε το μέσο όρο και τη δυγματική διασπορά και αυτά να τα χρησιμοποιήσουμε για το μη και το σίγμα τετράγων. Αν μου λες όμως, ναι αλλά εγώ θέλω τα α και β, τότε έρχομαι και σου λέω, μιλάς για ομοιόμορφη κατανομή, μπορείς να βρεις κάποια σχέση του α και του β με τα μη και τα σίγμα τετράγων? Το α και το β σχετίζεται με το μη, με τη μέση τιμή. Α, Αριστοτέλη, το α και το β σχετίζεται με κάποιο τρόπο με τη μέση τιμή. Τι μέση τιμή στην ομοιόμορφη κατανομή που έχει άκρα α και β. Θα σε φάει ο Κωνσταντινός από πίσω, έτοιμος είναι. Ομοιόμορφη είναι. Α, α, σιβήτα δεύτερα. Τσάκ το βγάλαμε. Με τη διασπορά δεν είναι προφανές, υπάρχει όμως ένας τύπος. Άρα λοιπόν, αφού μπορώ εγώ να βγάλω μία σχέση της κάθε παραμέτρου με το μη και το σίγμα τετράγωνο, στην περίπτωσή μας θα είχα δύο αγνώσεις, τα α και β. Θα ήλθα προς αυτούς τους δύο αγνώσεις στο σύστημα, δύο εξισώσα με δύο αγνώσεις και θα το βρω. Αυτή είναι η μέθος τωροπών. Άρα, όταν έχω κανονική κατανομή, και να σας θυμίσω την κανονική κατανομή ότι δίνεται από έναν τέτοιο τύπο, είναι η καμπανούλα. Η καμπανούλα λοιπόν έχει κέντρο το μη και έχει ένα άνοιγμα σίγμα. Τι πέθατε ρε, πέστε ότι κρυώσατε τώρα. Κρύω, κρύω. Είναι το σύνθημα, τελείωνε. Σας δεν τρέπεστε. Αυτή λοιπόν είναι η κανονική κατανομή. Βλέπετε ότι για την κανονική κατανομή, εδώ τι γράφω, η τυχαία μεταβλητή χ, αυτή εδώ, ακολουθεί κυματάκι, το ν, νόρμαλ, κανονική, με μέση τιμή μη και διασπορά σίγμα τετράγωνο. Για να προσδιορίσω εγώ αυτή τη συνάρτηση, αυτό είναι το γράφημα της συνάρτησης σε κατανομή, της συνάρτησης πυκνότητας πιθανότητας, η συνάρτηση είναι αυτή εδώ. 1 δια ρίζα, 2π σίγμα, πε ύψιλον, χ μιονμή στο τετράγωνο, δια 2 σίγμα τετράγωνο. Αυτή εδώ η απλή συνάρτηση είναι η καμπανούλα. Τι μπαίνει εδώ μέσα, μπαίνει το μη και το σίγμα. Το μη μου λέει που είναι το κέντρο, το σίγμα μου λέει πόσο είναι το άνοιγμα. Άρα για την κανονική κατανομή εγώ χρειάζομαι να ξέρω μόνο τη μέση τιμή και τη διασπορά, τίποτα άλλο. Τίποτα άλλο δεν χρειάζομαι. Όπως για την ομοιόμορφη χρειάζομαι το άλφα και το βήτα. Ε, η μέθοδος των ροπών μου λέει για αυτές εδώ τελείωσε, κατευθείαν πάρει το μέσο όρο και τη διασπορά και τελείωσες. Και το άλφα και βήτα όμως της ομοιόμορφης, σου λέει η μέση τιμή δίνεται από αυτό, όπως είπε ο Αριστοτέλης που δεν το θυμάται τώρα, και η διασπορά δίνεται από αυτό εδώ, από αυτόν τον τύπο. Άρα τι έχεις, δύο εξισώσεις, βάλε εδώ στο μη το μέσο όρο, βάλε εδώ το σίγμα τετράγωνο, το εσ τετράγωνο, τα μόνο άγνωστά σου είναι το άλφα και βήτα, άρα δύο εξισώσεις με δύο αγνώσεις και το βρίσκεις. Και εδώ δίνονται ένα αριθμητικό παράδειγμα, επειδή ο άλλος έφερε και την τσάντα από εδώ, ο άλλος θα κλείσει τα βιβλία τώρα έτσι, θα αρχίζει να τα βαράτε κάτω, θα σκόψει το παράδειγμα, δεν θα σας το κάνω, εσείς θα χάσετε. Λοιπόν, είναι ένα παράδειγμα, 25 παρατηρήσεις δεν έχει άλλη φορά, το όριο που καίγονται οι ασφάλειες στους 40 Α. Να το, εδώ πέρα, εάν υποθέσω τώρα ότι έχω αυτές 25 παρατηρήσεις και μου λέει κάποιος μου σφυρίζει στα αυτοί, το όριο που καίγονται οι ασφάλειες ακολουθεί κανονική κατανομή, καμπανούλα. Τι χρειάζομαι λοιπόν, να ξέρω, μέση, τιμή και διασπορά. Άρα, τι κάνω, βρίσκω το μέσο όρο, βρίσκω τη διασπορά, πράξεις, τίποτα άλλο, δυο τύπους, βάζω τα εδομένα, βρίσκω το αποτελέσμα, τελείωσα. Αν μου σφυρίξει και μου πει ομοιόμορφη κατανομή, αριστοτέλη τα α και β. Δεν θα πάω να πω ποια είναι η μικρότερη εδώ η τιμή, ποια είναι η μικρότερη αριστοτέλη. 38,3. Ποια είναι η μεγαλύτερη? 41,5. Να πει ότι είναι αυτά τα α και β. Όχι, δεν είναι καλή εκτίμηση αυτή. Τι θα κάνουμε, θα πάρουμε τους τύπους που έχουμε για τη μέση τιμή και τη διασπορά της ομοιόμορφης, θα λύσουμε ως προς τα α και β αντικαθιστώντας εδώ τη μέση τιμή και τη διασπορά με τα δειγματικά και δεν θα βρούμε τα νούμερα που είπαμε πριν, αλλά αυτά εδώ πέρα που είναι οι καλές εκτιμήσεις. Καλές γιατί, γιατί έχουν τις δεδομένες ιδιότητες. Το επόμενο λοιπόν που θα κάνουμε, με αυτό θα ξεκινήσουμε την άλλη φορά, την άλλη φορά βασιλάκι, εντάξει. Απλά ήθελα να σας πω ότι το επόμενο που θα κάνουμε είναι το... η πιο δύσκολη μέθοδος, αλλά και η πιο καλή, όχι η άλλη παλιωμοδίτικη. Λοιπόν, δεν σας έφαγα πολύ ώρα, εντάξει. |