Διάλεξη 15 / Διάλεξη 15 / Διάλεξη 15

Διάλεξη 15: Λοιπόν, μιλάμε για μία τυχαία μεταβλητή χ, μια οποιαδήποτε τυχαία μεταβλητή, χρησιμοποιώ ως παράδειγμα αυτό για το ύψος των φοιτητών, το οποίο είναι λίγο χαζό παράδειγμα. Και αυτό που θα θέλαμε είναι στον πληθυσμό που αναφέρεται η τυχαία μεταβλητή, πληθυσμός για το ύψος είναι όλοι οι φοι...

Πλήρης περιγραφή

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριος δημιουργός: Κουγιουμτζής Δημήτριος (Αναπληρωτής Καθηγητής)
Γλώσσα:el
Φορέας:Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Είδος:Ανοικτά μαθήματα
Συλλογή:Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών / Θεωρία Πιθανοτήτων και Στατιστική
Ημερομηνία έκδοσης: ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ 2015
Θέματα:
Άδεια Χρήσης:Αναφορά-Παρόμοια Διανομή
Διαθέσιμο Online:https://delos.it.auth.gr/opendelos/videolecture/show?rid=a66112c3
Απομαγνητοφώνηση
Διάλεξη 15: Λοιπόν, μιλάμε για μία τυχαία μεταβλητή χ, μια οποιαδήποτε τυχαία μεταβλητή, χρησιμοποιώ ως παράδειγμα αυτό για το ύψος των φοιτητών, το οποίο είναι λίγο χαζό παράδειγμα. Και αυτό που θα θέλαμε είναι στον πληθυσμό που αναφέρεται η τυχαία μεταβλητή, πληθυσμός για το ύψος είναι όλοι οι φοιτητές, για τις ασφάλειες που μιλούσαμε, το όριο που καίγονται οι ασφάλειες 40 μ, είναι όλες οι ασφάλειες που παράγει μια ατηρία κτλ. Θα μας ενδιέφερε ένα μάθημα για την κατανομή, αλλά επειδή είναι πολύ δύσκολο να γνωρίζω την κατανομή από ένα δείγμα κάποιων παρατηρήσεων, θα λέω ότι δεν θα πάω στην κατανομή, αλλά θα πάω να μετρήσω κάποιο χαρακτηριστικό της κατανομής, δηλαδή κάποια παράμετρο της κατανομής. Και εμείς εδώ μέχρι στιγμής είδαμε τη μέση, τη μη και τη διασπορά, καθώς και την τυπική απόκλυση. Αυτές ήταν οι παράμετρες που είδαμε μέχρι τώρα. Το παράμετρο ξεκινάω από το στατιστικό, δηλαδή από μία έκφραση μαθηματική αυτών των παρατηρήσεων, που σημαίνει ότι παίρνω και υπολογίζω με κάποιο τρόπο έναν τύπο, μια συνάρτηση των παρατηρήσεων, που αν θέλω να προσδιορίσω, να εκτιμήσω τη μέση τιμή, αυτό είναι ο μέσος ώρος, δηλαδή το άθρησμα των παρατηρήσεων δια το πλήθος. Όταν μιλάω για το σίγμα τετράγωνο, παίρνω τον τύπο που μου δίνει τη διγματική διασπορά διαιρώντας με 1-1 και όχι με 1. Αυτοί οι τύποι, όπως είπαμε, δίνονται στο τυπολόγιο στις εξετάσεις, δεν χρειάζεται να θυμάστε λοιπόν τύπους. Και για την τυπική απόκλυση θα έχουμε φυσικά τη ρίζα της διασποράς. Αυτά είναι εντάξει, τα είχαμε ήδη συζητήσει. Το καινούριο στοιχείο που είχαμε πει την προηγούμενη φορά, στα δύο προηγούμενα μαθήματα, είναι ότι εκτός από τη σημιακή εκτίμηση, δηλαδή να προσδιορίσω την παράμετρο με έναν αριθμό, να πω ότι το μέσο ύψος των φοιτητών είναι 1-70, επειδή πήρα 20 φοιτητές και μέτρησα το ύψος τους και βρήκα το μέσο όρο, αυτό δεν μας λέει και τίποτα. Γι' αυτό πηγαίνουμε και βγάζουμε και ένα διάστημα εμπιστοσύνης που λέμε ότι μέσα εδώ θα βρίσκεται η πραγματική μέση τιμή. Αυτό το λέω με μία σιγουριά που είναι σε αυτό το επίπεδο, το 1-α το 100, αν το σφάλμα είναι 0,05 το επίπεδο εμπιστοσύνης είναι το 95%. Και πώς το φτιάξαμε αυτό, αν θυμάστε είχαμε το μέσο όρο στο κέντρο του διαστήματος και μία κρίσιμη τιμή επί την τυπική απόκλυση του εκτιμητή. Και είχαμε εδώ πέρα τρεις περιπτώσεις και θα τις γράψω τις τρεις περιπτώσεις, έτσι για να τις έχουμε εδώ. Είχαμε τρεις περιπτώσεις, η μία περίπτωση δεν θα σας γράψω όλες τις προϋποθέσεις, η μία ήτανε βασικά όταν είχαμε γνωστή διασπορά. Δηλαδή ποια διασπορά, αυτή είναι εδώ στον πληθυσμό. Πολύ απίθανο σε πρακτικά προβλήματα να έχουμε τη διασπορά στον πληθυσμό γιατί το μόνο που έχουμε είναι μόνο οι παρατηρείς. Συνήθως δηλαδή από δεξιά από εδώ πέρα από τον πληθυσμό δεν ξέρουμε τίποτα. Αν γνωρίζω τη διασπορά στον πληθυσμό τότε λέω ότι το διάστημα εμπιστοσύνης δίνεται από αυτόν εδώ τον τύπο. Και παίρνω την κρίσιμη τιμή από την τυπική κανονική κατανομή. Και βλέπετε εδώ πέρα μπαίνει το σίγμα που είναι η τετραγωνική ρίζα της διασποράς, δηλαδή η τυπική απόκλυση την οποία θεωρώ γνωστή. Για να το χρησιμοποιήσω αυτόν τον τύπο είχαμε πει ότι ή θα πρέπει να έχω μεγάλο δείγμα ή θα πρέπει να έχω κανονική κατανομή για τις παρατηρήσεις μου. Αυτός είναι ο ένας τύπος. Στην περίπτωση που δεν γνωρίζω τη διασπορά αλλά έχω μεγάλο δείγμα, την άγνωστη διασπορά πάω και την αντικαθιστώ με τη δειγματική. Αυτό είναι στην περίπτωση που έχω μεγάλο δείγμα, δηλαδή όταν το 1 είναι να είναι μεγαλύτερο από 30. Η γενική περίπτωση όμως είναι να μην έχω γνωστή διασπορά και να έχω και μικρό δείγμα, οπότε σε αυτή την περίπτωση παίρνω την κρίσιμη τιμή από τη student και όχι από την κανονική. Αυτό που αλλάζει δηλαδή με τον παραπάνω τύπο είναι ότι αντί να πάρω την κρίσιμη τιμή από την τυπική κανονική κατανομή πηγαίνω στη student για να είναι πιο ακριβές στο διάστημα εμπιστοσύνης. Και καταλαβαίνουμε, αν θυμόμαστε πώς είναι η κατανομή αυτή, ότι είναι και αυτή η καμπανούλα αλλάζει με τους βαθμούς ελευθερίας εδώ, μπαίνουν οι βαθμοί ελευθερίας που όσο μεγαλώνει αυτό το 1 συγκλίνει στην τυπική κανονική κατανομή. Και έτσι για μεγάλο δείγμα αυτή η δύο τύποι γίνονται ισοδύναμη. Γιατί αυτά τα δύο, που είναι το μοναδικό σημείο που διαφέρουν, θέλουν να είναι ίδια. Αυτά είχαμε πει και για τη μέση τιμή. Για τη διασπορά είχαμε μόνο έναν τύπο που δίνεται σε σχέση με την τυχή τετράγωνο κατανομή. Δηλαδή την κρίσιμη τιμή εδώ πέρα την έχω στον παρονομαστή τώρα και είναι στη δεξιά πλευρά, στο δεξιό άκρο του διαστήματος, με συγχωρείτε στο αριστερό άκρο του διαστήματος, είναι η δεξιά κρίσιμη τιμή από τη τυχή τετράγωνο κατανομή που μπαίνει στον παρονομαστή. Και το δεξί άκρο του διαστήματος έχει την αριστερή κρίσιμη τιμή, δηλαδή για α' δεύτερα στον παρονομαστή. Και αυτό είναι το διάστημα εμπιστοσύνης για τη διασπορά. Αυτά έχουμε πει μέχρι τώρα. Τραβάω μια γραμμή εδώ πέρα και είναι αυτά που είπαμε μέχρι τώρα. Τα θυμηθήκατε καθόλου? Τώρα έρχεται ένα άλλο πρόβλημα που λέει, και ας προχωρήσω λίγο και της διαφάνειας, είμαστε σε μια άλλη ενότητα. Αυτά δεν τα είχαμε κάνει, τα είχαμε κάνει για τη διασπορά, έτσι δεν είναι, οπότε να το προχωρήσω αυτό εδώ. Και έρχόμαστε τώρα στο διάστημα εμπιστοσύνης για τη διαφάνεια μέσω τιμών. Αυτά δεν τα είχαμε κάνει, δεν είναι η πρώτη φορά που το βλέπετε αυτό. Σωστά, ε? Δεν τα έχω περδέψει με τα τιμήματα. Τι λέει εδώ πέρα τώρα, διάστημα εμπιστοσύνης διαφορά μέσω τιμών. Δηλαδή πάω και βάζω μία άλλη παράμετρο εδώ, το μ1-μ2. Τι είναι αυτό το μ1-μ2, θεωρώ δύο τυχαίες μεταβλητές, χ1 και χ2, οι οποίες δεν είναι διαφορετικού τύπου μεταβλητές. Αν πάρουμε το χαζό παράδειγμα με το ύψος του φοιτητή, πάλι και οι δυο αναφέρονται σε ύψους του φοιτητή, αλλά αναφέρονται σε διαφορετικούς πληθυσμούς. Για παράδειγμα, έχουμε το ύψος των φοιτητών στο απιθήτα και σε μια, ας πούμε, σε ένα άλλο πανεπιστήμιο, μιας άλλης χώρας. Ποια άλλη χώρα μπορεί να έχει πιο ψηλά παιδιά για παράδειγμα, στην Ευρώπη. Σουηδία ή Ολανδία, που φημίζονται ότι είναι δυρέκια, ψηλοί, έτσι. Και μπορεί να ήθελε να κάνει αυτή τη χαζή έρευνα τώρα. Ξέρετε, υπάρχουν κάτι αγγλικά πανεπιστήμια συνήθως που κάνουν κάτι κουφές έρευνες, αλλά μπορεί να θέλει να κάνει μια έρευνα να δει αν το μέσο ύψος του φοιτητών είναι πιο ψηλά στην Ολανδία από ότι είναι στην Ελλάδα. Για να το κάνει αυτό του λέμε πήγαινε να πάρει στη διαφορά των μέσων τιμών. Γιατί τώρα να πάρουμε τη διαφορά των μέσων τιμών. Αυτό θέλω εγώ να συγκρίνω τις μέσες στη μέση. Γιατί να πάρω διαφορά μέσω τιμών. Γιατί αν είναι το μη 1 μεγαλύτερο από το αντίστροφο και είναι θετικός από το αντίστροφο. Δεν ξέρω ποιο είναι το μη 1 μεγαλύτερο από το αντίστροφο. Έτσι δηλαδή αν το πρόσιμο είναι θετικό εδώ πέρα τότε συμπερένω ότι έχω το μη 1 μεγαλύτερο από το μη 2. Αν είναι αρνητικό το αντίστροφο και είναι μη 0 δεν διαφέρουν. Τώρα μπορεί αυτά να είναι ακριβώς μη 0. Μία στο εκατομμύριο έτσι. Τι κάνουμε όμως στο τέλος εμείς θα βρούμε την εκτίμηση που εκτίμηση είναι απλή. Την γράφω κατευθείαν μη σας παιδεύω. Αυτή εδώ είναι η εκτίμηση. Νομίζω ότι καταλαβαίνετε γιατί είναι αυτή η εκτίμηση αφού για τη μέση τιμή έχω το μέσο όρο. Για τη διαφορά το μέσο τιμό θα πάρω τους δύο μέσους όρους από τα δύο δείγματα που θα έχω. Το ένα δείγμα αναφέρει το πρώτο πληθυσμό το άλλο στο δεύτερο και παίρνω τη διαφορά το μέσο όρο. Αν πάω εδώ όμως στο διάστημα εμπιστοσύνης τώρα θα έχω εδώ πέρα ένα διάστημα. Εάν το διάστημα αυτό είναι έτσι. Καταλαβαίνετε τι σημαίνουν αυτές οι πάνε θέσεις. Τα άκρα του διαστήματος. Αν είναι έτσι τι σημαίνει αυτό. Μέσα εδώ θα βρίσκεται με πιθανότητα. Αυτό το διάστημα θα περιέχει με πιθανότητα 95% ας πούμε ή 1-α% γενικά. Όχι πιθανότητα σε ποσοστό εμπιστοσύνης. Θα περιέχει την πραγματική τιμή της παραμέτρου. Δηλαδή την πραγματική τιμή αυτής της διαφοράς. Αν λοιπόν αυτό είναι θετικό, όλο θετικό αφού είναι από τη δεξιά πλευρά του μη 0, τι μου λέει. Ότι η διαφορά αυτή είναι πάντα θετική. Άρα ερχόμαστε σε αυτό που είπες. Θα έχω λοιπόν το μη 1 μεγαλύτερο του μη 2. Εάν είμαστε σε αυτή την περίπτωση, εδώ, καταλαβαίνετε ότι είναι το αντίστροφο. Το μη 2 μεγαλύτερο το μη 1. Αν όμως είμαστε σε αυτή την περίπτωση, τι σημαίνει. Τι μου λέει αυτό το διάστημα. Ότι κάπου εδώ μέσα είναι η πραγματική τιμή της παραμέτρου. Δηλαδή η πραγματική τιμή αυτής της διαφοράς. Άρα κάπου εδώ μέσα μπορεί να είναι και μη 0. Δεν είναι δηλαδή ότι αποδεικνύουμε ότι είναι μη 0. Φτιάχνουμε ένα διάστημα εμπιστοσύνης και επειδή το διάστημα μπορεί να περιέχει το μη 0, σημαίνει ότι δεν διαφέρουν με στατιστική σημαντικότητα. Γι' αυτό λοιπόν το κάνουμε αυτό το διάστημα εμπιστοσύνης. Εδώ θέλουμε να καταλήξουμε να δούμε τελικά αν περιέχει το μη 0 ή όχι. Όλη η δουλειά που θα κάνουμε λοιπόν είναι για να φτιάξουμε ένα διάστημα εμπιστοσύνηση για τη διαφορά του μέσο τιμού και να δούμε αν περιέχει το μη 0. Τι πίνεσες, για πες. Όχι, όχι, γιατί δεν δίνουμε κάποιο βάρος. Κατάλαβα τι λες, δεν δίνουμε κάποιο βάρος ότι αν εδώ είναι το μη 0 και εμένα το διάστημα είναι αυτό εδώ. Ότι έλα μωρέ τώρα είναι στην άκρη. Δεν δίνουμε κάποιο βάρος. Γιατί τι λέει αυτό, ότι αυτό το διάστημα περιέχει την πραγματική τιμή οπουδήποτε εδώ μέσα. Αφού το οπουδήποτε είναι και μη 0, μπορεί να είναι και μη 0. Για αυτό λέμε ότι δεν διαφέρουν στατιστικά σημαντικά. Λοιπόν, να πάμε λίγο να το κάνουμε τώρα, να το βρούμε αυτό το διάστημα. Και ξεκινάμε σιγά σιγά να το κάνουμε. Τα επάνω τα έχουμε ήδη πει, έχουμε δύο τυχές μεταβλητές, μέση τιμή μη 1 για το 1, μέση τιμή μη 2. Έχει εκεί μια παρένθεση και λέει χ1 και χ2 είναι ανεξάρτητα, είναι ανεξάρτητες τυχές μεταβλητές. Πώς το καταλαβαίνετε αυτό, τι σημαίνει ανεξάρτητες τυχές μεταβλητές. Αν πάρουμε το χαζό παράδειγμα αυτό που λέγαμε με το ύψος των φοιτητών, τι σημαίνει ότι είναι ανεξάρτητες. Ότι το ύψος των Ολανδών και το ύψος των Ελλήνων, ή το ύψος των φοιτητών των Απιθήτα και του Πανεπιστήμιου στο Άπστερνταμ. Τι σημαίνει να είναι ανεξάρτητες. Δεν επηρεάζει μία την άλλη. Δεν επηρεάζει μία την άλλη, έτσι. Συμβαίνει σε αυτό το παράδειγμα. Δεν έχουμε κανένα πρόβλημα. Μπορείτε να σκεφτείτε κάποιο παράδειγμα που δεν συμβαίνει κάτι τέτοιο. Να είναι ανεξάρτητες. Να είναι ανεξαρτημένες οι δυο τυχές μεταβλητές. Το ύψος των Απιθήτα και των φοιτητών της Ελλάδας. Εμπεριέχεται ένα μετά άλλο. Είναι το ένα μέσα στο άλλο. Το ύψος των Απιθήτα και των φοιτητών της Ελλάδας. Γιατί μειώνεται ως στρολικός πληθυσμός. Γιατί δεν είναι ανεξάρτητα αυτά τα δύο. Δηλαδή το πρόβλημα είναι ότι πήγα σε άλλη χώρα. Όχι προς το πληθυσμό της Ελλάδας. Θα μπορούσαμε να αφαιρούσουμε ότι φεύγει ένα κομμάτι από το πληθυσμό της Ελλάδας. Όχι, αλλά έχω δύο ανεξάρτητους πληθυσμούς. Πληθυσμί για μένα είναι οι φοιτητές στο Πανεπιστήμιο. Στο Πανεπιστήμιο Α και στο Πανεπιστήμιο Β. Αν πάρω εγώ μία τυχαία μεταβλητή. Τι τυχαία μεταβλητή, το ύψος ενός φοιτητή από ένα Πανεπιστήμιο επηρεάζει. Συσχετίζεται με κάποιο τρόπο με το ύψος ενός φοιτητής σε ένα άλλο Πανεπιστήμιο. Όχι, είναι ανεξάρτητα αυτά. Όχι, είναι ανεξάρτητα αυτά. Στην ίδια αίθουσα. Αλλά τώρα τι έχεις κάνει όμως. Πήγες σε διαφορετικού τύπου μεταβλητές. Εδώ μένουμε σε μήλα-μήλα. Πορτοκάλια-πορτοκάλια δεν αλλάζουμε. Θερμοκρασία-θερμοκρασία. Αυτό είναι άλλο πρόβλημα τώρα. Σίγουρα έχει σχέση. Δεν είναι ανεξάρτητα αυτά που είπες. Αλλά δεν είναι αυτού του τύπου. Μιλάω τώρα να έχουμε την ίδια μεταβλητή σε δύο πληθυσμούς, αλλά να είναι εξαρτημένη. Ναι, το όνομά σου? Αστέρις. Αστέρις, ναι, ναι. Αυτό έλπινε, να είσαι και σίγουρος, ναι. Αν πάρουμε την πόλη σε ένα δικό σύμφωνο, τους πόλεις όταν βάζουν την παίχτηση από μια αμάδα, ή τους πόλεις όταν βάζουν την παίχτηση από πρασικά παέρα παίχτη του κάτω μάτου. Ναι. Ο παίχτης που βάζει ένας παίχτης από τη μία ομάδα, με τον παίχτη από την άλλη ομάδα. Δεν είμαι σίγουρος. Επειδή εγώ είμαι δεδομένος, ότι ο ένας θα πάει περισσότερους πόλους για τον άλλον, κατεβαίνονται οι πιθανόδες να πάει. Αμοιλάζει για δύο παίχτης την ίδια ομάδα. Ναι, εδώ βέβαια θα έχουμε πρόβλημα να φτιάξουμε πληθυσμούς και δείγματα. Γιατί πόσες φορές να παίξουν μεταξύ τους δύο ομάδες, όπου να έχουν τον ίδιο παίχτη, τον ένα παίχτη από μία ομάδα, τον άλλο από την άλλη. Τα μίλα μοιάζουν μιλά. Α, έχουν στα μίλα κατευθείαν. Τα μίλα μοιάζουν δεύτερες μιλιάς που είναι κοινωνικοί. Επειδή μπορεί μία μιλιά να πείσει ότι θα εισβάλλωσε το στάδι. Ναι, αυτό τώρα από το ψάξουμε έχει βάση, αλλά θα λέγαμε αν πηγαίναμε σε διαφορετικές περιοχές και παίρναμε δύο μιλιές που είναι κοντά η μία με την άλλη, κάθε φορά. Άρα ο πληθυσμός θα ήταν οι διαφορετικές περιοχές που έχει μιλιές και θα παίρναμε μία από το κάθε ένα. Ναι, θα μπορούσε να συμβεί κάτι τέτοιο, σωστά. Γιατί, αν είναι έφορο το έδαφος, ας πούμε, σε εκείνη την περιοχή, θα είναι και για τα δυο δέτρα. Ναι. Το ύψος των πληθυσμών του αντικείμε με το ύψος των πατεάρων. Μπράβο, μπράβο, και αυτό σωστό. Το ακούσαμε με το ύψος των πατεάρων. Κάποιος πιστεύει ότι υπάρχει μία σχέση κληρονομική, δηλαδή. Εκεί, λοιπόν, έχουμε τους δύο πληθυσμούς. Μιλάμε πάλι για ύψος, αλλά το ένα είναι οι γονείς ή ο πατέρας και το άλλο είναι το παιδί. Και μπορούμε να βρούμε μία συσχέδηση. Ωραία, νομίζω ότι έχετε καταλάβει πως αυτά τα δύο παραδείγματα ήταν καλά. Δεν θα κάνουμε τέτοια εδώ. Γιατί δεν θα κάνουμε? Σας πείραξε τώρα, ε. Γιατί δεν έχετε τέτοια προβλήματα στις ηλεκτρολόγοι. Είναι πολύ σπάνιο να σας τύχουν τέτοια προβλήματα. Συνήθως, δηλαδή, απλά παίρνετε δύο πληθυσμούς οι οποίοι από το πρόβλημάς δεν έχουν κάποιο στοιχείο που να τα συνδέει αυτά. Αν πάτε στην ιατρική, εκεί συνέχεια έχουν τέτοια πράγματα. Γιατί παίρνουν άτομα και τους βάζουν μια αγωγή, ένα φάρμακο, μια θεραπεία. Μετράει, ας πούμε, την υπέρταση. Άρα τους μετρά την πίεση. Μετρά την πίεση σε ένα άτομο πριν τη θεραπεία, ο πρώτος πληθυσμός, κάνουν τη θεραπεία και του μετρά την πίεση μετά τη θεραπεία. Άρα η πίεση είναι η τυχαία μεταβλητή και οι δύο πληθυσμοί είναι πριν τη θεραπεία μετά τη θεραπεία. Εκεί, όμως, θα πρέπει να πάρουν υπόψη στο ότι είναι εξαρτημένες οι μεταβλητές. Ότι αν πάρεις ένα άτομο μέσα στη μελέτη που κάνεις, μέσα στο δείγμα σου, ο οποίος τυχαίνει να έχει ψηλή πίεση, τότε θα έχει ψηλή πίεση και πριν και μετά. Δεν χρειάζεται να το καταλαβαίνετε. Πότε είναι εξαρτημένο. Θέλουμε να δούμε τη διαφορά, τελικά, που κάνει η θεραπεία. Λοιπόν, εσείς δεν έχετε τέτοια παραδείγματα και γι' αυτό θα μείνουμε στο ότι εδώ οι χ1 και οι χ2 μεταβλητές είναι εξάρτητες και η διαδικασία που θα χρησιμοποιήσουμε για να βγάλουμε το διάστημα εμπιστοσύνης αναφέρεται σε αυτή την περίπτωση. Αν ήταν εξαρτημένες θα κάναμε κάτι διαφορετικό, αλλά δεν θα το κάνουμε εδώ πέρα. Λοιπόν, παίρνουμε τα δύο δείγματα, έχουμε τους μέσους όρους. Είπαμε ότι η εκτιμήτρια για τη διαφορά των μέσων τιμών είναι η διαφορά των μέσων όρων. Και τώρα θέλω να βρω το διάστημα εμπιστοσύνης. Αυτά τα τρία διαστήματα εμπιστοσύνης που έβγαλα για τη μέση τιμή και αναφέρομαι στη μέση τιμή γιατί υπάρχει πλήρη αναλογία εδώ πέρα σε αυτό που θα κάνουμε. Αυτά τα τρία διαστήματα εμπιστοσύνης τα έβγαλα γιατί βασίστηκα τη μία φορά σε εκτυπική κανονική κατανομή και στην άλλη σε student. Πήρα το μέσο όρο, του έκανα ένα μετασχηματισμό και είδα ότι η κατανομή που ακολουθεί όχι ο μέσος όρος ακριβώς, ήταν κανονική ή ήταν student. Άρα ασχολήθηκα με την κατανομή του εκτιμητή μου που εκτιμητής εδώ ήταν ο μέσος όρος. Σε αναλογία λοιπόν με αυτό που έκανα για τη μέση τιμή, για να βρω το διάστημα για τη μέση τιμή, θα δω και την κατανομή τώρα της διαφοράς των μέσων όρων. Και ας πάρω ότι έχω γνωστές διασπορές. Ξεκινάω τώρα τις περιπτώσεις. Πάλι αν οι διασπορές είναι γνωστές, αν το δείγμα είναι μεγάλο ή μικρό, αν η κατανομή είναι κανονική ή όχι. Και υπάρχει αυτό εδώ το αποτέλεσμα. Το οποίο τι λέει, αν το διαβάσουμε αυτό εδώ είναι μια παρένθεση και μια άλλη παρένθεση. Και αυτό είναι το η, ενώ αυτό είναι το και. Η πρώτη παρένθεση τι μου λέει. Εάν και οι δύο τυχαίες μεταβλητές ακολουθούν κανονική κατανομή. Εντάξει. Περιγραφικά αν θέλουμε να το πούμε αυτό το πράγμα λέει εδώ πέρα. Αν το χ1 ακολουθεί την κανονική κατανομή με μέση τιμή μία ένα και διασπορά σε ένα τετράγωνο και το δύο χ2 και τα λοιπά. Ενώ εδώ τι μας λέει, αν τα δείγματα είναι μεγάλα. Εάν αυτές οι δύο ακολουθούν κανονική κατανομή, το άθρησμα τι κατανομή ακολουθεί, θυμάστε? Κανονική πάλι, έτσι. Με τι μέση τιμή? Το άθρημα των μέσων τιμών. Και τι διασπορά? Το άθρημα των διασπορών. Εάν πάρουν τη διαφορά αυτών των δύο, τι κατανομή ακολουθούνε? Σας κάνω τώρα τεστάκια. Πάλι κανονική. Με τι μέση τιμή τη διαφορά και τι διασπορά? Το άθρησμα πάλι, έτσι. Πάλι το άθρησμα. Μπορεί κάποιος να δείξει λοιπόν και τα λοιπά και τα λοιπά να κάνει πράγματα και να δείξει όπως δείξαμε Όταν έχουμε μία χ που να ακολουθεί κανονική κατανομή, τότε και ο μέσος όρος ακολουθούσε κανονική κατανομή Άρα, όταν η χ ακολουθεί κανονική κατανομή, τότε και ο μέσος όρος του χ ακολουθεί κανονική κατανομή Με μέση τιμή το μ1 και διασπορά σίγμα ένα τετράγωνο διανύει ένα Το ίδιο για το χ2 Και άρα η διαφορά τους θα έχει κανονική κατανομή με μέση τιμή, τη διαφορά των μέσων τιμών Και άθρησμα, και διασπορά, το άθρησμα των διασπορών τους Αυτό που είπαμε μόλις πριν Αυτό ισχύει για όλες τις κατανομές Αν πάρω εγώ δύο τυχαίες μεταβλητές που ακολουθούν μια κατανομή, ας πούμε ομοιόμορφη Το άθρησμα θα ακολουθεί και αυτό, ομοιόμορφη Τι λέτε Αν πάρω δύο εκθετικές, δύο τυχαίες μεταβλητές που ακολουθούν εκθετική κατανομή Το άθρησμα θα ακολουθεί και αυτό, εκθετική κατανομή Τι λες Τι λες Άντε ρε, τι μου λες Δεν ισχύει, δεν ισχύει Οι μόνες κατανομές που έχουν αυτήν την ιδιότητα είναι κάποιες που λέγονται ευσταθείς Και η κανονική κατανομή είναι μια τέτοια ευσταθείς κατανομή Δεν υπάρχει άλλη από αυτές που ξέρετε Όλες οι άλλες που έχετε ακούσει στο μάθημα του κυρίου Ζιούρτα Αν προσθέσεις δύο τυχαίες μεταβλητές θα σου δώσουν μια άλλη κατανομή Μόνο όταν είναι από κανονική κατανομή αν τις προσθέσεις ή τις αφαιρείς Θα σου δώσουν την κανονική κατανομή Και γενικά αν πάρεις έναν οποιοδήποτε γραμμικό συνδυασμό θα σου δώσει πάλι κανονική κατανομή Αυτό είναι σαν παρένθεση, εν πάση περιπτώσει Εάν συμβαίνει λοιπόν να έχουμε κανονικές κατανομές ή μεγάλα δείγματα Μπορεί κάποιος να δείξει αυτό εδώ όπως το είχαμε κάνει και στην περίπτωση που είχαμε μόνο μία τυχαία μεταβλητή Επίσης τώρα βέβαια αυτό είναι μια τεχνική λεπτομέρεια ότι αν και η διασπορά είναι η ίδια εδώ πέρα Τότε βγαίνει κοινός παράγοντας από εδώ η διασπορά που είναι εκείνη και λέμε ότι έχουμε ομοσχεδαστικές κατανομές Άρα εδώ ήδη φτιάξαμε την πρώτη περίπτωση σε αναλογία με αυτά που είχαμε κάνει για τη μέση τιμή Δηλαδή, τι είχαμε, μέσο όρο, έχουμε διαφορά μέσων όρων, μέση τιμή, διαφορά μέσων τιμών, είχαμε τη διασπορά σίγμα τετράγωνο διά ένα, έχουμε το άθλημα των διασπορών Και τι είχαμε κάνει εδώ πέρα, είχαμε φτιάξει αυτό το διάστημα εμπιστοσύνης στην περίπτωση που ήταν γνωστές οι διασπορές Όπως το έφτιαξα εδώ πέρα μπορώ να το φτιάξω και εδώ, τι θα έχεις σαν κέντρο, αντί να έχει το μέσο όρο θα έχει τη διαφορά των μέσων όρων Συμπλήν την τιμή του ζ και εδώ αντί να έχει την τυπική απόκλυση που είναι η τετραγωνική ρίζα αυθουνού, θα έχει τη τετραγωνική ρίζα αυθουνού εδώ πέρα Και έτσι με αυτόν τον τρόπο φτιάξαμε ήδη το πρώτο διάστημα εμπιστοσύνης για τη μέση τιμή, όταν έχουμε γνωστές διασπορές Σε πλήρη αναλογία με αυτά που έχουμε κάνει για τη μέση τιμή, δηλαδή αυτό είναι το διάστημα εμπιστοσύνης Ο τύπος μπορεί να φαίνεται έτσι λίγο μακρινάρι αλλά δεν είναι τίποτα άλλο παρά βγαίνει με τον ίδιο τρόπο που είχαμε βγάλει και το τύπο για τη μέση τιμή Λοιπόν, ας δούμε και ένα παράδειγμα Όριο ένταση ηλεκτρικού ρεύματος, το είχαμε κάνει με ασφάλειες μιας εταιρείας, τώρα παίρνουμε και από μια δεύτερη εταιρεία άλλες 20 μετρήσεις για τις ασφάλειές της Και θέλουμε να δούμε αν διαφέρουν, τι λένε τα εμπειραμάτια σας, φαίνεται να διαφέρουνε Δύσκολο είναι όταν βλέπεις 25 αριθμούς και 20 αριθμούς να πεις τι γίνεται Πάμε να δούμε αν υπάρχει διαφορά μέσα από, πως την κάναμε στην περιγραφική στατιστική, θυμάστε, κάναμε κάποια γραφήματα, υπολογίσαμε μέσους όρους, διάμεσο κτλ Κάπως έτσι θα τα δούμε και εδώ πέρα Εδώ μας δίνει τώρα ότι η διασπορά είναι κοινή και γνωστή, μας δίνει το σίγμα τετράγωνο Μας λέει ότι για την πρώτη τυχαία μεταβλητή το σίγμα 1 τετράγωνο είναι ίδιο με τη διασπορά το σίγμα 2 τετράγωνο για τη δεύτερη και είναι σίγμα τετράγωνο και τα δύο Μας δίνει λοιπόν τη διασπορά στον πληθυσμό, ότι είναι ίδια και την ονομάει σίγμα τετράγωνο βάζει ίσο με 1 Πολύ το ψάχνεις τώρα, εντάξει Τι να πούμε ότι ακολουθούν μια μέθοδα αλλά οι ασφάλεις θα είναι ίδιες Όχι γιατί πας και παίρνεις ασφάλειες που υποτίθεται ότι όλα της φτιάχνουν να έχουν μια ονομαστική τιμή 40 μΩ να καίγονται εκεί πέρα Αλλά παίρνουν κάποια άλλη παράγωτος τα υλικά που βάζουν και τα λοιπά που μπορεί να καίγεται πότε σε μικρότερο πότε σε μεγαλύτερο Ε, δεν μπορείς να πεις όμως ότι υπάρχει κάτι συστηματικό και στα δύο που να το δημιουργεί αυτό Λοιπόν, για να προχωρήσω τώρα, σας θυμίζω ότι πρέπει να δούμε αν έχουμε κανονική κατανομή ή μεγάλα δείγματα Έχουμε μεγάλα δείγματα? Όχι Άρα θα δούμε αν έχουμε κανονική κατανομή για το x1 και για το x2 Πώς θα το δούμε αυτό? Θα πάμε να κάνουμε ιστογράμματα και θηκογράμματα Θυμάστε? Φαίνεται να είναι κανονική κατανομή Ε, αν πάμε εδώ πέρα και δούμε τα ιστογράμματα δεν είναι τόσο προφανές Για αυτό είναι κάπως καλύτερα τα πράγματα Γιατί φαίνεται να υπάρχει στο κέντρο μια μεγαλύτερη συχνότητα που μειώνεται καθώς πηγαίνουμε αριστερά και δεξιά Εδώ δεν φαίνεται τόσο καθαρά Αν κοιτάξουμε τα θηκογράμματα όμως, αυτό το δεύτερο θηκόγραμμα που έχει την ίδια πληροφορία Αυτό το ιστογράμμα και αυτό το θηκόγραμμα αναφέρονται και τα δύο στο ίδιο δείγμα, το δεύτερο δείγμα Από εδώ είναι πολύ ξεκάθαρο Γιατί βλέπουμε μια πάρα πολύ καλή συμμετρία Οι ουρές έχουν περίπου το ίδιο μήκος, οι διάμεσες είναι περίπου στο κέντρο Το ίδιο είναι περίπου και σε αυτά Άρα δεν έχουμε κανένα λόγο να πιστεύουμε ότι δεν είναι κανονική κατανομή Μπορούμε λοιπόν να δεχτούμε από εδώ πέρα ότι είναι κανονική κατανομή Και έχουμε ασφάλειες από τις δύο εταιρίες Ελάχιστοι Ελάχιστοι, διάμεσος που είναι η κόκκινη γραμμή εδώ πέρα Φαίνεται να είναι πιο ψηλά στη δεύτερη εταιρία από τη στην πρώτη Ενώ οι διασπορές φαίνονται πραγματικά να είναι στα ίδια επίπεδα γιατί το μέγεθος του κουτιού είναι ίδιο Άρα έχουμε κανονικές κατανομές Υπολογίζω λοιπόν τη διαφορά των μέσων όρων που χρειάζομαι και πάω στη διαδικασία Βλέπετε πόσο εύκολη η στατιστική Ο τύπος υπάρχει στον τυπολόγιο, αυτός ο τύπος έχει κάτω, υπάρχει στον τυπολόγιο Τι κάνουμε τώρα, λέμε τι μας λείπει από αυτόν τον τύπο Τι δεν γνωρίζουμε Αφού λέω ότι μπορώ να χρησιμοποιήσω τον τύπο, πότε μπορώ να το χρησιμοποιήσω Όταν μιλάω για γνωστές διασπορές, άρα τις έχω αυτές τις διασπορές Εδώ πρέπει να βάλω και ένα σίγμα δύο Και έχω κανονικές κατανομές ή μεγάλο δείγμα Έδειξα ότι είναι κανονικές κατανομές, άρα μπορώ να χρησιμοποιήσω τον τύπο, τι μου λείπει, η διαφορά το μέσον ώρο Έχω το μέσον ώρο για το πρώτο, δείγμα για το δεύτερο, παίρνουν τη διαφορά μειών 0,77 Τι άλλο μου λείπει τώρα, αυτό εδώ, το βρίσκω από τον πίνακα, το στατιστικό και αυτά όλα τα γνωρίζω Το σίγμα 1 και το σίγμα 2 τετράγωνο έχω πει ότι είναι μονάδα, το ν1 είναι 25, το ν2 είναι 20, 20, άρα τα γνωρίζω Αυτή η τιμή, αφού αναφέρομαι σε 95% διάστημα εμπιστοσύνης το Ζ του 1-α δεύτερα, το 1-α δεύτερα είναι 0,975 Και πάω και βρίσκω την τιμή από τον πίνακα, θυμάσαι ή μη θέλω να το ξαναδούμε, να το ξαναδούμε Η πιθανότητα στην οποία αναφέρομαι είναι το 0,975, αυτός είναι ο στατιστικός πίνακας, θα το βάλω την επικεφαλήδα της τυπικής κανονικής κατανομής Άρα θα πάω σε αυτόν τον πίνακα και από εδώ έχοντας την πιθανότητα θα βρω την τιμή του Ζ που αντιστοιχεί σε αυτήν την πιθανότητα Η πιθανότητα είναι 0,975 που οι τιμές καθώς κατεβαίνουμε και πηγαίνουμε προς τα δεξιά αυξάνουν, το 0,975 είναι εδώ Άρα θα το διαβάσω από τη γραμμή του πίνακα που είναι 1,9 και με ακρίβεια 2ο δεκαδικού θα πάρω το 6 που είναι στην αντίστοιχη στήλη Έτσι λοιπόν έχω το 1,96 εδώ πέρα και κάνω μια απλή αντικατάσταση στον τύπο και βρίσκω το αποτέλεσμα Τι μου λέει τώρα αυτό το αποτέλεσμα? Είναι όταν είναι από τα αρνητικά στα αρνητικά τι συμπέρασμα θα βγάλω Αυτό είναι όλο αρνητικό Ναι Μιχαλάκη Δεν υπάρχει καλύτερη για εμάς Αφού είναι αρνητικό ποιο είναι αρνητικό το μη ένα αυτό αναφέρεται στο μη ένα μη ο μη δύο Αν είναι αρνητικό σημαίνει ότι είναι αρνητικό αυτό άρα το μη ένα είναι μικρότερο από το μη δύο διαφέρουν λοιπόν και πόσο διαφέρουν οι ασφάλεις πρώτης εταιρείας είναι σε πιο χαμηλά επίπεδα Πόσο πιο χαμηλά από 0,18 μέχρι 1,36 αμπέρ Αν είχα θετικό τι θα έλεγα το αντίθετο και αν είχα από τα αρνητικά στα θετικά επειδή περιέχει το μηδέν θα έλεγα τα μη ένα και μη δύο δεν διαφέρουν Και δεν παίζει ρόλο πόσο κοντά είναι το μηδέν στα άκρα από τη στιγμή που πηγαίνει από τα αρνητικά στα θετικά λέμε ότι δεν διαφέρουν αυτά τα συμπεράσματα τα βάζουμε εδώ πέρα Επειδή είναι όλο αρνητικό διαφέρουν σημαντικά και στην πρώτη εταιρεία το μέσο όριο είναι χαμηλότερο πόσο χαμηλότερο 0,18 με 1,36 Βαρεθήκατε σας φαίνονται έτσι οι κοινότυπα αυτά Πάντως δεν έχει δυσκολία η σατιστική η δυσκολία είναι να καταλάβεις σε ποια περίπτωση βρίσκεσαι Εάν καταλάβεις την περίπτωση που βρίσκεσαι παίρνεις τον τύπο τον εφαρμόεις και κάνεις τη δουλειά σου Και θέλω λίγο να προσοχή στο πως σχολιάζουμε τα αποτελέσματα Τώρα στην περίπτωση που έχουμε άγνωσες διασπορές εάν τα δείγματα είναι μεγάλα Εάν έχουμε μεγάλα δείγματα είμαστε στην περίπτωση που ήμασταν εδώ πέρα για τη μέση τιμή Που λέγαμε εάν δεν γνωρίζω τη διασπορά και έχω μεγάλο δείγμα πάνω από 30 τι κάναμε Πήραμε αυτόν τον τύπο όπου απλά αντικαταστήσαμε το σίγμα το άγνωστο με το s Και εδώ θα κάνουμε το ίδιο πράγμα Όταν τα δείγματα είναι μεγάλα λέμε εντάξει δεν μας πειράζει Κάνουμε μια αντικατάσταση της κάθε διασποράς εδώ πέρα για το πρώτο και το δεύτερο πληθυσμό από τις δειγματικές Και έχουμε τον αντίστοιχο τύπο Μην το γράφω εκεί πέρα Η διαφορά είναι ότι στον τύπο που έχω εδώ κάτω Αντί να έχω το σίγμα 1 τετράγωνα και το σίγμα 2 τετράγωνα που δεν τα γνωρίζω τώρα Επειδή το δείγμα μου είναι μεγάλο αντικαθιστώ με ασφάλεια τα δειγματικά Τα s1 τετράγωνα και s2 τετράγωνα Εντάξει είναι αρκετά έτσι απλά Στην περίπτωση τώρα που έχω μικρά δείγματα αρχίζονται και ζωρίζουν τα πράγματα Στα μικρά δείγματα προσπαθούμε να πάμε στην τρίτη περίπτωση εκεί κάτω που έχουμε τη Student Πότε τη χρησιμοποιήσαμε τη Student όμως Όταν είχαμε κανονική κατανομή Εδώ βάζουμε και μια ακόμα συνθήκη Όχι μόνο να έχουμε κανονική κατανομή για να χρησιμοποιήσουμε τη Student Αλλά βάζουμε να έχουμε και την ίδια διασπορά να μην διαφέρει η διασπορά τους Δηλαδή η διασπορά στο πρώτο και στο δεύτερο δείγμα να είναι ίδια Άρα λοιπόν αν έχω διασπορά στο πρώτο και στο δεύτερο δείγμα ίδια Το ερώτημα είναι πώς θα πάω να εκτιμήσω αυτό το s τετράγωνο Το κοινό Δηλαδή να εκτιμήσω αυτήν την κοινή διασπορά Πώς θα την εκτιμήσω Από το πρώτο δείγμα έχω το s1 τετράγωνο Από το δεύτερο δείγμα έχω το s2 τετράγωνο Τι είναι αυτά, είναι η δειγματική διασπορά για το πρώτο δείγμα Η δειγματική διασπορά για το δεύτερο δείγμα Λέω ότι οι διασπορές είναι ίδιες Δηλαδή αν μιλάω για το πληθυσμό Το φοιτητό στο πανεπιστήμιο του Amsterdam ή το πανεπιστήμιο της Θεσσαλονίκης Η διασπορά του ύψους δεν διαφέρει Είναι ίδια Εγώ έχω πάρει από το δείγμα μου τη δειγματική διασπορά για τους φοιτητές εδώ Ο Ολαδός ο καθηγητής πήγε και μάζεψε φοιτητές Και μέτρησε τη δειγματική διασπορά από το ύψος κάποιων φοιτητών εκεί πέρα Και λέω τώρα πώς μπορώ να εκτιμήσω την κοινή διασπορά Πώς θα το κάνατε Ναι, Δημήτρη σε Το ημιάθρισμα Το ημιάθρισμα Είναι κανένας που διαφωνεί με τον Δημητρί Το πιο απλό αυτό δεν είναι Αν όμως εδώ Δεν το κάναμε το μάθημα έξι ώρα που έχει λίγη δροσιά Αλλά το κάναμε κάτι στρήσι ώρα που έχετε φάει κιόλας Και έχετε και τόσο διάθεση να πάτε για μάθημα Και αντί να μου έρθετε εδώ πέρα είκοσι πέντε άτομα Τριάντα πόσοι είστε Ήσαν μόνο δεκά άτομα Ενώ στην Ολλανδία δεν καταλαβαίνουν εκεί ούτε ζέστη ούτε κρύο Στο φιθέατρο μέσα μαζεμένοι όλοι Και είναι νενήντα άτομα εκεί Άρα για το πρώτο δείγμα είχα 10 φοιτητές για το δεύτερο δείγμα είχα 90 φοιτητές Πάλι με τον ίδιο τρόπο να το υπολογίσω Δεν είναι λίγο άδικο Γιατί εδώ πέρα τι κάνουμε στην ουσία Δίνουμε το ίδιο βάρος και στα δύο Ένα δεύτερο δίνουμε στον καθένα Μπορούμε να το κάνουμε πιο δίκαιο Τι είπες πιθανότητα είπες Α πιθανότατα Α πιθανότατα Μην βάζεις πιθανότητες τώρα στατιστική εδώ πέρα Πιθανότατα λες αυτό είναι Το όνομά σου Ο Βασίλης λοιπόν λέει να βάλω Αφού είναι 10 στο ένα δείγμα και 90 στο άλλο Να βάλω εδώ το 10 δηλαδή γενικά Το μέγεθος του πρώτου δείγματος Εδώ το μέγεθος του δεύτερου δείγματος Και το 100 τι είναι το άθλησμα το 2 έτσι Αυτό που είπε τώρα ο Βασίλης έχει και όνομα Δεν το λέμε απλά μέσο όρο Το λέμε σταθμισμένο μέσο όρο Ορίστε Μια χαρά είναι δεν θέλει καν διάρρυ Έχουμε 10 και 90 και 100 εδώ κάτω εντάξει Αυτός λοιπόν είναι ο σταθμισμένος μέσος όρος Έρχεται τώρα η θεωρία και σου λέει Βασίλη μη σταθμίζεις με το μέγεθος του δείγματος Να σταθμίσεις με αυτό εδώ Με τους βαθμούς ελευθερίας Που είναι το μέγεθος του δείγματος μειών 1 Εντάξει λες και εσύ υποκύπτεις στη διαταγή Και το κάνεις έτσι Και αυτός είναι πάλι ο σταθμισμένος μέσος όρος Αλλά σταθμίζουμε όχι με το μέγεθος του δείγματος Αλλά με το μέγεθος του δείγματος μειών 1 Και γιατί το κάνουμε αυτό τώρα Δεν το κάνουμε από βίτσιο Όπως εκεί στη διασπορά αν θυμάστε έχει ένα 1-1 Γιατί το βάλαμε 1-1 και όχι 1 Γιατί πήγαμε και την κάναμε αμερόληπτη εκτιμήτρια Πήγαινε και έπεφτε ακριβώς πάνω στο σίγμα τετράγωνο Ακριβώς λοιπόν για να πέφτει και η δικιά μας η εκτιμήτρια Αυτή που φτιάξαμε τώρα Ακριβώς στο σίγμα τετράγωνο να είναι αμερόληπτη Για αυτό βάλαμε εδώ πέρα τους βαθμούς ελευθερίας Στην σταθμίση και όχι το μέγεθος του δείγματος Αυτός ο τύπος είναι με μπλε Δεν είναι με κόκκινο Τι σημαίνει αυτό παιδάκια μου Ότι δεν υπάρχει στο τυπολόγιο Ότι είναι με κόκκινο υπάρχει στο τυπολόγιο Αυτό είναι με μπλε δεν υπάρχει στο τυπολόγιο Μην προσπαθήσετε να το αποστηθείτε Αν θέλετε κάποιο άλλο μέθοδο για τις εξετάσεις Δεν χρειάζεται Σκεφτείτε την απλή προσέγγιση Αλλά Δημήτρη που λέει μέσω όρο Δεν χάλασε ο κόσμος αν δεν θυμάστε κάτι άλλο Αν θυμηθείτε τον Βασίλη που είπε σταθμισμένο μέσω όρο Αν θυμηθείτε και τη δικιά μου που σας λέω Σταθμίστε αλλά όχι με το μέγεθος του δείγματος Και με τους βαθμούς ελευθερίας Δεν θέλει να θυμάστε τίποτα Έχουμε την εκτίμηση της κοινής διασποράς Και άρα αυτή η κοινή διασπορά είναι που βάζουμε εδώ πέρα Και έχουμε την εκτιμήτρια για τις διασποράς για τη μη 1 μη 2 Σας θυμίζω ότι εδώ είχαμε αυτές εδώ Περίμενε λίγο να γυρίσω λίγο να σας δείξω γιατί ζητάμε την εκτιμήτρια της διασποράς Εδώ έχουμε τον τύπο, αν βγάλω το σίγμα τετράγωνο κοινό βγαίνει απ' έξω Και είναι αυτό το σίγμα τετράγωνο που θέλω να εκτιμήσω Ή αν το βγάλω έξω από την τετραγωνική ρίζα είναι το σίγμα Αυτό λοιπόν το σίγμα τετράγωνο ή το σίγμα πάμε και το εκτιμούμε με αυτόν εδώ τον τύπο Δεν κατάλαβα ότι ποια χορέ έχουν τύποι με το μπλε και τύποι με τα κόκκινα Τύποι με το μπλε, δεν υπάρχουν στον τυπολόγιο που σας δίνουμε στις εξετάσεις Οι τύποι με τα κόκκινα υπάρχουν στον τυπολόγιο που σας δίνουμε στις εξετάσεις Λοιπόν, και όπως είχαμε κάνει στην περίπτωση για την εκτίμηση του διαστήματος εμπιστοσύνης Της μέσης τιμής που πήγαμε και κάναμε το μετασχηματισμό Πήραμε το μέσο όρο, το αφαιρέσαμε τη μέση τιμή και ιδιαιρέσαμε την τυπική απόκληση και πήγαμε σε student Το ίδιο κάνουμε και εδώ Παίρνουμε αυτό, τη διαφορά των μεσονόρων, αφαιρούμε τη μέση τιμή, ιδιαιρούμε την τυπική απόκληση Και αυτό λέμε τώρα ότι θα ακολουθεί τη student κατανομή Με πόσους βαθμούς ελευθερίας όμως το άθρισμα των βαθμών ελευθερίας του πρώτου και του δεύτερου δείγματος Και έτσι έχουμε το δεύτερο τύπο Και ας το γράψω εδώ πέρα τον τύπο να τον έχουμε και αυτό Αυτός λοιπόν είναι ο δεύτερος τύπος που είναι στην περίπτωση που δεν έχουμε γνωστεί διασπορά Αλλά θεωρούμε ότι είναι κοινή και η κατανομή είναι κανονική και στις δύο περιπτώσεις, δηλαδή και για τις δύο τυχιές μεταβλητές Προσέξτε ότι εδώ πέρα αυτό που γράφω είναι ο δείκτης, πρώτα είναι η βαθμή ελευθερίας, μετά είναι το 1-α δεύτερο Όλο αυτό εδώ είναι ένας αριθμός, είναι η κρίσιμη τιμή της student για 1-1 είναι 2-2 βαθμούς ελευθερίας και 1-α δεύτερα Αυτό είναι το S που υπολογίσαμε πριν Και αυτός είναι ο τύπος τώρα που μου δίνει για τη διαφορά μέσων τιμών στην περίπτωση όπως είπαμε που έχουμε άγνωσες διασπορές Αλλά όχι μόνο άγνωσες διασπορές, μικρά δείγματα, κανονικές κατανομές και ομοσκεδαστικές Και εδώ είναι φυσικά η διαδικασία όπως και πριν που αυτό που θα χρειαστούμε θα είναι αυτή η κρίσιμη τιμή Εδώ υπάρχει ένα άλλο θέμα που λέει στην περίπτωση όπου οι διασπορές είναι άγνωσες πάλι, αλλά πριν είχαμε πει ότι είναι ίσες Είχαμε πάρει μια κοινή διασπορά, στην περίπτωση που δεν είναι ίσες υπάρχει μια διαδικασία και κάποιος μπορεί να μας την παρουσιάσει Να μας δώσει και ένα παράδειγμα και να μας δείξει τι διαφορές μπορεί να έχει από αυτό το διάστημα εμπιστοσύνης όπου θεωρούμε εδώ πέρα ότι έχουμε την κοινή τυπική απόχληση Και έχουμε και μια ακόμα περίπτωση, παιδιά δεν κάνουμε διάλειμματα γιατί θα τελειώσουμε σχετικά νωρίς, εντάξει Παζάρια θα κάνουμε Δυο κοπέλες είστε εδώ, βγάλατε και γλώσσα βλέπω, για φρόνιμα Στην περίπτωση λοιπόν που έχουμε μικρά δείγματα, ίσες διασπορές αλλά δεν είναι κανονικές Πάμε σε κάτι που το λέμε μη παραμετρική μέθοδος και εδώ έχουμε Εδώ έχουμε πάλι ένα άλλο θέμα για τις μη παραμετρικές μεθόδους και έχουμε και την περίπτωση την τελευταία όπου είναι η πιο δύσκολη περίπτωση μικρά δείγματα και άνυσες διασπορές Εκεί τα πράγματα δυσκολεύουν Λοιπόν, για να δούμε και ένα παράδειγμα με το όριο ένταση του ηλεκτρικού ρεύματος που είχαμε πριν, τα είχαμε δει τα δεδομένα 25 παρατηρείς για το πρώτο δείγμα, 20 για το δεύτερο Εδώ τώρα θεωρώ ότι είναι άγνωσες οι διασπορές Άρα λοιπόν, πώς θα προχωρήσω για να πάω σε αυτόν τον τύπο εδώ, αφού έχω άγνωσες διασπορές σκέφτομαι τον τύπο με τη Student εδώ πέρα Για να πάω εδώ μου λέει, άγνωσες διασπορές αλλά θα πρέπει να έχω, έχω μικρά δείγματα ή μεγάλα μικρά δείγματα Άρα πρέπει να έχω κανονικές κατανομές, αυτό είναι το ένα, το οποίο το είδαμε πριν με το ιστόγραμμα για το κάθε δείγμα και το θηκόγραμμα για το κάθε δείγμα Αλλά επίσης πρέπει να έχω και κοινή διασπορά Υπολογίζω εγώ τώρα τη διασπορά στο πρώτο δείγμα και στο δεύτερο δείγμα και βρίσκω αυτά εδώ 0.85 και 0.95 Μπορώ να θεωρήσω με βάση αυτά ότι η διασπορά δεν διαφέρει Το ένα είναι 0.85 και το άλλο 0.95 Άμα το γυρνούσατε σε τυπική απόκλειση θα ήταν ακόμα πιο κοντά οι τιμές Μπορώ λοιπόν επειδή μοιάζουν αυτές οι δύο τιμές είναι κοντά να θεωρήσω ότι και η διασπορά στο πρώτο και στο δεύτερο πληθυσμό είναι περίπου οι ίδιες Πάω και το εκτιμάω από αυτόν τον τύπο εδώ πέρα Αυτός που λέγαμε τα μπλε τα γράμματα Απλή αντικατάσταση στα νούμερα εκεί πέρα το 24 είναι γιατί έχω 25 παρατηρήσει μειών 1 24 Το 0.854 είναι η δυγματική διασπορά από το πρώτο δείγμα 19 20 μειών 1 δηλαδή Η δυγματική διασπορά από το δεύτερο δείγμα το 1 1 είναι 2 μειών 2 είναι 43 Και βρίσκω το S τετράγωνο και το S... Γιατί πήραμε τα δυγματικά και βλέπουμε ότι δεν διαφέρουν Αυτό δεν μας το λέει κανένας Καλούμαι εγώ να κρίνω αν μπορώ να χρησιμοποιήσω αυτόν τον τύπο Ο οποίος έχει προϋπόθεση όμως ότι οι διασπορές δεν αλλάζουν Δεν είναι άνισσες Λέω ότι αφού τα δυγματικά είναι κοντά μπορώ να το θεωρήσω Δεν υπάρχει κάτι τέτοιο Για αυτό και αν κάποιος κάνει το θέμα αυτό μπορεί να μας δείξει Ας πούμε ότι θα μπορεί κάποιος να δει ότι σε περιπτώσεις που οι διασπορές είναι κοντά Οι δύο τύποι βγάζουν τα ίδια αποτελέσματα, δεν έχουμε διαφορές Πάμε στη διαδικασία, τι χρειαζόμαστε από εδώ πέρα Η διαφορά των μέσων ώρων το βρήκα, το S το βρήκα Μου μένει εκείνο το T από τη Student Για 43, γιατί 43, 25 συν 20 μίον 2 43 και 0,975 γιατί έχω το 1 μίον α δεύτερα Όπου το α είναι 0,05 Πηγαίνω λοιπόν στον τύπο για τη Student Για να το θυμηθούμε Και εδώ πέρα θα πρέπει να πάω Στους 43 βαθμούς ελευθερίας Οι βαθμοί ελευθερίας δίνονται στις γραμμές Να σας θυμίσω ότι αυτός είναι ο πίνακας της Student εδώ πέρα Γράφει, στατιστικός πίνακας κατανομής Student Αυτοί οι πίνακες όπως με τους τύπους με τα κόκκινα γράμματα Θα δίνονται στις εξετάσεις μαζί με το τυπολόγιο Άμα το δείτε αυτό το στατιστικό πίνακα για πρώτη φορά Θα αρχίσετε να τρέμετε λίγο Να πανικοβάλεστε να πείτε όχι τώρα πώς θα το βρω εδώ πέρα Ακόμα και αν το βλέπετε για πρώτη φορά Κοιτάξτε το παράδειγμα Θα σας βοηθήσει να δείτε πώς βγάζουμε την τιμή του T Στο δικό μας παράδειγμα τι θέλουμε Στους 43 βαθμούς ελευθερίας και 0,975 Το 0,975 είναι η πιθανότητα που υπάρχει στη στήλη Είναι στη τρίτη στήλη λοιπόν Το 43 πού θα είναι Δεν υπάρχει τρίτη σελίδα όμως Είναι στη γραμμή Και βλέπετε ότι μέχρι το 30 πάμε βήμα βήμα Αυξάνεται κατά ένα το πλήθος για τους βαθμούς ελευθερίας Από το 30 πάμε 40-50 Είπαμε είναι η τρίτη στήλη Άρα έχω 42,021 52,009 Τι κάνω λοιπόν για το 43 Παίρνω την ενδιάμεση τιμή Όχι απ' τη στήλη εδώ είναι Οι πιθανότητες Η βαθμή ελευθερίας είναι στη γραμμή Θα πρέπει να βάλουμε μια ενδιάμεση τιμή Κάποιος μπορεί να το πει έτσι πολύ επίσημο Να κάνουμε μια γραμμική παρεμβολή για να το κάνουμε 2,017 είναι μια τιμή ανάμεσα σε αυτές εδώ τις 2 Άρα λοιπόν βάζουμε αυτή την τιμή Το 2,017 που είπε το άλλο το παλικάρι εκεί πέρα Εγώ όμως το στρογγυλοποίησα εδώ σε δεύτερο δεκαδικό Και το έγραφα 2,02 Και βγήκε το αποτέλεσμα αυτό Με απλή αντικατάσταση Δηλαδή πήραμε τον τύπο, βάλαμε τα νούμερα εδώ πέρα Και βρίσκουμε το διάστημα εμπιστοσύνηση που είναι αυτό εδώ Τι μας λέει λοιπόν πάλι αυτό το διάστημα εμπιστοσύνηση Τώρα μπλέξαμε λίγο στα τεχνικά Και ξεχνάμε έτσι το τι γίνεται γιατί το κάνουμε όλο αυτό Ψάχνουμε να βρούμε ένα διάστημα εδώ πέρα Που αναφέρεται στη διαφορά μέσω τιμών Γιατί το κάνουμε γιατί από το διάστημα μπορούμε να κρίνουμε Και να συγκρίνουμε τις μέσες τιμές Εδώ λοιπόν επειδή είναι αρνητικό Είμαστε σε αυτή την περίπτωση Και άρα μπορούμε να αποφανθούμε στη σύγκριση Που αυτό το αποτέλεσμα τώρα δεν αναφέρεται στα δύο δείγματα Αναφέρεται σε όλες τις ασφάλειες Δηλαδή μπορώ να γράψω μια στατιστική αναφορά Και να την επισιμοποιήσω να την δημοσιωπήσω Ό,τι θέλετε να το κάνετε Η οποία είναι έγκυρη Γιατί μου λέει με βάση τα δείγματα που πήρα Θεωρώντας ότι τα δείγματα είναι αντιπροσωπευτικά και τυχαία Για τις ασφάλειες της κάθε εταιρείας Με βάση τα δείγματα λοιπόν βρήκα αυτό το διάστημα Το οποίο μου λέει ότι Το μέσο όριο που καίγονται οι ασφάλειες της πρώτης εταιρείας Είναι χαμηλότερο από τις δεύτερες Άρα, άμα πάρεις ασφάλεια εταιρείας α, Ξέρεις ότι μπορεί να σου καεί πιο νωρίς Σε πιο χαμηλό όριο ένταση ηλεκτρικού ρέμματος από της τη β Ορίστε Δεν το ξέρουμε αυτό Γιατί μπορεί η μέση τιμή τους να μην είναι στο 40 Να είναι στο 41 ας πούμε, ίσως 40,5 Αμνονομαστική Και αυτό είναι το συμπέρασμα λοιπόν Και εδώ έχουμε όλες τις Το πίνακα με όλες τους τύπους Βασικά οι δύο τύποι που έχουμε είναι αυτός εδώ πέρα ο ένας Και ο άλλος που έχει κάτω με τη student Ναι Προσέξτε το καλό, πολύ καλό ερώτημα Λέει το όνομα σου Ο Λάζαρος λέει άμα έχω τα διαστήματα εμπιστοσύνης Που μπορώ να τα βγάλω έτσι, άμα μου δώσεις εσύ το πρώτο δείγμα Μπορώ εγώ να πάω στο τύπο αυτόν εδώ για παράδειγμα Να υπολογίσω το διάστημα εμπιστοσύνης για το πρώτο δείγμα Και να βγάλω ένα διάστημα εμπιστοσύνης Για το πρώτο Να κάνω το ίδιο για το δεύτερο Να βγάλω ένα άλλο διάστημα εμπιστοσύνης, εδώ για παράδειγμα Και λες τώρα μήπως να τα συγκρίνω αυτά Δηλαδή αν για παράδειγμα εδώ είχα κάτι τέτοιο Ότι είσαι σίγουρα μικρότερο Δεν είναι η απάντηση Δεν αυτή η απάντηση Γιατί δεν μας διευκολύνει αυτό το πράγμα για να βγάλουμε αποτελέσματα Αυτό που θα μας δώσει τα αποτελέσματα είναι το διάστημα εμπιστοσύνης Για τη διαφορά μέσω αντιμών Και θα πρέπει να δούμε αυτό εδώ πέρα Δηλαδή το ότι βγάζεις εδώ πέρα, ότι φαίνεται να μην υπάρχει επικάλυψη σε αυτά τα δύο Δεν σημαίνει ότι διαφέρουν και άρα το πρώτο είναι πιο χαμηλά από το δεύτερο εκεί σε εδώ Όχι απαραίτητα Έπειτα μπορεί να έχεις και αυτήν εδώ την περίπτωση Σε ποια περίπτωση? Που δεν επικαλύπτονται Ούτε αυτό το ξέρουμε Όχι, γιατί δεν είναι η μεθοδολογία αυτή που θα σου βγάλεις στο συμπέρασμα Αυτό προσπαθώ να σου πω Και αν θέλετε να το πούμε λίγο πρακτικά Μην πάτε να το κάνετε τις εξετάσεις Είναι λάθος σαν μεθοδολογία, σαν προσέγγιση Σε μια τέτοια περίπτωση, ας πούμε Μπορεί εδώ πέρα να πεις υπάρχει επικάλυψη αλλά ενδεχομένως δεν υπάρχει διαφορά Και αν κάνεις με τον τύπο που έχουμε πει εδώ πέρα, συγκεκριμένα με αυτόν τον τύπο Να βγάλεις τελικά ότι υπάρχει κάτι τέτοιο Λοιπόν, θα μπορούσα να προχωρήσω στην άσκηση Αλλά επειδή θα την κάνουμε μισή και μετά θα ξανακάνουμε πάλι στα ίδια την άσκηση Γι' αυτό νομίζω ότι μπορούμε να σταματήσουμε εδώ πέρα Φου κάνετε και ωραία παζάρια Σας δεν τρέπεστε, 7 και 4 το πήγε Να σταματήσουμε εδώ πέρα Και την άλλη φορά που επαναλαμβάνω είναι στις 5 του μηνός Και θα κάνουμε την άσκηση