Διάλεξη 12: Δεν με ξέρετε, ούτε εγώ σας ξέρω, ούτε εσείς με ξέρετε, δεν ήμασταν μαζί στο προηγούμενο εξάμινο, στο πρώτο εξάμινο. Το όνομά μου είναι Δημήτρης Κουλιμπιτζούς, όπως το γράφει και εδώ πέρα στη διαφάνεια και είναι η πρώτη φορά που κάνουμε μάθημα και εγώ να είμαι διδάσκοντας στο τμήμα σας και εσείς να είστε φιτζητές. Γιατί μέχρι τώρα ήμουν στο κοινικό τμήμα, όπως και ο κύριος Ζιούντας που σας έκανε, το οποίο καταργήθηκε το καλοκαίρι και από φέτος πήγαμε σε άλλα τμήματα και οι δύο ήρθαμε στο τμήμα ηλεκτρολόγων. Οπότε μπορεί να μας ξαναδείτε τώρα, ενώ τα πεθαίνε τα χρόνια μας βλέπατε εμένα τουλάχιστον με βλέπατε για δυο μήνες και μετά δεν με ξαναβλέπατε. Τώρα μπορεί να με ξαναδείτε σε κάνα άλλο μάθημα που θα έχετε αργότερα, γι' αυτό προσοχή τη διαβογή σας εδώ πέρα, γιατί μπορεί να θυμάμαι φάτσες να ξέρω ποιοι είστε και τα λοιπά. Έχουμε και κάμερα όπως ξέρετε την έχετε συνηθίσει, τώρα την έχω και πολύ μπροστά μου, το άλλο μάθημα ήταν λίγο πιο μακριά, τώρα είναι φάτσα κάρτα. Λοιπόν, να σας πω λίγα πράγματα για το μάθημα πάλι να σας θυμίσω, θα σας τα είπω ο κύριος Γιούτας το πρώτο μάθημα, θα σας τα πω κι εγώ, χαίρομαι που βλέπω ότι είστε αρκετούτσι και εδώ πέρα, κλατηθήκατε δηλαδή. Στα πρώτα μάθηματα πόσοι ήσθαν, έτσι ήσθαν ή περισσότεροι, δέκα, έχουμε και ξυπνάδες, ξέχασα, πετάτε και τέτοιες ξυπνάδες. Δέκα είστε στο πρώτο μάθημα, ναι, ναι. Λοιπόν, να σας πω λίγο για το μάθημα που σας το είπε και ο κύριος Γιούτας στην αρχή του εξαμίνου. Λοιπόν, το μάθημα αυτό όπως σε άλλα τα μάθηματα έχει άριστα το 10, αλλά όπως και σε άλλα μάθηματα ο βαθμός μοιράζεται και στις εργασίες. Παίρνετε οκτώ μονάδες από τα γραπτά, το άριστα από τα γραπτά που μπορείτε να γράψετε τον Ιούνιο ή αρχές Ιουλίου όπου είναι οι εξετάσεις, η εξεταστική για το μάθημα. Θα πάρει τις οκτώ μονάδες και τις άλλες δύο τις πάρετε από τις εργασίες στο πρώτο και στο δεύτερο μέρος. Μία μονάδα για την εργασία στο πρώτο μέρος που είναι κάποιες ασκήσεις που δώσατε, θα δώσετε, δεν ξέρω, τις δώσατε? Έχετε ακόμα προθεσμία, 15 μέρες για να τις παρουσιάσετε ή να τις δώσετε μάλλον. Από εκεί λοιπόν θα πάρει την μία μονάδα, την άλλη μονάδα θα την πάρετε από το δεύτερο μέρος που θα κάνουμε εδώ τώρα μαζί. Υπάρχει μία ιδιωτερότητα όσον αφορά το βαθμό για το δεύτερο μέρος, έχει αλλάξει λίγο από ότι ήταν παλιότερα. Μπορείτε να το πάρετε είτε δίνοντας υπολογιστική εργασία, παραδίδοντας υπολογιστική εργασία, είτε παραδίδοντας μία θεματική εργασία. Τι σημαίνουν αυτά τώρα, θα σας τα εξηγήσω λίγο για να καταλάβετε. Υπολογιστική εργασία είναι, σας δίνω κάποια εδομένα με συγκεκριμένα ερωτήματα, θα πρέπει να τα δουλέψετε, να αναλύσετε τα εδομένα με τη βοήθεια ενός λογισμικού στατιστικού που λέγεται SPSS, να περάσετε τα αποτελέσματα από το λογισμικό σε ένα πρόγραμμα επεξεργασίας κειμένου όπως Word, πολύ σωστά. Άλλο, εγώ, εσείς ξέρετε και άλλα, κάτι ανοιχτού κώδικα, ανοιχτά, Open Office, LATECH, κανένας LATECH, όχι ακόμα, δεν φτάσει στη περιοχή, θα φτάσει σιγά-σιγά. Εν πάση περίπτωση δεν είναι μοτογόρ, το έχει κι άλλα, όπου θέλει ο καθένας μπορεί να περάσει τα αποτελέσματα, με τα σχόλια και απαντήσεις τα ερωτήματα. Όλο αυτό θα το ονομάσουμε σαν μια αναφορά, στατιστική αναφορά, την οποία μετά την υποβάλετε ηλεκτρονικά μέσω της ιστοσελίδας του e-TIMI. Αυτό είναι η υπολογιστική εργασία για την οποία, εάν τα κάνετε όλα σωστά, παίρνετε τη μία μονάδα. Αν κάνετε τα μισά, παίρνετε τη μισή μονάδα. Αν, για παράδειγμα, πάρω δύο εργασίες, τους κοιτάω και μοιάζουνε, σε ισαγωγικά, μοιάζουνε, μοιράζει το βαθμό στη μέση. Αν είναι τρεις εργασίες που μοιάζουνε, μοιράζει το βαθμό δια τρία και ούτω κατ' εξής. Το λέω επειδή έχουνε γίνει τέτοια πράγματα, το μοιάζουνε είναι η δική μου απόφαση. Άμα θέλετε μετά, τη συζητάμε, όταν θέλετε να δείτε τη βαθμολογία σας, έχουν να έρχονται παιδιά, έρχεται η βαθμολογία, λέει τι πήρας την εργασία, λέω πήρες ξέρω εγώ δύο, με άρισα το δέκα. Γιατί κύριε, τον κωδικό τον τάδε τον ξέρεις, όχι, είναι αυτός, είναι ο άλλος, μετά δεν συζητάμε παρα πάρα, φαίνεται δηλαδή ότι κάπου καταλάβανε γιατί μοιάζουν οι εργασίες. Προσπαθήστε να την κάνετε μόνη σας, συζητήστε, μιλήστε, τι έκανες εσύ, πώς το έκανες, ένα ερώτημα που είναι δύσκολο κτλ. Αλλά προσπαθήστε να την κάνετε μόνη σας, τα εδομένα φροντίζω να είναι διαφορετικά, να μην είναι για όλους τα ίδια, γι' αυτό και οι απαντήσεις φυσικά δεν μπορεί να είναι ίδιες. Και εκεί φαίνεται τι απαντάει ο καθένας. Αυτά όσα αναφορά την υπολογιστική εργασία. Να προσθέσω και κάτι ακόμα, στο πλαίσιο της υπολογιστικής εργασίας και όχι μόνο, και ως μέρος του μαθήματος, είναι τρία εργαστήρια συστατηστική. Τα οποία θα γίνουν στο εργαστήριο Την Ισίδα που είναι στο Ισόγειο αυτής της Πτερίγας, έχετε ξαναπάει εκεί πέρα για το δομμένο προγραμματισμό, τι κάνατε, δομμένο προγραμματισμό, είναι αυτή η αίθουσα των υπολογιστών. Εκεί λοιπόν θα πάμε να κάνουμε τα τρία εργαστήρια. Για τα τρία εργαστήρια πότε γίνονται και όλες οι πληροφορίες, μπορείτε να πάτε στην ιστοσελίδα του μαθήματος, είτε μέσω του e-timi με το τίτλο του μαθήματος, είτε στον καθρέφτη που είναι κάτω από τη δική μου την ιστοσελίδα. Να πάτε και να πάρετε πληροφορίες για το πότε είναι τα εργαστήρια για να μη σας λέω πότε είναι εδώ πέρα. Νομίζω το πρώτο εργαστήριο θα γίνει την επόμενη βδομάδα. Για εσάς αν θυμάμαι καλά είναι η επόμενη πέμπτη απόγευμα για τα εργαστήρια. Αυτά για την υπολογιστική εργασία. Να σας θυμίσω επίσης ότι τα εργαστήρια δεν τα χρειάζεστε μόνο για την υπολογιστική εργασία και στις εξετάσεις μπορεί στο μέρος της στατιστικής να έχω κάποιο ερώτημα που να σχετίζεται με το πακέτο του SPSS, όχι του στυλ πως κάνουμε αυτό, δηλαδή ποιο κουμπί πατάμε και τι κάνουμε, αλλά να έχει ένα σχηματάκι, ένα πινακάκι, κάτι που να είναι από το SPSS, το οποίο καλύστε να το έχετε κατανοήσει τι σημαίνει, τι δείχνει, τι είναι τα σύμβολα που έχει. Προσέξτε γιατί έχει και αγγλικούς όρους το SPSS. Μην ερωτάς τις εξετάσεις τι σημαίνει αυτό και το άλλο, δεν πρόκειται να σας πει κανένας. Αυτά όσον αφορά την υπολογιστική εργασία. Τώρα, θα υπάρχει δυνατότητα να παραδώσετε αντί της υπολογιστικής εργασίας θεματική εργασία, η οποία είναι κάποιο θέμα, το οποίο θα φαίνεται μέσα στη διαφάνιση που θα σας δείξω. Δεν θα είναι πολλά, καμιά 20 θέματα θα είναι, που σημαίνει μέχρι 20 άτομα μπορούν να πάρουν αυτή την εργασία και υπάρχει ένας τίτλος στο θέμα και καλύστε να μαζέψετε υλικό και να παρουσιάσετε για αυτό το θέμα. Μία μέρα που θα γνωρίσουμε που θα είναι στο τέλος του εξαμίνου, στο τέλος της εξεταστικής, θα συμπίπτει μαζί με την ημερομηνία, την προθεσμία μάλλον παράδοση της υπολογιστικής εργασίας. Εκεί τότε κάποια μέρα θα μαζευτούμε εδώ ή σε κάποια άλλη αίθουσα και θα παρουσιάσετε μία μία της εργασίας, θα κάνετε ερωτήματα από κάτω και τα λοιπά. Κάνα εξάλεπτο θα είναι η κάθε εργασία, 5-6 λεπτά, άρα 5-6 διαφάνιες χρειάζεται, όχι πολλές. Και ανάλογα με το πώς κάνετε την παρουσίαση, πώς απαντήσατε τις ερωτήσεις, πώς κάνατε εσείς ερωτήσεις σε άλλους και τα λοιπά, μπαίνει ένας βαθμός. Πάλι με άριστα το ένα. Αυτά όσον αφορά τη θεματική εργασία. Η θεματική εργασία δίνεται στη βάση ο πρώτος που τη ζητάει, την κατοχυρώνει. Σημαίνει ότι όταν εμφανίζονται εδώ πέρα τα θέματα και μου στείλει κάποιος ένα email και μου λέει ενδιαφέρομαι για αυτή την εργασία, όταν το απαντήσω θετικά, σημαίνει ότι έχει κατοχυρωθεί σε αυτόν η εργασία και δεν μπορεί να την πάρει άλλος. Αυτό βέβαια δεσμεύει και το άτομο που έχει δηλώσει το ενδιαφέρον, ότι όταν πάρει την εργασία, δεν μπορεί μετά να το μετανιώσει και να πει, εγώ δεν θέλω να κάνω αυτή την εργασία, να κάνω κάτι άλλο. Είτε μια άλλη θεματική εργασία, είτε υπολογιστική. Αν δεν κάνεις τίποτα άλλο, δεν θα πάει στη μονάδα. Οι εργασίες δεν είναι υποχρεωτικές ούτε του κυρίως γιούντα στο πρώτο μέρος ούτε στο δεύτερο μέρος, αλλά σας κόβουν βαθμούς αν δεν τις δώσετε, που σημαίνει ότι αν κάποιος δεν δώσει εργασία, θα πάρει το άριστα 8. Αν γράψει άριστα σε εξετάσεις, θα πάρει 8, αν δεν δώσει καμία εργασία. Επίσης, εάν κάποιος, για παράδειγμα, δώσει εξετάσεις και δεν πάει καλά και γράψει τέσσερα ή λιγότερο από τέσσερα, τέσσερα, ας πούμε, επί 0,8 βαθμός που περίνει 3,2, αν έχει δώσει όμως δύο άριστα στις εργασίες μπορεί να σκέφτεται ότι θα περάσει το μάθημα, γιατί συνδύω το 3,2 γίνεται 5,2, δεν θα το περάσει όμως, γιατί έχει γράψει κάτω από τη βάση. Άρα, θα πρέπει, επίσης, να γράψετε τις εξετάσεις και στη βάση ή κοντά στη βάση. Ένας, λοιπόν, που δεν έχει δώσει εργασίες, θα πρέπει να γράψει περίπου 6 για να περάσει το μάθημα. 6 επί 0,8 είναι 4,8 και περνάς το μάθημα στρογγυλοποιώντας το 5. Κατανοητά είναι όλα αυτά. Νομίζω δεν ξέχασα να σας πω κάτι. Όσον αφορά το SPSS το λογισμικό, αν κάποιοι θέλουν να το πάρουν για να το έχουν στον δικό τους, τον υπολογιστή, στο σπίτι, κτλ. Υπάρχουν πληροφορίες στην ιστοσελίδα για το πώς μπορείτε να το πάρετε. Τίποτα άλλο? Όχι. Ωραία, να ξεκινήσουμε, λοιπόν, το μάθημα. Εδώ, όπως βλέπετε, υπάρχουν 3 θέματα τα οποία θα πραγματευτούμε εδώ πέρα. Και υπάρχουν οι αντίστοιχες σημειώσεις για αυτά. Που σημαίνει ότι για την ύλη του μαθήματος που θα διδάξω εγώ εδώ πέρα στο δεύτερο μέρος, υπάρχουν σημειώσεις που τις έχω γράψει. Δεν μπορώ να σας δώσω σε έντυπη μορφή γιατί πλέον δεν μπορούμε να το κάνουμε, ξέρετε τους λόγους. Υπάρχουν ηλεκτρονικά, μπορείτε να τις κατεβάσετε. Κάποια από αυτά τα θέματα καλύπτονται εν μέρη από τα βιβλία που έχετε δηλώσει και έχετε πάρει για το μάθημα αυτό. Αλλά δεν καλύπτονται όλα τα θέματα. Και ο τρόπος που θα διδάξω εδώ πέρα το μάθημα θα είναι ακολουθώντας πιστά τις σημειώσεις. Οπότε κάποιος δηλαδή που έχει τις σημειώσεις έχει κατοχυρώσει ότι έχει όλη την ύλη που χρειάζεται για το μάθημα. Η διαφάνιση σημειώσεις, ό,τι άλλο χρειάζεται θα υπάρχει ηλεκτρονικά. Δηλαδή και αυτή η διαφάνεια τώρα το πλήθος μας να το διαφανιώνει. Υπάρχει ένα αρχείο που μπορείτε να το κατεβάσετε είτε από πριν είτε μετά για να δείτε και τα λοιπά. Καμιά ερώτηση? Είστε πολύ ήσυχοι και δεν ρωτάτε. Μου αρέσει. Μπράβο. Αλλά καλά είναι να κάνετε και ρωτήσεις όταν αρχίσουμε να μπαίνουμε λίγο στο θέμα. Θα πούμε κάποια εισαγωγικά πράγματα και μάλιστα σκεφτόμουν πριν να σας δείξω τα εισαγωγικά πράγματα. Να σας δείξω και κάποια άλλα θέματα για να μπούμε λίγο στο νόημα γύρω από το τι είναι η στατιστική. Ξέρετε όλοι ότι έχουμε δημοτικές και ευρωβουλευτικές εκλογές. Υπάρχει έτσι μεγάλη τρέλα με δημοσκοπίσεις τελευταία. Θα ξεκινήσω λίγο από τις δημοσκοπίσεις για να δούμε τα προβλήματα ποια είναι με τις δημοσκοπίσεις αλλά και γενικότερα τι σημαίνει η στατιστική. Λοιπόν, εδώ είναι από μια παλιότερη έρευνα. Βλέπετε ότι είναι Σεπτέμβριος-Οκτώβριος του 2013. Είναι μια εταιρεία, νομίζω ότι είναι εδώ στη Θεσσαλονίκη και αυτό το έχω πάρει από το site της εταιρείας νομίζω, αν θυμάμαι καλά. Είναι αυτό που λέει ταυτότητα έρευνας. Είναι κάτι που δεν το βλέπετε. Έχει δει καμιά δημοσκόπιση τα αποτελέσματά της σε κάποιο περιοδικό, εφημερίδα κτλ στο διαδίκτυο. Είναι υποχρεωμένος κανονικά όταν δημοσιοποιούνται οι δημοσκοπίσεις να έχουν και την ταυτότητα της έρευνας, για να δίνουν κάποιες πληροφορίες για την έρευνα. Αυτό που μας ενδιαφέρει εδώ πέρα κυρίως είναι αυτό εδώ, το δείγμα. Βλέπετε το πρώτο πράγμα που σας λέω στη στατιστική είναι το δείγμα, πόσο μεγάλο είναι το δείγμα. Γιατί από εκεί εξαρτιώνται πόσο καλά, σε ισαγωγικά θα δούμε ότι είναι το καλά, είναι τα αποτελέσματά σου. Τι λέτε αυτό το δείγμα είναι μεγάλο ή μικρό, πώς το βλέπετε, χιλιάτομα σε μια δημοσκόπηση. Μικρό, ε. Συ θα έλεγες μεγάλο. Δεν έχει σημασία το δείγμα. Δεν έχει σημασία το δείγμα, μη μου το λες αυτό. Δεν έχει σημασία το μέγεθος. Το δείγμα δεν έχει σημασία το μέγεθος του δείματος. Στο σύνδυμα 3 είναι, ας πούμε, αν μας δίνει 20% για κάτι, δίνει 23-17%. Α, δίνει την ακρίβεια. Άρα λοιπόν, αυτό όμως το βλέπετε πουθενά στις ειδήσεις που έχουν, στα debate, βλέπετε πουθενά να λέει την ακρίβεια. Σου λέει 21-18 άλλος. Μάμα είναι συμπλητεία. Σημαίνει ότι μέσα στο 17-23 είναι το πραγματικό ποσοστό. Μπορεί να είναι οπουδήποτε εκεί μέσα. Άρα λοιπόν, παίζει μεγάλο ρόλο να γνωρίζουμε και την ακρίβεια. Αυτό θέλει να κάνει η στατιστική, αυτό προσπαθεί να κάνει. Όχι μόνο να σου δώσει απλά ένα ποσοστό, αλλά να σου βγάζει και ένα συμπέρασμα. Γιατί αυτό το simple 3 που βάζει εδώ πέρα, αν έχεις ένα 20 με το simple 3 το 17-23, σου λέει ποιο είναι το ποσοστό σε όλο το δήμο των Αθηναίων. Το πραγματικό ποσοστό που θα το ήξερες αν έκανες εκλογές. Θα το ξέρουμε μετά τις εκλογές. Άρα το να πεις μόνο το ένα ποσοστό δεν παίζει ρόλο. Και αυτό το διάστημα επιστροφή σε 95%, τι να λέει αυτό το 95%? Λέει με πόσο σιγουριά μπορώ να σου πω αυτό το διάστημα. Ότι είναι εδώ μέσα με μια σιγουριά 95%. 3 λοιπόν το 100, είναι τόσο καλό αυτό το 3. Δεν είναι και τόσο αξιόπιστο όταν ακούς ένα ποσοστό με ένα simple 3 το 100. Εάν πάμε σε άλλες... Και πόσο μεγάλο είναι το ποσοστό. Ποσοστό που είναι με πιο μεγάλο ποσοστό νομίζω ότι είναι αυτό εδώ πέρα. Είναι μια παλιότερη έτσι η μελέτη που είχε δημοσιευτεί στο βήμα. Που ήταν το 2010 όπως βλέπετε εδώ. Το ερώτημα νομίζω απασχολεί πολύ νέο κόσμο. Θέλω να φύγω από την Ελλάδα εδώ και 4 χρόνια το ίδιο λέμε. Το οποίο αν θα δούμε εδώ πέρα να αυξήσω και λίγο το μέγεθος. Βλέπετε ότι στην ταυτότητα της έρευνας έχουμε 5.400. Μεγάλη έρευνα αυτή. Το άλλο τα χίλια μόνο εδώ είναι 5.400. Και αν πάμε πιο κάτω έχει διάφορα περιγραφή στην ταυτότητα της έρευνας. Τυχαία δείγματοληψία. Πάλι έρχεται αυτό το ίδιο. Τυπικός αντιστοιχικός σφάλμα. Μέγεθος το σφάλμα 1,33. Άρα τι παρατείνουμε. Όταν πήγαμε από χίλια σε 5.500, τα λέω έτσι προσεγγιστικά. Το σφάλμα έπεσε από το 3 και κάτι που ήταν πήγε στο 1,3. Άρα λοιπόν θα ήτανε πραγματικά η ευχή του στατιστικού να έχουμε μεγάλο δείγμα. Αλλά δυστυχώς δεν το έχουμε το μεγάλο δείγμα. Γι' αυτό όταν ακούμε αποτελέσματα θα πρέπει να είμαστε λίγο προσεκτικοί. Το πρώτο πράγμα πρέπει να ρωτήσουμε πόσο είναι το δείγμα. Πόσο μεγάλο είναι το δείγμα. Γιατί με 5.500 χιλιάδες το σφάλμα συμπλήνει 1,3 τα 100. Με χίλια γίνεται συμπλήν 3 ακόμα κάτι. Λοιπόν να μη σας κουράσω άλλο με αυτά τα στατιστικά. Ας γυρίσουμε πίσω στο θέμα μας εδώ. Λοιπόν αυτό λοιπόν που θέλουμε να κάνουμε στη στατιστική είναι να βγάλουμε συμπεράσματα για όλο το σύνολο. Το πληθυσμό όπως λέμε από ένα δείγμα που παίρνουμε από ένα μικρό υποσύνολο του πληθυσμού. Και πότε πρώτα θα ξεκινήσουμε να συζητήσουμε πότε μπορούμε να χρησιμοποιήσουμε τη στατιστική και τις πιθανότητες. Γιατί η στατιστική βασίζεται στις πιθανότητες. Αν έχουμε βέβαια φαινόμενα, αν υπάρχει βεβαιότητα στην περιγραφή του φαινομένου που έχουμε, τότε δεν χρειάζεται η στατιστική. Χρειάζεται καθοριστικές μεθόδους. Καθοριστικές, αιτιοκρατικές, δετερμενιστικές, όλες αυτές οι λέξεις μείνουν το ίδιο πράγμα. Δηλαδή μπορείς να τα περιγράψεις με εξισώσεις και τελείωσες. Αν λοιπόν μπορείς να περιγράψεις το φαινόμενό σου με εξισώσεις, δεν μπαίνει πουθενά η αβεβαιότητα, τότε δεν χρειάζεται τη στατιστική. Και εδώ ένα ερώτημα το οποίο έχουμε μια βέβαιη απάντηση. Όχι προσεγγιστική, βέβαιη απάντηση. Μπορείτε να απαντήσετε σε αυτό το ερώτημα. Δεν μπορείτε. Κανένας την απάντηση. Όχι. 9 λεπτά. Πώς το βρήκες. Απλή μέθοδο των τριών. Τα 60 λεπτά 20 χιλιόμετρα, τα 3 χιλιόμετρα πόσα λεπτά, κάνετε την πράξη βρίσκετε εννέα. Άρα δεν υπάρχει κάποια αβεβαιότητα εδώ πέρα. Βέβαια θεωρούμε ότι κάποιος ξεκινάει από το ένα άγρο της παραλίας για να πάει στο άλλο, ξεκινάει με σταθερή ταχύτητα, είναι σε εκείνη την κίτρινη. Έχει πάει κανένας στον διάδρομο, έχει πάει κανένας στην παραλία, ένας κίτρινος διάδρομος, δεν μπαίνουν παιδάκια μέσα, δεν κυκλοφορεί άλλοι, δεν έρχονται πολλά ποδήλατα από την αντίθετη μεριά, να πατήσεις φρένο και τα λοιπά, έχει σταθερή ταχύτητα. Τέτοια προβλήματα υπάρχουν στη φύση. Μόνο αυτό ίσως. Ίσως να είναι και το μόνο. Ποια είναι η θέση της Γης έως προς τον ήλιο, την πρωτοχρονιά του 2014, όχι του 2013, την επόμενη πρωτοχρονιά, είναι η διαφάνιση από πέρσι. Εδώ πέρα είναι ένα από τα λίγα προβλήματα στα οποία μπορούμε να απαντούμε με μεγάλη ακρίβεια. Γιατί, υποθέτουμε ότι δεν υπάρχουν τριβές εδώ πέρα, δεν υπάρχει τυχαιότητα και μπορούμε να περιγράψουμε την κίνηση των πλανητών μέσα από καθοριστικές μεθόδους. Υπάρχουν εξισώσεις, αν πάτε στο αστεροσκοπείο και κάνετε αυτή την ερώτηση, μπορεί κάποιος να χρησιμοποιήσει τις εξισώσεις σε ένα προγραμματάκι να σας βγάλει την απάντηση και να πει εκεί θα είναι η Γη έως προς τον ήλιο, η θέση της. Αλλά τέτοια προβλήματα δεν είναι πολλά, είναι πολύ σπάνιο να βρούμε τέτοια προβλήματα. Συνήθως στα προβλήματα που έχουμε μπαίνει μέσα η αβεβαιότητα. Και εδώ καταφέρνουμε στατιστική, σε στατιστικές μεθόδους. Βλέπετε λοιπόν ότι η στατιστική είναι πολύ σπουδαίο πεδίο γνώσης για εσάς που είστε ηλεκτρολόγοι γιατί στα φαινόμενα που θα ασχοληθείτε θα υπάρχει πάντα η τυχαιότητα. Και πολύ συχνά θα το λέτε θόρυβο. Όπου ακούν τη λέξη θόρυβος, δεν είναι ότι κάποιος τυπάει την πόρτα και κάνει θόρυβο ή κάτι τέτοιο, είναι αυτό που μπαίνει το τυχαίο που δεν μπορείς να το ερμηνεύσεις. Και άνα σας ρωτούσα ας πούμε πόση ώρα κάποιος κάνει τη διαδρομή, όχι αεροδρόμιο, πολιτεχνείο, αλλά ας πούμε πόση ώρα κάνετε να έρθετε από το σπίτι σας στο πολιτεχνείο το πρωί. Εξαρτάται από την κίνηση, σωστά, εξαρτάται, αλλά άνα σας ρωτούσα το όνομα σου. Δημήτρης. Δημήτρης, είναι ονόματες. Πόση ώρα, Δημήτρη, κάνεις να έρθεις στο πολιτεχνείο το πρωί. Εκοδύνατο ημέρα του. Α, τώρα εσύ παίρνεις και διαφορετικά μέσα. Δε ρωτήσαμε τον κατάλληλο άτομο, γιατί ένας που παίρνει ένα μέσο κάθε φορά, έρχεται με τα πόδια, ή παίρνει συνέχεια το λεωφορείο, ή έρχεται συνέχεια με το ποδήλατο. Ο Δημήτρης έχει δύο μέσα. Εσύ πόσο είναι το όνομα? Λάζαρος. Γεια σου Λάζαρε. Εγώ έχω το μεταβόνι για να κάνω 10 με 15 λεπτά. 10 με 15 λεπτά. Ο Λάζαρος είναι έτσι φαρδίς, 10 με 15 λεπτά, το είπες σίγουρο. Αλλά αν έλεγες με μία τιμή, τι θα έλεγες? 12, 12,5? Κάπου εκεί. Δεν μπορούμε να δώσουμε μία απάντηση, έτσι. Δηλαδή δεν υπάρχει μία απάντηση όπως το παραπάνω. Αυτό που προσπαθούμε να κάνουμε είναι κάτι προσεγγιστικό ενδεχομένως. Αν ο Λάζαρος λέει 10 με 15, στην ουσία βάζει ένα διάστημα για να ορίσει, όπως λέγαμε για το διάστημα για τα ποσοστά, θυμάστε, που λέγαμε 17 με 23%, ένα δέστιο διάστημα που λέει μέσα εκεί είναι ο μέσος χρόνος που κάνει για να έρθει στο πανεπιστήμιο. Ή αν πει ο άλλος ότι κάνω 15 λεπτά με το λεωφορείο και τα λοιπά, είναι κάτι που στο μυαλό μας σκεφτόμαστε πόσες φορές ήρθαμε, πόσο κάναμε, κατά μέσο όρο κάπου εκεί. Άρα δεν είναι μια απάντηση ακριβής, αλλά προσεγγιστική. Χρησιμοποιούμε, για παράδειγμα, τη μέση τιμή. Ένα άλλο μέτρο για να προκαθορίσουμε το κέντρο. Ποιο θα ήταν αντί να πούμε μέση τιμή? Η διάμεσο. Η διάμεσο στις τι είναι? Η τιμή που χωρίζει το παρατηρήσεις. Η τιμή που χωρίζει το παρατηρήσεις τη μέση, που είναι στο κέντρο το παρατηρήσω. Αν λοιπόν εγώ εδώ πέρα έχω, όχι τον Λάζαρο γιατί έρχεται με τα πόδια, εσύ που μιλάς με τι έρχεσαι? Μελοφορείο. Μελοφορείο. Πώς σε λένε? Μελοφορείο. Από πού έρχεσαι Φίλιππε? Από την Πολύχνη. Από την Πολύχνη, μελοφορείο. Ο Φίλιππε πόση ώρα κάνει περίπου, αν θα σε ρωτούσα τι θα μου απαντούσες? Μισάωρο. Μισάωρο. Εδώ βάζουμε το 30 λεπτά, λοιπόν, το 30 λεπτά. Αλλά μπορεί, αν πάρουμε τις διάφορες μέρες που ο Φίλιππος ερχότανε με το λεωφορείο της Πολύχνης, εδώ είναι ας πούμε το 25 λεπτά, το 30, εδώ είναι το 35, εδώ είναι το 40 κτλ. Τις περισσότερες φορές, μια μέρα έρχεται κάνει 27 λεπτά, την άλλη κάνει 29.5, την άλλη 31. Μπορεί να έχουμε πολλές μέρες γύρω από το 30, αλλά μπορεί κάπου να είχε τρακάρει κάποιος στο δρόμο να καθυστέρησε κτλ. Και να έκανε και μια φορά 50 λεπτά. Άρα να έχουμε εννιά μέρες, ας πούμε, γύρω στο 30 και μια μέρα να έκανε 50 λεπτά. Τι θα χρησιμοποιήσετε για να με απαντήσετε στο ερώτημα πόση ώρα κάνεις να έρθεις από το σπίτι σου στο Πολυτεχνείο. Τη διάμοσο. Τη διάμοσο. Γιατί? Γιατί άμα βάλουμε τη πέστη φορά θα μακρύνει. Θα την μακρύνει, έτσι, άρα μπορεί δηλαδή άμα βάλουμε στο μυαλό μας και πάρουμε το μέσο όρο, άθρισμα διαπλήθος δηλαδή, να βγάλουμε μια τιμή που να είναι πιο κοντά στο 35 ή στο 40 ακόμα, παρά εκεί γύρω από το 30 που είναι η πιο καθοριστική. Ενώ αυτή είναι εδώ, ή τη βάλεις εδώ, ή τη βάλεις εδώ, δεν παίζει ρόλο. Βλέπετε λοιπόν τη στατιστική, έχουμε πολλά εργαλεία, δεν έχουμε μόνο ένα. Τώρα άμα πάτε σε κάνα φίλο σας που δεν είναι στο πολιτεχνείο, ας πούμε, ή δεν είναι στο πανεπιστήμιο και του πείτε, ξέρεις, η διάμεσος του χρόνου που πηγαίνω στο πολιτεχνείο το πρωί είναι 30 λεπτά. Θα καταλάβει τίποτα άμα του πείτε έτσι. Τη λέξη διάμεσο την ξέρει κανένας. Άμα του πει το μέσος όρος, κάνω περίπου 30 λεπτά το καταλαβαίνουν, αλλά η διάμεσος είναι αδικημένη. Δεν την ξέρει κανένας τη διάμεσο. Τη στατιστική όμως, έχουμε πολλά εργαλεία για αυτό και πρέπει να ξέρουμε ποιο εργαλείο θα χρησιμοποιήσουμε. Καλά, αυτό ήταν ένα παράδειγμα για αυτό, αλλά θα το δούμε πάλι μπροστά μας. Υπάρχουν βέβαια και άλλα ερωτήματα. Αυτό το είχα πάρει από το διαδίκτυο Πέρσι νομίζω στο νοσέ, όπου έχει τα δρομολόγια Αθήνα-Θεσσαλονίκη και λέει εκεί πέρα ότι το inner city από την Αθήνα για Θεσσαλονίκη τον 11 και 40 έρχεται 16 και 43. 16 και 43. Πού πήγα και το βρήκα αυτό και το γράψανε. Μιχαλάκι για τη Γερμανία σε βλέπω σε. Μόλις στη Γερμανία γίνονται αυτά. Άλλη στη Νορβηγία δεν γίνονται ας πούμε. Εντάξει τώρα πήραμε την πιο αναφημένη χώρα. Ναι. Αλλά όμως το γράφει 16 και 43. Πού το βρήκαν το νούμερο και το βάλανε. Τι επιφότηση είχανε. Ναι Φίλιππε. Ναι. Βέβαια όσοι παίρνουν το, δεν ξέρω, παίρνει κανένα στο Αθήνα-Θεσσαλονίκη το τρένο. Όχι έχουν και κάτι στερίστρο. Αλλά και εκεί προφανώς μπορεί να κάνα κάτι τέτοιο. Να δοκιμάσανε κάποια δρομολόγια, να μετρήσανε το χρόνο και να πήραν μια τιμή που είναι αντιπροσωπευτική. Να είναι η διάμεσος, η μέση τιμή και τα λοιπά. Λοιπόν υπάρχουν και πολλά άλλα παραδείγματα που είναι πιο κοντά στο δικό σας το αντικείμενο. Αυτά τα ερωτήματα εδώ πέρα ή τα παραδείγματα είναι αντιπροσωπευτικά και για την ύλη του μαθήματος. Ποια είναι η τάση διάσπασης ενός τύπου ελεκτρικού κυκλώματος. Σε ποιο όριο καιγονται οι ασφάλιες 40 μπέρ κάποιας εταιρείας παραγωγής. Όπου θέλουμε να εκτιμήσουμε κάτι όπως εδώ εκτιμήσαμε το μέσο χρόνο της διαδρομής. Εδώ μιλάμε για το μέσο όριο που καίγονται οι ασφάλιες, για τη μέση τάση διάσπασης του κυκλώματος. Ή να συγκρίνουμε για παράδειγμα στο τρίτο ερώτημα καταναλών περισσότερο ελεκτρικό ρεύμα οι κατοικίες στην πόλη Α και Β. Αυτά τα ερωτήματα λοιπόν θα μπορούμε να τα απαντήσουμε εδώ, αλλά όχι με αναφορά στο δείγμα των παρατηρήσεων σε αυτές τις γραμμούλες μόνο εδώ, αλλά σε όλο τον πληθυσμό. Αυτό είναι το αντικείμενο λοιπόν του μαθήματος μας εδώ πέρα. Τώρα, στη διαδικασία της σατιστικής έχει τρία βήματα. Το πρώτο είναι που το βλέπετε το γράφω έτσι με μικρά γράμματα, η συλλογή των εδομένων, αυτό που λέμε δείγματοληψία. Το δεύτερο είναι η περιγραφή των εδομένων, η περιγραφική σατιστική. Αυτό είναι που θα κάνουμε στο σημερινό μάθημα, με αυτό θα ξεκινήσουμε. Το τρίτο που είναι και το σημαντικό είναι η συμπερασματολογία, δηλαδή να βγάλουμε συμπεράσματα από το δείγμα που έχουμε για τον πληθυσμό χρησιμοποιώντας κάποια εργαλία, βγάζοντας κάποια αποτελέσματα. Λοιπόν, να το δούμε σε ένα παράδειγμα, κατανάλωση ηλεκτρικού ρεύματος. Θέλουμε λοιπόν, σας έχω εδώ εσάς φοιτητές, λέω παιδιά σας βάλω μια εργασία και επειδή έχω ένα πρόβλημα ότι θέλω να συγκρίνω την κατανάλωση ηλεκτρικής ενέργειας σε δύο πόλεις, σε στέλνω σε μία πόλη, να πούμε σε δύο περιοχές για να το κάνουμε πιο απλό το πρόβλημα εδώ πέρα στη Θεσσαλονίκη, σε δύο περιοχές α και β, θα πρέπει να πάω να πάρω διαμερίσματα στα νοικοκυριά, να ρωτήσω πόσο ρεύμα ξοδεύουν και να μαζέψω τα εδομένα. Και θέλω να πάει στην Τούμπα, ας πούμε, ή στην Καλαμαριά, δύο περιοχές. Πώς θα κάνετε τη δείγματοληψία, να πάτε ας πούμε σε είκοσι διαμερίσματα στην Τούμπα, ή σε μια συνικία γενικά, πώς θα επιλέγατε τα διαμερίσματα. Αυτό είναι το ερώτημα που αναφέρετε στη συλλογή δεδομένων στη δείγματοληψία. Έχει αναχεί ότι δεν θα το κάνουμε, απλά θα το συζητήσουμε λίγο, αλλά δεν θα το δούμε συστηματικά. Αλλά για να είμαι σίγουρος ότι ξέρετε να το κάνετε, γι' αυτό σας ρωτάω. Σας βάζω σαν άσκηση, θα πάτε σε είκοσι διαμερίσματα στην Τούμπα, να ρωτήσετε, να χτυπήσετε την πόρτα και να ρωτήσετε από το λογαριασμό της ΔΕΙ, πόσο ξοδέψανε στο τελευταίο τετράμινο. Ναι, ο Δημήτρης, είναι ο όνομα τους. Σίγουρα όχι όλους τους διαμερίσματα στην ίδια πολυκατοικία. Όχι στην ίδια πολυκατοικία, σωστά. Πόσα επιλέγεις τις πολυκατοικίες, λοιπόν. Σωστά ότι έπαιρνες ένα από κάθε πολυκατοικία. Τις είκοσι πολυκατοικίες πώς θα τις επέλεγες. Όχι πάνω στον ίδιο δρόμο, για να έχει πολλή διαφορετική περιοχή. Και θα έπαιρνα κάποιες παντές, κάποιες καινούργιες. Άρα θα έπαιρνες υπόψιο την παλαιότητα της πολυκατοικίας. Ναι, το όνομά σου. Πάνω. Το μέγεθος του κοινού, τόσο μεγάλο είναι, τα άτομα που κατοικούν έχουν σ' αυτό, αλλά δεν έχουν σ' αυτό. Ναι, αυτό όμως είναι πολύ δύσκολο να το προκαθορίσουμε από πριν. Δηλαδή, να πάω να ρωτάω, να χτυπάω την πόρτα, να λέω πόσοι μένετε εδώ, πόσο είναι το όγκος, και να έχω προκαθορίσει να πάρω κάποιες κατηγορίες νοικοκυριά με ένα άτομο, με δύο, με τρία και με τέσσερα, για να χωρίσω, ας πούμε, να πάρω πέντε απ' το κάθε τύπο, κτλ. Αρχίζει και γίνεται δύσκολο το πράγμα, λοιπόν. Πάντως, σίγουρα, δεν είναι εύκολο το πώς θα κάνουμε την δειγματολειψία. Δεν θα ασχοληθούμε όμως μ' αυτό, σας αποθάρινα τώρα, ενώ είπατε κιόλας τη γνώμη σας. Θα γυρίσουμε σ' αυτό σε κάνα δεκά λεπτό και θα το ξαναδούμε το πρόβλημα, αλλά ας πούμε, προς τη στιγμή, ότι με ένα τυχαίο και αντιπροσωπευτικό, που να καλύπτει αυτά που είπατε τώρα, τυχαίο, όχι στην ίδια πολυκατοικία, όχι στον ίδιο δρόμο, αντιπροσωπευτικό, του να έχουμε και παλιά κτίρια και καινούργια κτίρια, να έχουμε και νοικοκυριά μικρά και μεγάλα, μεγάλους και μικρά διαμερίσματα, άρα και τυχαίο και αντιπροσωπευτικό δείγμα, ότι το κάναμε. Το δεύτερο βήμα είναι αυτό που λέει περιγραφική στατιστική, δηλαδή τι, να πάρω τις παρατηρήσεις και με κάποιο τρόπο να τις δω, με κάποια σπίνακες, γραφήματα και να υπολογίσω κάποια στατιστικά, που αντιπροσωπεύουν τις παρατηρήσεις. Το τρίτο όμως και το σημαντικό είναι να απαντήσω στο ερώτημα. Το ερώτημα όμως δεν μου λέει για τα δείγματα τίποτα, μου λέει για τις περιοχές. Δηλαδή, διαφέρει η μέση κατανάλωση ηλεκτρικής ενέργειας στην Τούμπα και στην Καλαμαριά, αυτό είναι το ερώτημα. Άρα, καλούμαι εγώ ότι από αυτές οι παρατηρήσεις που έχω πάρει, να βγάλω συμπεράσματα για το αν υπάρχει στατιστικά σημαντική διαφορά στην μέση κατανάλωση ηλεκτρικού ρεύματος στην Τούμπα και στην Καλαμαριά, να βγάλω λοιπόν συμπεράσματα για το πληθυσμό. Για αυτό θα χρειαστεί να χρησιμοποιήσω κάποια στατιστικά εργαλεία. Καταλαβαίνετε ότι προσπαθούμε να απαντήσουμε σοβαρά πράγματα εδώ πέρα, δεν παίζουμε δηλαδή. Παίζεις ένα δειγματάκι με 20 παρατηρήσεις και θες να βγάλεις συμπέρασμα για ένα πληθυσμό με 10.000 άτομα, 50.000 άτομα. Πριν περάσουμε στο πρώτο που είναι η περιγραφική στατιστική, στην πρώτη ενότητα, να δούμε κάποιους όρους εδώ πέρα, τους οποίους λίγο πολύ τους έχετε ακούσει. Τυχαία μεταβλητή όλοι ξέρετε τι είναι, την κάνατε στο πρώτο μέρος του μαθήματος. Μια μεταβλητή που αλλάζουν τυχαία οι τιμές. Εδώ το λέμε, αλλάζει η τιμή σε κάθε στοιχείο του πληθυσμού. Θα θεωρούμε ότι η τυχαία μεταβλητή ορίζεται σε έναν πληθυσμό. Ας πούμε, το δρομολόγιο του τρένου, είναι όλα τα δρομολόγια των τρένων, τυχαία μεταβλητή, ο χρόνος του δρομολογίου του τρένου. Το ύψος των φοιτητών μπορεί να είναι μια τυχαία μεταβλητή. Το χρώμα των ματιών των φοιτητών μπορεί να είναι τυχαία μεταβλητή. Για κοιτάξτε τον ορισμό, οποιοδήποτε χαρακτηριστικό του οποίο η τιμή αλλάζει στα διάφορα στοιχεία του πληθυσμού. Άρα είναι τυχαία μεταβλητή. Παρακαλώ, θα πω ότι ο πληθυσμός είναι όλοι αυτοί που τρώνουν τη Λέσχη. Και βάλω ένα αρατοματό λόγιο και πω, παιδιά, χαρακτηρίστε το φαγητό που φάγατε. Κακό, μέτριο, καλό, πολύ καλό. Είναι τυχαία μεταβλητή. Ο πληθυσμός είναι όλοι αυτοί που τρώνουν τη Λέσχη. Η τυχαία μεταβλητή είναι η άποψη αυτοί που τρώνουν τη Λέσχη για το φαγητό, όπου χαρακτηρίζεται με τέσσερις κατηγορίες. Κακό, μέτριο, καλό, πολύ καλό. Είναι τυχαία μεταβλητή. Είναι. Αλλά είναι διακριτή. Το χρώμα των ματιών είναι διακριτό. Αν πω ότι έχω τέσσερις κατηγορίες. Γαλάζια, πράσινα, καφέ, μαύρα. Πάλι τέσσερις κατηγορίες. Είναι διακριτές. Διαφέρουν αυτοί οι δύο μεταβλητές, τυχαίες. Χρώμα ματιών και άποψη για το φαγητό. Και οι δύο διακριτές, τέσσερις κατηγορίες. Κάτι διαφέρουν. Πέρα από τον πληθυσμό που αναφέρονται. Σωστό γι' αυτό. Στον πληθυσμό που αναφέρονται. Άλλο, τι τύπου μεταβλητές είναι και οι δύο. Διακριτές είπατε ή ποιοτικές, αν θέλετε να το πούμε. Έχουν όμως μια διαφορά. Μπορείς να κατατάξεις τις κατηγορίες όσον αφορά το χρώμα των ματιών. Όχι, βέβαια. Τι θα πεις, ο μαυρομάτης είναι καλύτερο από τον καστανωμάτη. Το φαγητό όμως, καλά. Άρα η διαφορά είναι ότι είναι διατακτικές. Εμείς εδώ δεν θα ασχοληθούμε τόσο πολύ με διακριτές, γι' αυτό και δεν ευαθύνω περισσότερο. Οι μεταβλητές που θα έχουμε θα είναι τύπου ποσοτικού. Θα είναι ποσοτικές μεταβλητές, δηλαδή θα παίρνουν τιμές σε ένα διάστημα. Όπως εδώ πέρα, όριο τάση ηλεκτρικού ρεύματος παίρνει τιμές γύρω από το 40 μΩ. Σε ένα διάστημα γύρω από αυτό. Λοιπόν τα δεδομένα που είναι το σύνολο των τιμών και όπως ήδη έχουμε πει, το πληθυσμό που είναι το μεγάλο σύνολο για το οποίο θέλουμε να βγάλουμε συμπεράσματα και δείγμα το υποσύνολο, το μικρό υποσύνολο για το οποίο έχουμε μετρήσεις. Και έχουμε την παράμετρο, και εδώ είναι το σημαντικό τώρα, είναι ένα μέγεθος που συνοψίζει τις τιμές στον πληθυσμό, στιγές μεταβλητής, όπως είπαμε η μέση τιμή, που μετράει πού είναι το κέντρο μας λέει, η διασπορά που μας λέει πόσο σκόρβιες είναι τιμές, αυτή είναι η παράμετρο στον πληθυσμό. Από κάτω ακριβώς είναι το στατιστικό, που είναι το αντίστοιχο μέγεθος αλλά που αναφέρεται στο δείγμα. Όπως δηλαδή η δειγματική μέση τιμή, η δειγματική διασπορά και τα λοιπά. Τώρα, αυτά όλα τα κάνατε στις πιθανότητες, ξεκινούσατε από μια τυχαία μεταβλητή, λέγατε, να η συνάρτηση πυκνότητας πιθανότητας αν είναι συνεχής ή συνάρτηση μάζας πιθανότητας αν είναι διακριτή. Να και η αθροιστική και πόσο μπορούμε όταν γνωρίζουμε τη συνάρτηση να βρούμε τη μέση τιμή και τη διασπορά της, το μη και το σίγμα τετράγωνο και λέγατε, αν έχω εγώ μια τυχαία μεταβλητή και στα προβλήματα, αν κοιτάξω κάποιο χαρτί από αυτά που σας έδωσε ο κύριος Ζούτας λέει κάπου, έστω η τυχαία μεταβλητή αυτή που ακολουθεί κανονική κατανομή με κάποια μέση τιμή και κάποια διασπορά, δηλαδή γνωρίζετε την κατανομή ή έστω ότι γνωρίζετε την κατανομή και μετά θέλετε να βγάλετε κάποια συμπεράσματα για την κατανομή του τύπου. Ποια είναι η πιθανότητα αν έχω μια τυχαία μεταβλητή που είναι ο χρόνος της διαδρομής του τρένου Αθήνα-Θεσσαλονίκη, που ακολουθεί κανονική κατανομή με μέση τιμή ας πούμε 5,5 ώρες και τυπική απόκλειση 10 λεπτά, ποια είναι η πιθανότητα να κάνει 5 ώρες και 40 λεπτά και παραπάνω. Βλέπατε λοιπόν την πιθανότητα του χ να είναι μεγαλύτερο από κάποια τιμή. Εδώ στη στατιστική το μόνο που έχουμε είναι παρατηρήσεις. Άρα αυτό που γνωρίζουμε είναι μόνο κάποια τιμές της τυχαίας μεταβλητής. Και θέλουμε να βγάλουμε συμπεράσματα για το τι είναι αυτή η τυχαία μεταβλητή, τι κατανομία έχει. Αν δεν μπορούμε να πούμε για όλη την κατανομή, δηλαδή για τη συναρτήση, πυκνότητες, πιθανότητες ή την αθληστική, τουλάχιστον να πούμε για τις παράμετρες, πού είναι το κέντρο της, πόσο είναι το σκόρπισμα. Αυτά λοιπόν είναι τα θέματα που θέλουμε να απαντήσουμε εδώ πέρα, να αντιμετωπίσουμε και τα βασικά είναι αυτά τα δυο τοξάκια. Δηλαδή από το δείγμα πάμε στον πληθυσμό, θέλουμε να βγάλουμε συμπεράσματα για το πληθυσμό και από το στατιστικό που μπορεί να είναι ο μέσος όρος ένα δείγμα, όπως από αυτές τις γραμμούλες βγάζουμε το μέσο όρο, να πάμε να δώσουμε ένα διάστημα και να πούμε ότι μέσα εκεί για παράδειγμα είναι η παράμετρός μας. Η παράμετρος λοιπόν είναι σταθερή και άγνωστη. Αν μιλήσω για το παράδειγμα της τυχαίας μεταβλητής που είναι το ύψος των φοιτητών και παράμετρος είναι το μέσο ύψος, το μέσο ύψος των φοιτητών των 70.000 φοιτητών που είναι καταγραμμένοι για φέτος το ξέρει κανένας, όχι έτσι, άρα είναι άγνωστο, είναι σταθερό για φέτος που είναι 70.000 καταγραμμένοι, είναι σταθερό, αλλά άγνωστο. Αν πάω όμως σε ένα δείγμα και πάρω ένα δείγμα από εσάς εδώ και πω από αυτό το δείγμα είστε 50 άτομα άρα έχω το μέσο όρο, ο μέσος όρος είναι γνωστός, αν έχω τα 50 ύψη από εσάς που μπορώ να τα γράψω να τα μάθω μπορώ να το ξέρω. Αν πάω σε μια διπλανή έδωση που έχει άλλα 50 άτομα και πάρω τα ύψη από τα 50 άτομα εκεί και πάρω το μέσο όρο, πάλι γνωστό θα είναι αλλά θα αλλάζει. Το πρόβλημα λοιπόν είναι ότι το στατιστικό είναι μεταβλητό. Από αυτό λοιπόν το στατιστικό θέλουμε να βγάλουμε συμπεράσματα για την παράμετρο και το δείγμα γυρνάω τώρα που είπαμε να είναι τυχαίο και αντιπροσωπευτικό. Πριν να κάνουμε διάλειμμα λοιπόν θα δούμε κατά πόσο διαλέγετε τυχαία και αντιπροσωπευτικά δείγματα εσείς. Ήρθε η ώρα της κρίσης, Λάζαρε. Λοιπόν θα πάρετε από ένα χαρτάκι τέτοιο και θα πρέπει, εδώ μέσα βλέπετε έχει 60 κύκλους. Οι κύκλοι έχουν διαφορετική διάσταση. Δεν είναι τίποτα σοβαρά αυτό μη γίνει, σε βλέπω πολύ αφοσιωμένος. Πέρασε λίγο σαν παιχνί, δεν είναι τίποτα. Όχι, θα πάρετε τους πέντε κύκλους από αυτούς. Βλέπετε οι κύκλοι είναι μικροί με διάσταση 0.5, 1, 1.5, 2, 2.5 και 3. Θα πάρετε λοιπόν ένα τέτοιο χαρτάκι και όπως λέει εδώ πέρα θα διαλέξετε τυχαίο και αντιπροσωπευτικό δείγμα πέντε κύκλων. Τυχαίο και αντιπροσωπευτικό. Θυμηθείτε τα ερωτήματα που λέγαμε πριν με τα διαμερίσματα. Θα πάρετε τους πέντε κύκλους που επιλέξατε και στο πίσω μέρος από το χαρτάκι θα βάλετε τα μεγέθη των πέντε κύκλων. Το πρώτο μέγεθος είναι το δεύτερο μέγεθος είναι το τρίτο και τα λοιπά είναι το πέμπτο. Διαπέντε ίσον τόσο και θα μου το δώσετε. Εντάξει. Κάνουμε διάλειμμα λοιπόν. Αφήστε τα εδώ πάνω στην έδρα. Καλά είπαμε να είστε ησυχία, αλλά εντάξει. Τελειώσαμε, διάλειμμα έχει τώρα. Λοιπόν, το πρόβλημα ήταν να επιλέξετε πέντε κύκλους από αυτούς τους 60 και να μου γράψετε μετά το μέγεθος των κύκλων. Με το άθρησμα αυτό εδώ δια πέντε ίσον κάτι. Μερικοί είστε λίγο τεμπέληδες. Πότε έχουμε δύο άκυρα ψηφοδότητες εδώ πέρα. Το ένα άκυρο είναι του κυρίου ή κυρίας εδώ πέρα, ο οποίος δεν μπήκε στον κόπο να μας γράψει και το αποτέλεσμα και έχει τέσσερις κύκλους. Τώρα γιατί το κάνετε αυτό δεν ξέρω. Και το άλλο, ο άλλος είναι μουτζούρος εδώ πέρα και το είδες. Οπότε έχουμε δύο άκυρα. Γυρνάμε τώρα στα αποτελέσματα. Λοιπόν, αυτό είναι ένα παράδειγμα στο οποίο ο πληθυσμός μας δίνεται. Είναι 60 κύκλοι. Αυτός είναι όλος ο πληθυσμός. Άρα, εδώ έχω όλο τον πληθυσμό. Γνωρίζω την ιδιότητα μέγεθος κύκλου για όλα τα στοιχεία του πληθυσμού. Άρα, γνωρίζω και την κατανομή της στοιχείας μεταβλητής που λέγεται μέγεθος κύκλου. Τι μεταβλητή είναι αυτή? Είναι συνεχής ή διακριτή? Διακριτή, έτσι. Πόσες τιμές μπορεί να πάρει? Έξι, όχι πέντε. Έξι τιμές. 0,5, 1,1,2,2,2,2,3. Την πιθανότητα για κάθε τιμή μπορώ να την ξέρω. Άμα εδώ, 0,5 πόση κύκλου είναι? Δεν είναι 17, είναι 28. 17 είναι με 1. Το γράφει εκεί πέρα στην τέταρτη γραμμή. Άρα έχω 28 κύκλους. Το 0,5, 17 μεγέθους 1, 7 μεγέθους 1,5, 5 μεγέθους 2, 2 μεγέθους 2,5 και 1 μεγέθους 3. Άρα λοιπόν μπορώ να γνωρίζω την κάθε πιθανότητα εδώ, έτσι. 28 δια 60, 17 δια 60 και ούτω καθεξής. Και αυτό το ραβδόγραμμα που έκανα εδώ πέρα τι συμβολίζει τελικά. Ποιο γράφημα μου δίνει, ποια συνάρτησης. Τυχαία μεταβλητή διακριτή με έξι διακριτές τιμές. Διακεκριμένες τιμές. Άρα έχω την πιθανότητα για κάθε μία. Άρα έχω τη συνάρτηση μάζας πιθανότητας. Αυτή είναι η συνάρτηση μάζας πιθανότητας, το γράφημά της. Μου λέει για κάθε στοιχείο, για κάθε τιμή της διακριτής στοιχείας μεταβλητής ποιο είναι η πιθανότητα. Ποια είναι η συνάρτηση μάζας πιθανότητας. Τη μέση τιμή μπορώ να τη βρω. Τα θυμάστε καθόλου βρε. Πώς ορίζεται η μέση τιμή σε μια διακριτή τυχαία μεταβλητή. Όταν γνωρίζω τη συνάρτηση μάζας πιθανότητας. Ναι ο αστέρις, όχι δεν ο αστέρις, πάνω. Άθρισμα χι-άι, ας μην το βάλω ευ του χι-άι, ας το βάλω έτσι, το ίδιο πράγμα είναι. Αυτό εδώ δεν είναι. Για όλα τα χι-άι, τα διαφορετικά χι-άι που μπορεί να έχω. Και αυτό είναι το ευ του χι ή αλλιώς που το λέμε μη. Μπορώ να το υπολογίσω λοιπόν αυτό τη μέση τιμή. Μηδέν κομμα πέντε επί είκοσι εφτά διά εξήντα. Συν ένα επί δεκαεφτά διά εξήντα. Και αν κάνετε αυτή την πράξη βγαίνει να είναι μηδέν εινέντενια. Άρα τη μέση τιμή για αυτή τη διακριτή τυχαία μεταβλητή τη γνωρίζω. Είπαμε ότι είμαστε στο παράδειγμα αυτό το οποίο στην πράξη δεν πρόκειται να το έχουμε ποτέ. Να έχουμε όλο τον πληθυσμό. Εδώ μας έδωσαν όλο τον πληθυσμό τους εξήντα κύκλους. Γι' αυτό και μπορούμε αυτά να τα υπολογίσουμε όλα. Η διάμεσος πώς είναι το γράφι εδώ πάνω είναι 1. Γιατί τι μου λέει η διάμεσος τι είναι δεν είναι η κεντρική τιμή στην κατανομή μου. Δηλαδή είναι η τιμή εκείνη για την οποία η αθριστική κατανομή παίρνει την τιμή μηδέν κομμα πέντε ένα δεύτερο. Άρα η αθριστική κατανομή αν αυτά τα θρίζουμε θα είναι μηδέν κομμα πέντε όταν είμαι στο ένα. Γιατί είναι τα μισά από εδώ τα μισά από εκεί. Άρα και η διάμεσος και η μέση τιμή τελικά είναι εκεί στο ένα. Τι μου δώσατε εσείς το μέσο όρο από πέντε διαστάσεις κύκλων. Που θα έπρεπε να είναι ο μέσος όρος από πέντε διαστάσεις. Στο ένα. Τι δώσατε εσείς αυτό. Πήρα 49 έγκυρα ψηφοδέλτια. 49 και ο μέσος όρος. Αυτές είναι οι τιμές που μου δώσατε αρραδιασμένες εδώ πράττω. Ο μέσος όρος τους είναι 1,3 η διάμεσος 1,2. Δυστυχώς δεν κάνατε καλή δουλειά. Η άσκηση τι έλεγε. Να επιλέξετε με τυχαίο και αντιπροσωπευτικό τρόπο τους πέντε κύκλους. Το κάνατε. Δεν μιλάω ατομικά. Συνολικά σαν ομάδα εδώ πέρα όχι. Γιατί. Γιατί είχατε μια τάση να επιλέγετε πιο μεγάλους κύκλους. Έτσι ώστε ο μέσος όρος από αυτά που βγάλετε αντί να είναι γύρω από το 1. Να είναι σε μεγαλύτερες τιμές. Να είναι γύρω από το 1,3. Λοιπόν πως επιλέξατε τους κύκλους. Κανένας δεν μπορεί να μου πει ποιον τρόπο το επέλεξα. Τι μέθοδο. Για πες μου το όνομά σου. Νίκος. Ο Νίκος. Να βάζω το πλήθος κάθε κύκλου. Ωσύ με το κύκλικο του 0,5 ήταν πιο πολύ. Τον πήρας περισσότερες φορές. Δηλαδή πόσες φορές. Τρεις. Δύο. Τον άλλο κύκλο. Τον 1. Τον 1. Είπες το 0,5. 2 με το 0,5. 1. Μία το 1. Τρεις. Καλά. Όλοι άμα το κάνουν αυτό όμως τι θα γίνει για. 2,5 και 3 δεν εφαρμιστεί ποτέ. Άρα άμα όλοι ακολουθήσουμε τη μέθοδο Νίκου εδώ πέρα. Που λέει θα παίρνεις το 0,5 δύο φορές. Τον 1 μία φορά. 1,5 άλλη μία. Και 2 άλλη μία. Αφήνεις το 2,5 και 3 απέξω. Τι γίνεται στο τέλος. Αν όλοι κάνετε το ίδιο. Θα έχουμε κανένα κύκλο μέσα στα δείγματα αυτά. Που να έχει μέγεθος 2,5 ή 3. Όχι. Αυτό λέγεται ρατσισμός. Μη γελάτε αυτός είναι ο ρατσισμός. Ο αποκλεισμός κάποιων κατηγοριών. Γελάει ο Νίκος. Άρα λοιπόν δεν είναι σωστή η μέθοδος. Γιατί δεν αντιπροσωπεύεται στο δείγμα μου το 2,5 και το 3. Με αυτόν τον τρόπο. Άλλη μέθοδος. Αν βάλουμε το 2,5 και το 3. Δεν υπάρχει περίπτωση να βγάλουμε το 2,5 και το 1,5. Μα δεν ξέρετε από πριν τι τίμι θα βγάλετε. Αυτό το... Μην σκέφτεστε τώρα τι θα βγάλετε. Απλά λέμε τώρα τι μέθοδο χρησιμοποιήσατε. Με λίγα λόγια. Αν πάτε με μία μέθοδο που να πάει με μία ποσόστοση. Δεν πας καλά. Κάτι το πετάς απέξω. Γιατί αν αυτό το κάνουν όλοι με τον ίδιο τρόπο. Δεν γίνεται. Ναι αλλά αν το κάνουν όλοι αυτό δεν θα εκπροσωπηθεί ποτέ το 3 και το 2,5. Και είπαμε δεν είναι σωστό. Δεν δουλεύουμε χωρίς μηχαράκι. Κάποιος του κάπνησε δεν είναι στατιστική. Βάζουμε μέθοδο πως θα το κάνουμε κάτι. Χωρίς καπνίσματα. Ναι λέμε ποια μέθοδο να βάλουμε. Ναι έκανες ποσόστοση όμως κι εσύ. Είπαμε όμως αυτό δεν οδηγάει κάπου. Έτσι το καταλάβουμε γιατί δεν οδηγάει. Αν κάνουν όλοι αυτό που έκανες εσύ θα πετούσε κάποιος απέξω. Άρα δεν γίνεται. Δεν είναι σωστός τρόπος. Άλλη μέθοδο που κάνατε. Θέλει κάποιος να την πει. Γιατί ρε παιδί μου το πνίγει το δίκιο να πω κι εγώ τη δικιά μου. Στην τύχη λέει ο Λάζαρος. Ποια είναι η τύχη Λάζαρε. Ποια είναι η τύχη σου να δούμε. Πέντε πρώτες που είδα. Τι μάτι είναι αυτό. Πόσους είσαι στις πέντε πρώτες δηλαδή. Έχετε καταλάβει πάλι τίποτα. Όταν λέει στις πέντε πρώτες που είδα από πάνω μέχρι την κάτω. Σις καταλαβαίνετε ρε παιδιά. Πήρες αυτούς εδώ δηλαδή. Αυτούς ποιος πήρες. Ναι να μιλήσει και ένας άλλος. Άλλος κάτι. Το στην τύχη. Πόσοι το κάνατε στην τύχη. Ναι το όνομά σου. Τι πες Δημητρή. Δημήτρες θα βρουν τη λύση τώρα. Λέγε Δημητρή. Λέγε θα πάρω λίγο από όλους. Καλά. Εντάξει παιδιά. Ωραία. Ας το κλείσουμε εδώ το θύμα γιατί περνάει και η ώρα. Λοιπόν ας πάμε τώρα στο κατόπιν εορτής. Τώρα λοιπόν που σας έδειξα τα αποτελέσματα. Και σας είπα ότι με αυτούς τους τρόπους που διαλέγατε συνολικά. Δεν πάμε μπροστά. Λίγο πώς θα επιλέγατε τους πέντε κύκλους αν σας ξαναέβαζα την ιδιάσκηση τώρα. Έτσι ώστε πραγματικά να είναι με τυχαίο και αντιπροσωπευτικό. Γιατί το να πάει να διαλέξεις. Δύο κύκλους του 0-5, δύο του 1 ή ένα του 1 και τα λοιπά. Είπαμε δεν γίνεται αντιπροσωπεύση. Το να πάς να το κάνεις στην τύχη το μάτι θα πέσει στα μεγάλα νούμερα. Δηλαδή άμα πάρετε και παίξετε δάρτς. Βελάκι λες θα το αφήσω κάτω. Και όπου η μύτη ακουμπείς θα το πάρω. Θα ακουμπάς με μεγάλη πιθανότητα στο 3 το μεγάλο το κύκλο. Άρα εκεί κάνεις μια μερολυψία στο να παίρνεις τους μεγάλους κύκλους. Ποια μέθοδο θα χρησιμοποιούσατε λοιπόν τώρα. Έτσι ώστε να είναι πραγματικά τυχαία η κύκλη. Μιχάλης. Όχι Μιχάλης. Φίλιππος, ναι. Δυνατά μόνο, λέει για να ακούσουμε. Μάλιστα. Λοιπόν, Φίλιππος λέει να κάνουμε 60 χαρτάκια μικρά. Να βάλουμε ένα νούμερο από το 1 μέχρι το 60. Που να αντιστοιχούν στους 60 κύκλους. Ναι, να αντιστοιχούν στους 60 κύκλους όπως έχουμε και εδώ πέρα. Εννοώ, εδώ πέρα το λέω, εννοώ στους 60 κύκλους. Δηλαδή το 1, που θα είναι αυτός ο κύκλος, 0,5 θα γράφει το χαρτάκι. Το άλλο θα είναι 0,5, 0,5 θα γράφει. Το 2, το 3, το 4 και τα λοιπά. Και να διαλέξουμε νούμερα από το 1 μέχρι το 60. Να πάρουμε τα χαρτάκια από ένα πουγγί μέσα. Πώς σας φαίνεται αυτό. Έχει κανένα από τα προβλήματα που λέγαμε πριν. Ναι. Εντάξει, τελειώνω τίπι, θα κόψω τα χαρτάκια. Ναι, ο αστέρις, ναι. Δεν είναι τυχαίο. Δεν είναι τυχαίο, άρα είναι τυχαίο. Αντιπροσωπευτικό θα είναι, το όνομα σου. Γιάννης. Γιατί. Στην τύχη θα παίρνουν τα χαρτάκια, από το 1 μέχρι το 60. Όταν θα πάρω στην τύχη χαρτάκια από το 1 μέχρι το 60, αυτό δεν έχει κάποια πιθανότητα να εμφανιστεί. Πώς είναι η πιθανότητα να εμφανιστεί αυτό. 1 προς 60, δεν είναι. Έχει όμως την πιθανότητα. Μπορεί άμα το κάνω 5 φορές να μην εμφανιστεί. Αλλά αν το κάνουν 12 άτομα από 5 φορές, 12 από 5, 60, περιμένω μία στις αυτές τις 60 φορές που θα έχει τραβήξει, να εμφανιστεί και αυτό. Το 0,5 πόσες φορές θα εμφανιστεί. Πολλές φορές. Γιατί είναι περίπου μισή κύκλη. Εδώ λοιπόν με αυτό κάνω αυτό που λέγεται τυχαία δειγματολυψία. Και μπορώ απλά να αριθμίσω τους κύκλους από το 1 μέχρι το 60 και να επιλέξω κάποια νούμερα από το 1 μέχρι το 60 για να το κάνω. Εδώ λοιπόν είναι το αποτέλεσμα αν θα έκανα μια τέτοια τυχαία δειγματολυψία. Στον υπολογιστή που γίνεται γρήγορα. Ποιος το είπε ότι γίνεται γρήγορα, ο Δημήτρης. Στον υπολογιστή που γίνεται και γρήγορα. Για να το κάνω. Για να τρέξετε και να το ξανατρέξετε και να σας βγάζει νούμερα κοντά στο 1 κάθε φορά. Γιατί είναι με τυχαία δειγματολυψία. Βέβαια πώς βγάλουμε τυχαίους αριθμούς είναι ένα άλλο μεγάλο ερώτημα. Δεν ξέρω αν κάποιος θέλει να μας μιλήσει γι' αυτό. Είναι κάποιος ενδιαφερόμενος μήπως. Τον ενδιαφέρει το θέμα με τους τυχαίους αριθμούς. Μπορώ να το βάλουμε σαν μια ξεχωριστή θεματική εργασία για όποιος θέλει να μας μιλήσει γι' αυτό. Δεν βλέπουμε να υπάρχει ενδιαφέρον, οπότε θεωρώ ότι λίγο πολύ δεν σας ενδιαφέρει το θέμα των τυχαίων αριθμών και αφήνετε το κομπιούτερ εκεί, θα πατήσετε το κουμπί RANT, θα γράψετε την εντολή RANT, ας πούμε, και ας πετάξει το νούμερο. Το τι γίνεται από πίσω, ναι, χρειάζεται να το ξέρουμε. Λοιπόν, αφήνουμε λοιπόν το παράδειγμα. Δεν θα μιλήσουμε πλέον άλλο για δειγματολυψία. Είναι ένα θέμα από μόνο του αρκετά ενδιαφέρον, έχει πολλά πράγματα να πει κανείς, πολλά πράγματα έχουνε γραφτεί, αλλά εμείς δεν θα συζητήσουμε για το πώς επιλέγουμε τα εδομένα. Πάμε λοιπόν στην περιγραφική στατιστική, πώς περιγράφουμε τα εδομένα. Αυτά που θα πούμε στο υπόλοιπο της ώρας είναι πράγματα γνωστά, τα έχετε κάνει στην τρίτη ηλικίου στο μάθημα στατιστικής, γι' αυτό και θα τα περάσω έτσι λίγο γρήγορα και όπου νομίζετε ότι κάτι δεν το καταλαβαίνετε μπορείτε να με σταματήσετε και να με ρωτήσετε. Στην πρώτη περίπτωση όταν έχουμε διακεκριμένες τιμές, είναι ακριβώς το παράδειγμα που βλέπαμε πριν, με τους έξι διαφορετικούς τύπους κύκλων, έξι διαφορετικά μεγέσεις. Εδώ λοιπόν τα K-κατηγορίες είναι οι έξι κατηγορίες για εμάς και αυτό που κάνουμε μπορούμε να μετρήσουμε τη συχνότητα εμφάνισης μιας τιμής, όπου λέγαμε πόσοι κύκλοι είναι με διάσταση 0,5 κτλ. να διαιρέσουμε με το μέγεθος έτσι ώστε να έχουμε τη σχετική συχνότητα ή το ποσοστό, την αθροιστική συχνότητα να αθρίσουμε μεγέθη ως κάποιο μέγεθος που μας ενδιαφέρει και το αθροιστικό ποσοστό. Αυτά τώρα θα τα δούμε σαν παράδειγμα καλύτερα. Αυτά είναι τα αποτελέσματα από τις συχνότητες που παίρνουμε, δηλαδή η συχνότητα εμφάνισης της κάθε τιμής της διακριτής τυχαίας μεταβλητής και μπορούμε αυτά να τα παρουσιάσουμε όπως για παράδειγμα με ένα πίνακα συχνοτήτων, με ένα ραβδόγραμμα, κυκλικό διάγραμμα, πίτα κτλ. Την πίτα μπορεί να έχετε κάτι άλλο στο μυαλό σας τώρα για την μεσημέρεια, αλλά πίτα εννοούμε εκείνο το κυκλικό διάγραμμα που το βλέπετε έτσι σε κάτι έγχρωμα κομματάκια, να ξεχωρίζει τρις διάστατο και τα λοιπά. Υπάρχουν πολλά διαγράμματα που μπορεί να κάνει κανείς, αλλά στην ουσία αυτό που δείχνει είναι οι συχνότητες, τίποτα παραπάνω. Δηλαδή, σε αυτό το παράδειγμα εδώ έχουμε μια αποθήκη που έχει 120 παρτίδες από ηλεκτρολογικά προϊόντα, δηλαδή παραγγελίες που έρχονται και κάθε παρτίδα μπορεί να περιέχει διαφορετικό αριθμό κυβωτήων. Τώρα, αν σας ρωτούσα ποια είναι η πιο συνηθισμένη παραγγελία σε αυτή την αποθήκη. Πόσα κυβώτια. Μπορείτε να το πείτε. Δεν μπορώ να πούμε. Ή σε τι ποσοστό είναι οι μεγάλες παραγγελίες που είναι από πέντε και πάνω κυβώτια. Δεν είναι εύκολο να απαντήσουμε, γι' αυτό καταφεύγουμε στο να κάνουμε αυτόν τον πίνακα συχνοτήτων. Δηλαδή, τι σημαίνει, πάω και μετράω στις 120 πόσες παραγγελίες είχαν ένα κυβώτιο, δύο κτλ. Διαιρώ εδώ πέρα με το 120 και το εκφράω σε ποσοστά και εδώ είναι τα θρηστικά. Δηλαδή, το 110 μου λέει παραγγελίες που ήταν μέχρι τέσσερα κυβώτια. Άρα, τα υπόλοιπα 10 είναι οι μεγάλες παραγγελίες που λέγαμε με πέντε και παραπάνω, το οποίο σε ποσοστό είναι 8% Αυτόν τον τρόπο, λοιπόν, μπορώ να παρουσιάσω τα εδομένα και μετά να έρθω εδώ πέρα, όπως έχω σε πίνακα τις συχνότητες, να τις κάνω σε ένα ραβδόγραμμα. Καμιά ερώτηση? Απλά δεν είναι, δεν είναι τίποτα αυτά. Τώρα, τι γίνεται όταν έχω αριθμητικές τιμές? Αν πάρω το παράδειγμα με το ύψος των φοιτητών, μπορώ να κάνω το ίδιο? Να έρθω να κάνω ένα ραβδόγραμμα για τα διαφορετικά ύψη που έχετε? Έχει νόημα να το κάνω αυτό? Ναι. Καταρχήν είναι άπειρες οι τιμές γιατί είναι τιμές σε ένα διάστημα. Βέβαια, όταν πάρω ένα μέτρο να το μετρήσω θα έχει μία ακρίβεια εκατοστού, χιλιοστού, αν είναι ηλεκτρονικό μπορεί να πάει και παραπάνω και τα λοιπά. Αλλά όταν έχω τέτοιες αριθμητικές τιμές που είτε είναι πολλές διακεκριμένες τιμές ή τιμές σε διάστημα, δεν μπορώ να μιλάω για συχνότητα εμφάνιση κάθε τιμής. Αυτό αντιστοιχεί σε αυτό που λέγατε ότι σε μια συνεχή τυχαία μεταβλητή, η πιθανότητα να πάρει μία συγκεκριμένη τιμή πόσο είναι? Μηδέν. Μιλάμε τιμές που μπορεί να πάρεις σε ένα μικρό διάστημα γύρω από κάποια τιμή, όχι για μία συγκεκριμένη τιμή. Αυτό λοιπόν που κάνετε και στην τρίτη ηλικία είναι να κάνετε μία ομαδοποίηση. Δηλαδή να πάτε και να ομαδοποιήσετε τα δεδομένα σας και να τα κάνετε σε κάπα ομάδες ή κάπα κλάσεις, όπως τις λέγατε. Και μάλιστα στο μάθημα που είχατε η στατιστική, στο οποίο από όσο ξέρω δεν το δώσατε και πολύ σημασία, γιατί δεν είχατε εξετάσεις, υπήρχε και ένα πινακάκι που έλεγε πόσες ομάδες πρέπει να πάρεις, πόσες κλάσεις, ανάλογα με το πλήθος των παρατηρήσων, των δεδομένων που έχεις. Γενικά όμως δεν υπάρχει ένας καλός κανόνας γι' αυτό. Δεν θέλω τώρα να αφησβητήσω το πινακάκι που είχατε, αλλά αυτά τα αποτελέσματα είναι κάτω από προϋποθέσεις που έχουμε στα δεδομένα και γενικά λοιπόν δεν υπάρχει ένας τύπος να μας το δίνει. Το ορίζουμε εμείς, εδώ θα το πούμε κάπως εμπειρικά, δηλαδή όταν έχουμε δεδομένα να πάρουμε ένα πλήθος ομάδων που να μην είναι ούτε πολύ μεγάλο, ούτε πολύ μικρό, τι σημαίνει πολύ μεγάλο, να μην είναι πολύ μεγάλο έτσι ώστε να έχουμε πολλές κλάσεις και η συχνότητα εμφάνιση σε κάθε κλάση να είναι μικρή, αλλά ούτε και πολύ μικρό έτσι ώστε να έχουμε λίγες κλάσεις και να μην μπορούμε να δούμε πώς κατανέμονται οι τιμές της τυχαίας μεταβλητής. Εδώ λοιπόν δεν θα πούμε πώς ορίζουμε το κ, έστω ότι το ορίσαμε με κάποιον τρόπο. Αφού ορίσαμε το κ, ορίζουμε το μέγεθος της κάθε ομάδας, της κάθε κλάσης το r, παίρνοντας το εύρος των εδομένων, δηλαδή την απόσταση από τη μικρότερη στη μεγαλύτερη, αυτό το r κεφαλαίο και διαιρώντας το με τον αριθμό των κλάσεων. Φροντίζουμε η πρώτη κλάση, το πρώτο διάσημα να περιέχει το ελάχιστο, η τελευταία να περιέχει το μέγιστο και έτσι κάνουμε τις συχνότητες και φτιάχνουμε το ραβδόγραμμα όπως και πριν και αν ενώσουμε τις πλευρές του ραβδογράμματος παίρνουμε το λεγόμενο ιστόγραμμα. Και μπορούμε να κάνουμε και άλλα γραφήματα εδώ πέρα, φιλογράφημα, σημειογράφημα κτλ. Υπάρχουν πολλά έτσι ωραία πράγματα. Και ξεκινάμε με τις θεματικές ενότητες που σας είχα πει στην αρχή ότι μπορείτε να επιλέξετε για τη μία μονάδα της εργασίας είτε την υπολογιστική εργασία ή τη θεματική. Αυτό είναι το πρώτο θέμα που μπορεί να επιλέξει κάποιος να μας το παρουσιάσει δηλαδή αυτό που λέγαμε το πινακάκι πώς ορίζεται που δίνει πόσες ομάδες θα πάρεις, πόσες κλάσεις όταν έχεις ένα δεδομένο αριθμό παρατηρήσεων. Υπάρχουν διάφοροι μέθοδοι που καλείται μάλλον αυτός που θα κάνει την παρουσίαση να μας παρουσιάσει. Προσδιορισμός λοιπόν αριθμού ομάδων ή εναλλακτικά εύρος διαστήματος γιατί αυτά πάνε μαζί. Αν λοιπόν εδώ πέρα βρω το πλήδος των ομάδων γνωρίζω και το εύρος του διαστήματος. Αν ορίσω το εύρος του διαστήματος βρίσκω τον αριθμό των ομάδων στο πρόβλημά μου. Όπως βλέπετε συνηθίζω να βάζω και αγγλικούς όρους για να μπορείτε να ψάξετε και στην διεθνή βιβλιογραφία. Εντάξει, αν κάποιος λοιπόν πάρει αυτό το θέμα θα μας παρουσιάσει κάποιους μεθόδους. Τι περιορισμίες έχουν οι μέθοδες αυτοί, πότε μπορούν να εφαρμοστούν, ποια θεωρείται να είναι καλύτερη και ως και με ένα παράδειγμα να μας δείξει τι γίνεται. Το δεύτερο είναι το φιλογράφημα, είναι πολύ συγκεκριμένο θέμα και αυτό. Είναι για το stem and leaf plot όπως λέγεται στα αγγλικά που μπορεί να το παρουσιάσει τι πλεονεκτήματα έχει ως προς το ιστόγραμμα και να μας δώσει και ένα παράδειγμα. Λοιπόν, πάμε να δούμε πώς κάνουμε το ιστόγραμμα σε αυτό το συγκεκριμένο παράδειγμα εδώ πέρα όπου έχουμε 25 παρατηρήσεις για το χρόνο ζωής μπαταρίας αυτοκινήτου. Έχουμε έναν τύπο μπαταρίας αυτοκινήτου από μία εταιρεία Α και έναν άλλον από μία εταιρεία Β. Εμείς θα ασχοληθούμε μόνο με τα δεδομένα της εταιρείας Α που είναι 25 παρατηρήσεις, 25 χρόνια ζωής μπαταρίας. Είναι σε έτη με δεκαδικά, δηλαδή με δεκαδικό του έτους, πέντε έτη και κόμμα έξι. Το κόμμα έξι σημαίνει έξι δια δώδεκα στην προκειμένη περίπτωση και ούτω καθεξής. Λοιπόν, από εδώ πέρα μπορεί κάποιος να πει ποιος φαίνεται να είναι ο αντιπροσωπευτικός χρόνος ζωής της μπαταρίας για αυτήν την εταιρεία Α. Είναι εύκολο να το πείτε. Είναι πέντε, έξι, ξύμισι, πενταίμισι. Δεν είναι εύκολο να το πούμε. Είναι εύκολο. Ωραία μάτια έχετε ρε. Α, εννοείς αυτό εδώ πέρα να βρεις το μέσο όρος, σωστά, ναι. Αλλά με μια οπτική μάτια δεν μπορούμε να τα δούμε, γι' αυτό λέμε ότι πάμε να βρούμε τρόπους να περιγράψουμε τα εδομένα. Εδώ τώρα η περιγραφή θα γίνει με το ιστόγραμμα. Άρα, ξεκινάω. Το εύρος είναι δυόμισι, τεσσερά μισή μικρότερη, εφτά η μεγαλύτερη, το εύρος δυόμισι. Πόσες ομάδες να κάνουμε παιδιά, είναι 25 παρατηρήσεις. Πόσες ομάδες, πόσες κλάσεις. Πέντε. Εγώ για ευκολία πήρα 10, αλλά είναι πολύ μεγάλο το νούμερο. Δηλαδή 10 στις 25 είναι πάρα πολύ μεγάλο. Αλλά το έκανα για ευκολία για να βγουν εύκολα τα νούμερα. Οπότε, με αυτόν τον τρόπο έχω μήκος ή εύρος κάθε διαστήματος 0.25 και ξεκινάω. Τεσσερά μισή για να περιέχει και τη μικρότερη τιμή και πηγαίνει μέχρι το εφτά να περιέχει και τη μεγαλύτερη τιμή. Και έτσι έχω ορίσει αυτές τις 10 ομάδες. Μετράω πώς παρατηρήσεις έχω μέσα σε αυτό το διάστημα. 2 στο άλλο 2 και ούτω καθεξής. Και έτσι έχω ό,τι είχα και πριν. Δηλαδή τις συχνότητες, το ποσοστό, αθληστική συχνότητα, αθληστικό ποσοστό. Και αυτό εδώ είναι το ιστόγραμμα. Δεν είναι τίποτα άλλο που πήγα. Στο διάστημα 4.5 με 4.75 είναι 2 οι παρατηρήσεις. Άρα κάνω μία ράπτα στο 2. Στο διάστημα 4.75 με 5 είναι 2. Το βάζω και τα ενώνω. Και έτσι μου παρουσιάζεται αυτό εδώ που το λέω ιστόγραμμα. Τώρα γιατί το κάνουμε αυτό. Γιατί θέλω να κάνω μια ερώτηση εδώ πέρα. Θέλω αν ακολουθεί κάποια γνωστή κατανομή. Λοιπόν Δημητράκη, ακολουθεί κάποια γνωστή κατανομή η τυχαία μεταβλητή που λέγεται χρόνος ζωής μπαταρίας σύμφωνα με τις 25 παρατηρήσεις και αυτό το ιστόγραμμα. Φαίνεται να μοιάζει με μία από τις κατανομές που ξέρετε. Στην τώρα έχετε εμπειρία. Ξέρετε πολλές κατανομές. Από το πρώτο μέρος του μαθήματος το τελευταίο κομμάτι ήταν για τις κατανομές τυχαίας μεταβλητής. Είχατε την ομοιόμορφη. Θυμάσαι την ομοιόμορφη. Η ομοιόμορφη ήταν αυτή που πήγαινε η ίδια πυκνότητα. Μην τη λέμε πιθανότητα. Αυτή ήταν η ομοιόμορφη. Είχατε μετά καμπανούλα κανονική. Είχατε εκθετική. Μιχαλάκι μονοσύνταξης μου φαίνεται. Μοιάζει σε καμιά από αυτές τις κατανομές. Από αυτές τις τρεις εδώ πέρα ποια θα λέγατε ότι είναι υποψήφια. Νάτος ο Δημητρής. Για πες Δημητρή. Ίσως με την κανονική. Με την κανονική. Ίσως με την κανονική. Ομοιόμορφη δεν θα λέγαμε. Εκθετική. Όχι. Κανονική γιατί Δημητρή. Εδώ αρχίζει να γίνεται στατιστική σιγά σιγά. Πρέπει να έχουμε φαντασία λίγο. Ότι εδώ κρύβεται μία καμπανούλα. Είναι 25 παρατηρήσεις. Δεν μπορεί να έχουμε σκαλοπατάκια που να μας δημιουργούν την καμπανούλα όπως ακριβώς τη θέλουμε. Πραγματικά αυτά τα εδομένα δεν είναι από μπαταρίες. Είναι συνθετικά στον υπολογιστή και είναι 25 νούμερα που τα πήρα τυχαία από κανονική κατανομή. Πότε είναι από κανονική κατανομή. Αλλά βλέπετε το σχήμα που παίρνουμε δεν είναι κανονικής κατανομής. Τι χαρακτηριστικά όμως έχει. Οι τιμές μαζεύονται γύρω από μια κεντρική τιμή. Όπως την κανονική κατανομή. Και καθώς πηγαίνουμε αριστερά και δεξιά πέφτουνε. Με κάποια συμμετρία. Άρα αυτό είναι το ζητούμενο εδώ πέρα. Δεν θέλουμε να δείξουμε ακριβώς ότι είναι καμπανούλα. Αλλά έχουμε αυτά τα ποιοτικά χαρακτηριστικά της κανονικής κατανομής. Βέβαια αν εδώ δεν είχα 25 παρατηρήσεις και είχα χίλιες παρατηρήσεις. Θα ήθελα να είναι πιστά. Οι ράβδοι αυτοί να ακολουθούν πιστά την καμπανούλα. Αλλά όσο λιγότερες παρατηρήσεις έχω. Τόσο πιο ελαστικός πρέπει να είμαι στο να κρίνω αν η κατανομή είναι κάποια γνωστή κατανομή. Και αυτή η κατανομή που μας θα ενδιαφέρει περισσότερο είναι η κανονική. Και αυτό γιατί στην κανονική κατανομή βασιζόμαστε για να χρησιμοποιήσουμε μεθόδους. Ένα δηλαδή πολύ σημαντικό είναι ότι όταν μου δίνουν τα δεδομένα. Βλέπετε ότι έκανα το ιστόγραμμα ένα από τα πρώτα πράγματα που κάνουμε. Κάνουμε ένα ιστόγραμμα για να δω μπορώ να υποθέσω ότι είναι κανονική η κατανομή. Γιατί αν υποθέσω ότι είναι κανονική η κατανομή του χρόνου ζωής και μπαταρίας Λάζαρε. Τότε μπορείς να χρησιμοποιείς και εργαλεία Λάζαρε. Που γελάς. Γιατί όταν έρθει όλα χρησιμοποιείς τα εργαλεία θα σε ρωτήσω είναι κανονική η κατανομή. Πώς θα χρησιμοποιείς. Αυτά τα εργαλεία είναι αυτά που λέγαμε τις στατιστικές μεθόδους. Όταν θέλω να βγάλω συμπεράσματα για τον πληθυσμό. Με βοηθάει να υποθέσω ότι είναι κανονική η κατανομή για να μπορώ να εφαρμόσω τις στατιστικές μεθόδους που βασίζονται σε αυτή την υπόθεση. Το δεύτερο τώρα είναι ότι είναι πάρα πολύ συχνό το φαινόμενο να έχω κανονική κατανομή στα μεγέθη που παρατηρώ. Δηλαδή αν πείτε κάποιο μέγεθος κάποιο φυσικό μέγεθος που είναι τυχαία μεταβλητή αλλάζουν οι τιμές τους. Η θερμοκρασία, η αλλαγή στην τιμή μιας μετοχής, πολλά μεγέθη που συμβαίνουν μπορούμε να μετρήσουμε. Θα λέγαμε ότι ακολουθούν κανονική κατανομή. Δηλαδή έχουν τις τιμές να μαζεύονται στο κέντρο και κάπως συμμετρικά αριστερά και δεξιά να πέφτουν. Τα τελευταία χρόνια όμως αυτή η υπόθεση κανονικής κατανομής που την είχαμε σαν το πρότυπο για πάρα πολλά μεγέθη που μελετάμε αρχίζει και κλονίζεται γιατί ήρθαν αυτά που λέγαμε τα ακραία καιρικά φαινόμενα, οι ακραίες τιμές. Γιατί τι σημαίνει ακραία τιμή. Αν αυτό είναι θερμοκρασία και είμαι εδώ στο 20 και λέω ότι τον Απρίλιο η θερμοκρασία, η μέση θερμοκρασία είναι γύρω στο 20, η θερμοκρασία κάθε μέρα είναι γύρω στο 20, μπορεί τελικά να έχω μια τιμή εδώ ή να έχω μια τιμή εδώ που δεν θα την περίμενα κάτω από την υπόθεση της κανονικής κατανομής γιατί θα περίμενα όταν φτάνω σε θερμοκρασίας, αν εδώ είναι το 10 ας πούμε, όταν φτάνω σε θερμοκρασίας το 10 η πιθανότητα να μου εφανιστούν είναι μικρή. Το ίδιο όταν πηγαίνω σε θερμοκρασίας ξέρω εγώ στο 40. Αλλά επειδή αυτή η πιθανότητα πλέον δεν είναι μικρή υπάρχουν άλλες κατανομές που έχουν πιο παχές σουρές, που σβήνουν πιο αργά, γι' αυτό λέγονται παχές σουρές. Στην πράξη όμως πολλές φορές θεωρούμε ότι έχουμε κανονική κατανομή γιατί μας διευκολύνει. Στη συνέχεια θα περάσουμε, να πούμε λίγο και για τα μέτρα θέσεις και θα μιλήσουμε την επόμενη φορά για τα μέτρα μεταβλητότητας. Για τα μέτρα θέσεις τώρα περνάμε να δούμε κάποια μέτρα δηλαδή κάποια στατιστικά τα οποία τα υπολογίζουμε από τις τιμές του δείγματος. Τα δύο που μας ενδιαφέρουν είναι πού είναι το κέντρο των δεδομένων, το κέντρο των παρατηρήσεων του δείγματος και πόσο είναι η μεταβλητότητα στα δεδομένα. Θεωρώ λοιπόν ότι έχω τις παρατηρήσεις x1, x2, x1 αυτός είναι ο συμβολισμός. 1 είναι το μέγεθος του δείγματος, x1 η πρώτη παρατήρηση, x2 η δεύτερη και τα λοιπά και προχωράω στα μέτρα θέσεις. Ήδη στην πρώτη ώρα είπαμε όταν λέγαμε για το χρόνο που κάνει κάποιος για να πάει από το σπίτι στο πανεπιστήμιο, στο πολιτεχνείο και αυτό που λέει στην ουσία είναι μια αντιπροσωπευτική τιμή για το χρόνο, η αντιπροσωπευτική τιμή μπορεί να είναι ο μέσος όρος ή διγματική μέση τιμή όπως αλλιώς λέγεται ή αριθμητικός μέσος που ορίζεται όλοι το ξέρετε με αυτόν εδώ τον τρόπο. Δεν το είχε καταλάβει και το εξήγησες, έτσι. Λοιπόν, αν θέλουμε τώρα να δούμε γραφικά τι σημαίνει αυτή η μέση τιμή, η διγματική μέση τιμή, μπορούμε να θεωρήσουμε ότι οι παρατηρήσεις μας είναι αυτές τις σφαίρες που βλέπετε εκεί πέρα. Η ράβδος δεν έχει κάποιο βάρος και εκεί που ισορροπεί η ράβδος είναι ακριβώς η μέση τιμή. Δηλαδή, οι αποκλείσεις που έχουμε από την αριστερή πλευρά και από τη δεξιά πλευρά αθρίζονται στο ίδιο νούμερο. Είναι δηλαδή το σημείο ή το κέντρο ισορροπίας των δεδομένων αυτή η μέση τιμή. Είπαμε όμως ότι έχουμε και τη διάμεσο, που η διάμεσος πώς ορίζεται. Θυμάται κανείς πώς ορίζεται η διάμεσος όταν έχω εν παρατηρήσεις, η κεντρική παρατήρηση. Βέβαια, εδώ πρέπει να διαφοροποιήσουμε τις δύο καταστάσεις όταν έχουμε δείγμα με περιττό πλήθος παρατηρήσεων και δείγμα με άρτιο πλήθος παρατηρήσεων. Και εντάξει, η τύπη τώρα αυτή εδώ πέρα δεν είναι κάτι για να το θυμόμαστε, απλά όταν έχουμε περιττό πλήθος, έχουμε μία κεντρική παρατήρηση στη μέση. Αν έχω για παράδειγμα 11 παρατηρήσεις, η κεντρική παρατήρηση είναι η έκτη. Αν έχω 10 όμως, είναι ο μέσος ώρας των δύο κεντρικών παρατηρήσεων που είναι η πέμπτη και η έκτη. Εντάξει, και μπορείτε ας πούμε με αυτό το παράδειγμα όταν είναι 3 είναι η δεύτερη παρατήρηση, όταν είναι 4 είναι το ημιάζευμα της δεύτερης και της τρίτης. Και υπάρχει και μία άλλη η επικρατούσα τιμή, την οποία δεν θα την χρησιμοποιήσουμε εδώ πέρα, γιατί είναι συνήθως χρησιμοποιότητα όταν έχουμε λίγες τιμές, γιατί μιλάμε για αυτήν που έχει τη μεγαλύτερη συχνότητα εμφάνισης και όπως είπαμε όταν μιλάμε για συνεχείς στοιχείες μεταβλητές τότε δεν έχει νόημα να μιλάμε για συχνότητα εμφάνισης. Τώρα γενικά το γνωστό το μέτρο που έχουμε για το κέντρο είναι ο μέσος ώρος. Είναι αυτό το πιο σημαντικό. Την διάμεσο δεν την ξέρει πολλοί κόσμος όπως είπαμε και πριν και γιατί χρησιμοποιούν όλοι τον μέσο ώρο και δεν χρησιμοποιούν τη διάμεσο. Γιατί να έχει γίνει δηλαδή μόδα ήτανε και πέρασε έτσι στον κόσμο. Να πάρουν το μέσο ώρο και όχι τη διάμεσο. Γιατί πιστεύετε ότι χρησιμοποιούμε το μέσο ώρο. Το όνομα σου? Ανδρέα. Ανδρέα. Γιατί το ίδιο θέλουν οι περισσότερες να εκτιμήσουν όλες τις παραμέτρες που έχουν τη διάμεσο ώρο στην δύο κεφρική χρησιμοποίηση. Ναι. Άρα δηλαδή έτσι όπως το λέει ο Ανδρέας είναι ότι για το μέσο ώρο εδώ βάζουμε όλες τις τιμές. Όλες οι τιμές μπαίνουν μέσα. Δεν αφήνουμε καμιά απ' έξω. Άρα παίρνουμε όλη την πληροφορία από το δείγμα. Δεν αφήνουμε τίποτα απ' έξω. Ενώ για τη διάμεσο τελικά αυτό που παίρνουμε είναι οι δύο κεντρικές τιμές. Σαραδιάζω, παίρνω τις δύο κεντρικές τιμές ή μόνο τη μία αν είναι και βρίσκω τη διάμεσο. Επειδή ακριβώς για το μέσο ώρο χρησιμοποιούμε όλη την πληροφορία είναι και πιο σημαντικό έτσι μέτρο. Αλλά βέβαια είπαμε ότι όταν έχουμε μακρινές τιμές όπως αυτό το παράδειγμα που είχαμε κοιτάξει πριν με τον χρόνο που κάνει κάποιος για να έρθει από το σπίτι του στο πανεπιστήμιο. Όταν έχουμε λοιπόν μακρινές τιμές ή γενικά όταν έχουμε ασημετρία τότε ο μέσος ώρος δεν είναι το αντιπροσωπευτικό αλλά είναι η διάμεσος. Και εδώ είναι το τρίτο θέμα που λέει το συναπτικό μέτρο του περικομμένου μέσου στα αγγλικά είναι Trimmed mean. Που ακριβώς για να αποφύγουμε τις μακρινές τιμές σου λέει μην παίρνεις όλο το δείγμα σου διώξε ένα ποσοστό από αριστερά και δεξιά και κράτα το υπόλοιπο. Και αυτό λέγεται Trimmed mean ή περικομμένος μέσος. Μπορεί κάποιος λοιπόν να μας παρουσιάσει αυτό εδώ να μας δείξει τις ιδιότητες και να μας δώσει και ένα παράδειγμα. Λοιπόν νομίζω ότι θα σταματήσουμε εδώ πέρα γιατί με το άλλο θέμα δεν προχωρήσαμε. Δεν σας πειράζει φαντάζομαι. |