id |
cab19e23-5ff6-47cb-b44f-1ed11dc48c22
|
title |
08 Αναζήτηση Με Την Βοήθεια Οντολογιών /
|
spellingShingle |
08 Αναζήτηση Με Την Βοήθεια Οντολογιών /
|
publisher |
Εξ Αποστάσεως Βιβλιοθήκη & Κέντρο Πληροφόρησης ΕΑΠ
|
url |
https://www.youtube.com/watch?v=e3FELb_3gpE&list=PLyzRyKCQI9E2vH9Aa3KnIdKYhNTGGflWw
|
publishDate |
2017
|
language |
el
|
thumbnail |
http://oava-admin-api.datascouting.com/static/200f/c760/e2d0/fa82/488e/caf3/03bc/a8c0/200fc760e2d0fa82488ecaf303bca8c0.webp
|
organizationType_txt |
Βιβλιοθήκες
|
durationNormalPlayTime_txt |
1166
|
genre |
Προωθητικές δράσεις
|
genre_facet |
Προωθητικές δράσεις
|
institution |
Ελληνικό Ανοικτό Πανεπιστήμιο
|
asr_txt |
Καλησπέρα και από εμένα. Ευχαριστώ την Πρόεδρο της Βιβλιοθήκης του ΕΑΠ και Κοσμήτωρα της σχολής μας, την κυρία Μαρία Χατζη-Νικολάου για την πρόσκληση και τη συμπερίληψη μιας ομιλίας στο πρόγραμμα της εκδήλωσης. Η ομιλία αυτή θα είναι λίγο διαφορετική από τις προηγούμενες. Ελπίζω να τη βρείτε το ίδιο ενδιαφέρουσα. Η αφετηρία της ομιλίας είναι οι ραγδές τεχνολογικές εξελίξεις για τις οποίες έχετε ακούσει και ζείτε τα τελευταία χρόνια, τα οποία όσον αφορά ένα ακαδημαϊκό ίδρυμα και κυρίως την Βιβλιοθήκη του οδηγούν, αφενός στην παραγωγή ενός εξαιρετικά μεγάλου όγκου πληροφορίας, τον οποίον πρέπει να προσπελάσσουν οι άνθρωποι και ο οποίος πρέπει να μετατραπεί σε γνώση. Και αυτή η πληροφορία, τα βασικά της χαρακτηριστικά είναι ότι αφενός είναι ψηφιακή πλέον στο συνολό της και αφενός είναι ιτερογενής. Προέρχεται από πηγές και αποθηκεύεται με τρόπους οι οποίοι δεν συμφωνούν μεταξύ τους. Για να αντιμετωπίσουμε αυτά τα προβλήματα καταφεύγουμε κυρίως η τεχνολογία της πληροφορικής, της επεξεργασίας της πληροφορίας. Το βασικό μας μέσο είναι να αυτοματοποιήσουμε την επεξεργασία της πληροφορίας ώστε να μπορούμε να επεξεργαστούμε μεγάλο όγκο σε μικρό χρόνο. Και για να το πετύχουμε αυτό χρειαζόμαστε έξυπνες τεχνικές, έξυπνους αργορίθμους. Ενώ για να αντιμετωπίσουμε το ζήτημα της ετερογένειας πάλι εφαρμόζουμε λογορίθμους ομογενοποίησης ή τεργιάσματος. Πάλι λοιπόν χρειαζόμαστε έξυπνες τεχνικές. Ο πυρήνας της προσπάθειάς μας βασίζεται στην εξυπνάδα και ένα μέρος της αναπαράστασης και της διαχείρισης γνώσης που απαιτεί αυτή η εξυπνάδα ένας τρόπος είναι οι οντολογίες. Αυτός είναι ο πυρήνας της σημερινής μου ομιλίας. Θα ειστιάσω σε δύο κυρίως διαστάσεις της εφαρμογής των οντολογιών σε θέματα που σχετίζονται με τις βιβλιοθήκες. Η μία είναι η ανάκτηση πληροφοριών και η άλλη διάσταση είναι η εξαγωγή πληροφοριών. Η ανάκτηση πληροφοριών γίνεται με αναζήτηση όπως όλοι ξέρετε καθώς φαντάζομαι όλοι χρησιμοποιείται είτε οργανωμένες βιβλιοθήκες είτε τη Wikipedia είτε το παγκόσμιο ιστολογικό ιστολογικό που είναι πλέον ένα αποθετήριο γνώσης. Όμως η αναζήτηση έως τώρα τουλάχιστον γίνεται κυρίως χρησιμοποιώντας τεχνικές που δεν είναι έξυπνες, χρησιμοποιώντας δηλαδή λέξεις κλειδιά και μηχανές οι οποίες βασίζονται είτε στην χρήση έξυπνων διαμεσολαβητών intelligence agents οι οποίοι διατρέχουν το εύρος των πηγών γνώσης και επιστρέφουν ένα μεγάλο όγκο απαντήσεων τον οποίο μετά πρέπει εμείς οι ίδιοι να φιλτράρουμε είτε χρησιμοποιώντας τεχνικές τοπικής επεξεργασίας οι οποίες επεξεργάζονται την ανακτηθήσα πληροφορία και επιστρέφουν ένα μικρό όγκο απαντήσεων αλλά εξαιτίας ακριβώς αυτού του υπολογιστικού φόρτου δεν είναι δυνατόν να προσπελαστεί όλο το εύρος της διαθέσιμης πληροφορίας. Αυτές οι τεχνικές είναι ευαίσθητες λοιπόν στις λέξεις κλειδιά που θα χρησιμοποιήσουμε άρα αν δεν χρησιμοποιήσουμε τις σωστές λέξεις κλειδιά είναι δεχομένως να μην πάρουμε σχετικά αποτελέσματα και βέβαια δεν λαμβάνουν υπόψε τους το όψιο υπονοούμενο περιεχόμενο ακόμη και αυτό που εμείς μπορούμε να έχουμε στο μυαλό μας και δεν μπορούμε να εκφράσουμε με λέξεις κλειδιά. Η απάντηση τουλάχιστον σήμερα σε αυτές τις προσπάθειες είναι η λεγόμενη σημασιολογική αναζήτηση η οποία βασίζεται στη χρήση ενειών αντί λέξεων κλειδιών. Χρησιμοποιώντας τεχνικές μεγάλο μέρος των οποίων βασίζεται τις οντολογίες είναι δυνατή η διεύρυνση των ερωτημάτων που απευθύνουμε προς τις βάσεις πληροφοριών και ο μετασχηματισμός και η επιξεργασία των απαντήσεων ώστε να τελειάζουν όσο δυνατόν περισσότερο με αυτό που εμείς πραγματικά ρωτάμε. Δύο λόγια για τις οντολογίες. Φαντάζομαι δεν είστε εξεκειωμένοι με αυτό το πεδίο. Χρησιμοποιούνται από δύο πλευρές. Μετασχηματισμός για να ορίσουν τη σημασιολογία της πληροφορίας με έναν τυπικό τρόπο ώστε να είναι εύκολη η μηχανοϊκή επεξεργασία της και ταυτόχρονα χρησιμοποιούνται για να παραστήσουν έννοιες του πραγματικού κόσμου οι οποίες συνήθως συνδυάζονται με τις αναζητήσεις για να διευρύνουν την αναζήτηση και να τη φέρουν πιο κοντά στη σημασία που εμείς οι άνθρωποι δίνουμε σε αυτό. Η έννοια των οντολογιών δεν είναι πρόσφατη. Ξεκινά από την Αρχαία Ελλάδα, από τον Αριστοτέλη και άλλους σύγχρονους στο Αριστοτέλη φιλόσοφους και μεταγενέστερους. Όμως η προσέγγιση τους και ο ορισμός τους είναι λίγο διαφορετικός από αυτόν που εμείς χρησιμοποιούμε στην πληροφορική. Στην πραγματικότητα οντολογία στην πληροφορική να το πω απλά είναι τα πάντα γύρω από κάτι. Είναι ένα μοντέλο αναπαράστασης μέρους της ανθρώπινης γνώσης με τρόπο που να είναι καταναοητή και επεξεργάσιμη από μηχανές, από πληροφοριακά συστήματα. Αυτός είναι ο πιο διαδεδομένος ορισμός σήμερα, αλλάζει κάθε τόσο. Η οντολογία είναι ένας ρητός κοινός και τυπικός προορισμός του προτιθέμελου νοήματος των όρων που απαρτίζουν ένα πεδίο γνώσης. Και κάθε λέξη σε αυτόν τον ορισμό έχει κάτι σημασία και το δικό της ρόλο. Συνεπώς, με την οντολογία επιχειρούμε να προσδιορίσουμε το νόημα των όρων. Δεν μας ενδιαφέρουν ακριβώς οι λέξεις, αλλά το τι σημαίνουν αυτές οι λέξεις. Και μάλιστα το νόημα που δίνει αυτός που χρησιμοποιεί, που κατασκευάζει την οντολογία σε αυτές τις λέξεις. Οι οντολογίες είναι υποκειμενικές κατασκευές. Κατασκευάζονται από ανθρώπους, από ομάδες και αντικατοπιέζουν την οπτική αυτών. Όμως, ο οποιοσδήποτε προσδιορισμός καταγράφεται μερικό τρόπο ώστε να είναι δυνατό μετά να μπορούμε να το χρησιμοποιήσουμε. Σε αυτό συνεισφέρει και το ότι καταγράφεται με τρόπο τυπικό, formal. Πίσω από τους οντολογίες βρίσκεται ένα μεγάλο μέρος της επιστήμης των μαθηματικών, που υποστηρίζει τον τρόπο χρήσης τους. Και βέβαια, ο προσδιορισμός των ύματων πρέπει να είναι κοινός, τουλάχιστον στην ομάδα που ανέπτυξε την συγκεκριμένη οντολογία. Θα στα γρήγορα να σας πω ότι οι οντολογίες αποτελούνται από κλάσεις και σχέσεις μεταξύ των κλάσεων. Οι κλάσεις αναπαριστούν έννοιες, πανεπιστήμιο, φοιτητής κλπ. Είναι έννοιες που θα τέργησαν σε μια οντολογία για ένα πανεπιστήμιο, καθηγητής. Και σχέσεις μεταξύ των ενοιών, όπως ότι μια έννοια είναι μέρος μιας άλλης έννοιας, μια έννοια είναι εξειδίκευση μιας άλλης έννοιας, μια έννοια σχετίζεται με κάποιον τρόπο με μια άλλη έννοια. Επιπλέον, έχουμε και ειδικότερα χαρακτηριστικά οντολογίες, συναρτήσεις που δίνουν τον τρόπο με τον οποίο σχετίζονται οι έννοιες μεταξύ τους, αξιώματα, αλήθειες δηλαδή που τις χρησιμοποιούμε χωρίς να χρειαστεί να αποδείξουμε την ορθότητά τους, και αυτά εκφράζουμε με τη μορφή κανόνων και βέβαια τιμές. Για παράδειγμα, στην κλάση φοιτητής, μια τιμή είναι ένας συγκεκριμένος φοιτητής με ένα συγκεκριμένο ονοματεπώνυμο και αριθμό μετρόου. Μέσα σε μια τέτοια δομή, εάν εμπλουτίσουμε μια τέτοια δομή με την απαραίτητη πληροφορία, είναι δυνατό μετά να χρησιμοποιήσουμε τη δομή αυτή για να εξάγουμε γνώση και πληροφορία. Οι οντολογίες εκφράζονται, αν απαραίσθηται, με πολλούς τρόπους, είτε σαν δίκτυα, όπως βλέπετε αριστερά, είτε σαν ιεραρχίες, όπως βλέπετε πάνω δεξιά ή κάτω αριστερά, ή με άλλους πρόσφορους τρόπους. Υπάρχουν εργαλεία που μας βοηθούν να τις κατασκευάσουμε. Ένα διαδομένο εργαλείο είναι το PROTEZE που έχει φτιαχθεί στο MIT και είναι αυτό που βλέπετε πάνω δεξιά, τα οποία βέβαια, ενδυστυχώς, το καθένα από τα οποία έχει το δικό του σύνολο περιορισμών, κανένα από αυτά δεν οδηγεί σε μια οντολογία που να είναι ένα πλήρες δίκτυο έννοιων. Σε αυτό που μας ενδιαφέρει, οι οντολογίες αναπαρρυσούν την πληροφορία που αφορά σε ένα συγκεκριμένο γνωστικό πεδίο με τρόπος να μπορεί αυτή η πληροφορία να διαμοιραστεί και να επαναχρησιμοποιηθεί. Αυτά είναι βασικές δραστηριότητες που συμβαίνουν σε μια βιβλιοθήκη. Επιτρέπουν τη διαλειτουργικότητα μεταξύ υπολογιστικών συστημάτων ακριβώς γιατί λειτουργούν ως μηχανισμί μετάφρασης και επιτρέπουν σε υπολογιστικά συστήματα να εξαγάγουν γνώση, αλλά και να επεκτείνουν τη γνώση που διαθέτουν, τη γνώση μέσα εισαγωγικά, την τοποθετώ, επεξαργαζόμενα τις πληροφορίες που ανακτούν. Ερχόμαστε, λοιπόν, στη δεύτερη διάσταση, στο δεύτερο, αν θέλετε, σημαντικό πηλώνα της ομιλίας, που έχει να κάνει με την εξαγωγή γνώσης, την εξαγωγή πληροφορίας. Πρόκειται για ένα άλλο μεγάλο ερευνητικό πεδίο, η αυτόματη εξαγωγή πληροφορίας, η οποία στις βιβλιοθήκες, για παράδειγμα, είναι χρήσιμη όταν πρέπει κανείς να αυτόματα ανακατηγοροποιήσει και να κατατάξει ένα σύνολο τεκμηρίων. Ως τώρα η δουλειά γίνεται με το χέρι, φαντάζομαι ακόμα γίνεται με το χέρι, όμως υπάρχουν εργαλεία τα οποία επεξεργάζονται το περιεχόμενο και μπορούν να παράξουν πληροφορία, η οποία μπορεί να χρησιμοποιηθεί ως μεταδεδομένο, ως μεταδεδομένα για το συγκεκριμένο τεκμηρίο. Τι είναι λοιπόν η εξαγωγή πληροφορίας, είναι η παραγωγή δομημένων πληροφοριών από αδόμητοις ή μηδομημένες πηγές, με αυτόματο ή μη αυτόματο τρόπο. Συνήθως είναι η μη αυτόματος ο τρόπος. Όσα αδόμητοις πηγές μπορούμε να θεωρήσουμε κείμενα φυσικής γλώσσας, που δεν περιλαμβάνουν κάποια μεταδεδομένα ή κάποια δομή, αλλά και ήμοι δομημένες πηγές, οι οποίες έχουν κάποια δομή, όπως διάφορες οδηγίες και κατάλογες, πίνακες, λίστες, ιστοσελίδες, ειδικά με τις γνώσεις γλώσσες, markup γλώσσες τελευταίας γενιάς, ιστοσελίδες ποια είναι δομημένες και άλλες δομημένες δημοσιεύσεις. Το αποτέλεσμα της εξαγωγής γνώσης είναι να παίρνουμε δομημένες πληροφορίες, δηλαδή πληροφορίες που είναι οργανωμένες με σαφήνια, περιέχουν ποσοδικά στοιχεία, μας βοηθούν να δημιουργήσουμε αναπαραστάσεις. Και τέτοιοι τύποι πληροφορίες μπορεί να είναι το επισυμμασμένο κείμενο, το tagged text, δηλαδή κείμενο που περιέχει και κωδικές λέξεις σε διάφορα σημεία, πίνακες, templates, βάσεις δομένων και οπωσδήποτε οδηλογίες. Η εξαγωγή πληροφορίας περιλαμβάνει κάποιες εργασίες, ξεκινώντας από απλές εργασίες όπως είναι η εξαγωγή τιμών από ένα κείμενο και πηγαίνοντας σε πιο πολύπλοκες εργασίες όπως είναι η εξαγωγή σενάριων. Τις περνάω στα γρήγορα. Όταν μιλάμε για εξαγωγή τιμών, αναφερόμαστε στο εντοπισμό και χαρακτηρισμό αριθμητικών τιμών, στοιχείων επικοινωνίας, χρονικών εκφράσεων, ονομάτων και λοιπά, μέσα από ένα κείμενο, ένα πίνακα ή οποιαδήποτε άλλη πηγή, στην αναγνώρισή τους ότι αυτά είναι αυτού του είδους η πληροφορία και στην καταγραφή τους. Η εξαγωγή ιδιωτήτων περιλαμβάνει οντότητες, όπως ανέφερα πριν, φοιτητής, καθηγητής, δηλαδή να αντιληφθούμε ότι το τάδιο όνομα που εμφανίζεται μέσα στο κείμενο είναι φοιτητής ή είναι καθηγητής. Να δούμε δηλαδή σε ποια κατηγορία ανήκει αυτό το όνομα, τύποι οντοτήτων που συνήθως εξάγονται, πρόσωπα, ανταποθεσίες, εταιρίες, πόλεις, χώρες και άλλες, αν θέλετε, κατηγορίες οντοτήτων. Η εξαγωγή ιδιωτήτων αφορά στην εξαγωγή χαρακτηριστικών των οντοτήτων που έχουν εξαχθεί. Για παράδειγμα, εντοπίσαμε την τιμή Νίκος Γεωργίου, ο οποίος καταλάβαμε ότι ανήκει στην οντότητα φοιτητής και ποια ιδιαίτερα χαρακτηριστικά έχει ο Νίκος Γεωργίου τα οποία συνιστούν χαρακτηριστικά της οντότητας φοιτητής, με επεξεργασία κειμένου μπορούμε να καταγράψουμε αυτά τα χαρακτηριστικά. Τέτοια χαρακτηριστικά μπορεί να είναι η μερωμηνία γέννησης του προσώπου, ηλικία, ύψος, βάρος, κόστος ενός αγαθού, όπως και πιο αφιερημένα χαρακτηριστικά γνώμη ή γνώμες που έχει εκφέρει αυτό το πρόσωπο ή που έχουν εκφραστεί για το πρόσωπο αυτό, αισθήματα και λοιπά. Η εξαγωγή συσχετίσεων αφορά στην παραγωγή σχέσεων ανάμεσα στις οντότητες που έχουν εξαχθεί, οι σχέσεις που λένε ιδιαδικές, τριμερής, πολυμερής. Οι πιο απλές σχέσεις, όπως καταλαβαίνετε, είναι οι ιδιαδικές, φίλος, πατέρας, αδελφός, προστάμενος, ιδιοκτήτης, συμφυτητής, καθηγητής και όλα αυτά, αλλά υπάρχουν και πιο σύνθετες σχέσεις. Υπάρχουν και εξειδικευμένες οντολογίες που εκφράζουν αυτές τις σχέσεις, όπως η γνωστή οντολογία friend of a friend που χρησιμοποιείται στα μέσα κοινωνικής δικτύουσες για να εντοπίσουμε τη συσχέτηση ατόμων που χρησιμοποιούν τα μέσα αυτά. Και η πιο σύνθετη εξαγωγή πληροφορίας είναι η εξαγωγή σενάριων, η οποία περιλαμβάνει όλα τα προηγούμενα μαζί. Ο εντοπισμός ενός κοινωνικού γεγονότους, για παράδειγμα, στο οποίο ενεπλάκισαν συγκεκριμένα άτομα, τα οποία ανήκουν σε κάποιες οντότητες, κάποιες κατηγορίες που έχουν κάποια σχέση μεταξύ τους και λοιπά. Αυτή είναι η πιο δύσκολη μορφή εξαγωγής πληροφορίας από ειμιδομημένες σπηλές. Ποιος είναι ο ρόλος των οντολογιών εδώ? Είναι διπλώς. Αφενός, οι οντολογίες μπορούν να αποτελέσουν τα αποτέλεσμα της εξαγωγής πληροφορίας. Δηλαδή, όλα τα προηγούμενα, όλη την πληροφορία που εξάγουμε με τους τρόπους που σας ανέφερα, μπορούμε να την καταγράψουμε σε μια οντολογία. Ήδη η ορολογία που χρησιμοποίησα για την εξαγωγή πληροφορίας ήταν συγγενής με τις οντολογίες. Δηλαδή, μιλούσε για κλάσεις, για συσκετήσεις, για τιμές. Ο δεύτερος ρόλος είναι να χρησιμοποιείται η οντολογία ως αφετηρία για την εξαγωγή πληροφορίας. Δηλαδή, ήδη έχω εγώ μια καταγραφή του πεδίου με τη μορφή μιας οντολογίας, τη χρησιμοποιώ για να κάνω αναζήτηση στη βάση πληροφορίας. Χρησιμοποιώ την οντολογία για να διευρύνω την αναζήτηση και άρα να κάνω σημασιολογικά πλούση αναζήτηση και το αποτέλεσμα της εξαγωγής πληροφορίας από τις πηγές το επιστρέφω στην οντολογία και την εμπλουτίζω. Συνεπώς, το αποτέλεσμα της διαδικασίας αυτής είναι μια πιο πλούσια οντολογία. Πώς, λοιπόν, μπορεί να γίνει σημασιολογική αναζήτηση σε ψηφιακές βιβλιοθήκες με τη βοήθεια των οντολογιών. Αυτές είναι οι τρεις τεχνικές που έχουμε δει να εφαρμόζονται. Οι δυο πρώτες είναι περισσότερο διαδεδομένες. Η τρίτη είναι καινούργια τεχνική και αποτελεί και τη δική μας ερευνητική εστιάση, αν θέλετε. Η τεχνική που βασίζεται σε μια γενική οντολογία απαιτεί την ύπαρξη μιας γενικευμένης οντολογίας για το πεδίο στο οποίο κάνουμε την αναζήτηση. Παράδειγμα, μια οντολογία για την πόλη της Πάτρας ή της πόλης γενικότερα. Αν θέλουμε να ζητήσουμε πληροφορίες σχετικά με πόλης. Το πρόβλημα που έχει αυτή η τεχνική είναι ότι είναι δύσκολο να έχεις μια γενικευμένη οντολογία στην οποία συμφωνούν όλοι. Επιπλέον είναι δύσκολο, επειδή ακριβώς αυτή η οντολογία παρέχει μια μοναδική άποψη της γνώσης, είναι δύσκολο να μην εμφανιστούν αποκλήσεις από αυτή την οντολογία. Και είναι δύσκολο αυτή η οντολογία να είναι σωστή. Άρα, με το που εμφανίζονται νέα τεκμήρια, απειθαινώνουν αυτή η οντολογία να αποδειχτεί αντιφατική. Και επιπλέον μια μεγάλη οντολογία είναι δύσκολο να την επεξεργαστεί. Κανείς απαιτεί χρόνο και χώρο αποθήκευσης. Η δεύτερη τεχνική βασίζεται στο τέργεσμα των οντολογιών. Η δεύτερη ομάδα τεχνικών. Εδώ έχουμε δύο τεχνικές. Η μία είναι η αυθιγράμιση οντολογιών όπου έχουμε πολλές μικρές οντολογίες και προσπαθούμε να βρούμε τον κοινό τους τόπο, πώς ταιριάζουν μεταξύ τους. Και τη συγχώνευση οντολογιών που προχωράει ένα βήμα παραπέρα και ενώνει τις μικρές οντολογίες σε μια μεγάλη. Η δεύτερη τεχνική που περιλαμβάνει τη συγχώνευση οντολογιών έχει τα πλαιονεκτήματα και τα εμειονεκτήματα της γενικής οντολογίας. Καθώς στο τέλος από τη συγχώνευση των οντολογιών θα παραχτεί μια γενική οντολογία και επιπλέον παρουσιάζει δυσκολία στην επεξεργασία. Στην κατασκευή της συγχωρευμένης οντολογίας καθότι απαιτεί υπολογιστικός φόρος και μπορούν να υπάρχουν αντιφάσεις ανάμεσα στις επιμέρους οντολογίες. Ναι μεν, όταν έχεις πολλές επιμέρους οντολογίες εκφράζεις απόψεις πολλών δημιουργών πληροφορίας. Προσπαθώντας όμως να συνεργιάξεις όλες αυτές τις απόψεις σε μια συγχωρευμένη οντολογία, είναι πιθανό ότι δεν θα πετύχει αυτή η προσπάθεια. Και ερχόμαστε στην τρίτη τεχνική που είναι αυτή που εμείς σαν ομάδα στηρίζουμε, τη χρήση δικτύου ευθυγραμμισμένων οντολογιών. Εδώ δεν γίνεται καμία συγχωρευσή, επιμέρους οντολογίες υπάρχουν, άρα κάθε τεκμήριο ή κάθε ομάδα τεκμηρίων μπορεί να έρχεται με τη δική του περιγραφή, υπομορφή μεταδομένων τα οποία βασίζονται σε κάποια οντολογία και όταν αναζητούμε, κάνουμε αναζήτηση σε ένα σύνολο τεκμηρίων, αυτό που χρειάζεται να κάνουμε είναι να ταιριάξουμε τις οντολογίες των μεταδομένων μεταξύ τους. Αυτό μπορεί να έχει γίνει από πριν και να έχουμε αποθηκευμένα τοτερειάσματα έτσι ώστε η επεξεργασία να είναι γρήγορη ή μπορεί να γίνεται online αλλά αυτό δεν μπορεί να γίνει σε πραγματικό χρόνο ακόμα με τις μηχανές που διαθέτουμε. Όμως με μια τέτοια προσέγγιση έχουμε πιο πλούσια σημασιολογία γιατί κανενός η άποψη δεν χάνεται, δεν καταπιέζεται, όλες οι απόψεις είναι διαθέσιμες, όλες οι οπτικές γωνίες είναι καλύτερα να πω. Έχουμε εξατομικευμένη προσέγγιση σε θέματα στην αναζήτηση διότι ο χρήστης μπορεί να διαλέξει το τέριασμα που επιθυμεί και όχι όποιο τέριασμα του προσφέρει το σύστημα. Και στην πραγματικότητα δεν δημιουργούμε νέα πληροφορία, απλά ταιριάζουμε την πληροφορία που υπάρχει. Ευχαριστώ για την προσοχή σας. Ήταν μια πιο τεχνική, αν θέλετε, ομιλία σε σχέση με τις προηγούμενες, αλλά προσπάθησα να σας δώσω insight, να σας δώσω, να ανοίξω μια πόρτα και να παρουσιάσω ότι γίνεται έρευνα στην επεξεργασία πληροφορίας η οποία εφαρμόζεται στις σύγχρονες βιβλιοθήκες. Για περισσότερες πληροφορίες, προφανώς, μπορείτε να επικερωνήσετε μαζί μου. Ευχαριστώ.
|
_version_ |
1782816229699878912
|
description |
: Καλησπέρα και από εμένα. Ευχαριστώ την Πρόεδρο της Βιβλιοθήκης του ΕΑΠ και Κοσμήτωρα της σχολής μας, την κυρία Μαρία Χατζη-Νικολάου για την πρόσκληση και τη συμπερίληψη μιας ομιλίας στο πρόγραμμα της εκδήλωσης. Η ομιλία αυτή θα είναι λίγο διαφορετική από τις προηγούμενες. Ελπίζω να τη βρείτε το ίδιο ενδιαφέρουσα. Η αφετηρία της ομιλίας είναι οι ραγδές τεχνολογικές εξελίξεις για τις οποίες έχετε ακούσει και ζείτε τα τελευταία χρόνια, τα οποία όσον αφορά ένα ακαδημαϊκό ίδρυμα και κυρίως την Βιβλιοθήκη του οδηγούν, αφενός στην παραγωγή ενός εξαιρετικά μεγάλου όγκου πληροφορίας, τον οποίον πρέπει να προσπελάσσουν οι άνθρωποι και ο οποίος πρέπει να μετατραπεί σε γνώση. Και αυτή η πληροφορία, τα βασικά της χαρακτηριστικά είναι ότι αφενός είναι ψηφιακή πλέον στο συνολό της και αφενός είναι ιτερογενής. Προέρχεται από πηγές και αποθηκεύεται με τρόπους οι οποίοι δεν συμφωνούν μεταξύ τους. Για να αντιμετωπίσουμε αυτά τα προβλήματα καταφεύγουμε κυρίως η τεχνολογία της πληροφορικής, της επεξεργασίας της πληροφορίας. Το βασικό μας μέσο είναι να αυτοματοποιήσουμε την επεξεργασία της πληροφορίας ώστε να μπορούμε να επεξεργαστούμε μεγάλο όγκο σε μικρό χρόνο. Και για να το πετύχουμε αυτό χρειαζόμαστε έξυπνες τεχνικές, έξυπνους αργορίθμους. Ενώ για να αντιμετωπίσουμε το ζήτημα της ετερογένειας πάλι εφαρμόζουμε λογορίθμους ομογενοποίησης ή τεργιάσματος. Πάλι λοιπόν χρειαζόμαστε έξυπνες τεχνικές. Ο πυρήνας της προσπάθειάς μας βασίζεται στην εξυπνάδα και ένα μέρος της αναπαράστασης και της διαχείρισης γνώσης που απαιτεί αυτή η εξυπνάδα ένας τρόπος είναι οι οντολογίες. Αυτός είναι ο πυρήνας της σημερινής μου ομιλίας. Θα ειστιάσω σε δύο κυρίως διαστάσεις της εφαρμογής των οντολογιών σε θέματα που σχετίζονται με τις βιβλιοθήκες. Η μία είναι η ανάκτηση πληροφοριών και η άλλη διάσταση είναι η εξαγωγή πληροφοριών. Η ανάκτηση πληροφοριών γίνεται με αναζήτηση όπως όλοι ξέρετε καθώς φαντάζομαι όλοι χρησιμοποιείται είτε οργανωμένες βιβλιοθήκες είτε τη Wikipedia είτε το παγκόσμιο ιστολογικό ιστολογικό που είναι πλέον ένα αποθετήριο γνώσης. Όμως η αναζήτηση έως τώρα τουλάχιστον γίνεται κυρίως χρησιμοποιώντας τεχνικές που δεν είναι έξυπνες, χρησιμοποιώντας δηλαδή λέξεις κλειδιά και μηχανές οι οποίες βασίζονται είτε στην χρήση έξυπνων διαμεσολαβητών intelligence agents οι οποίοι διατρέχουν το εύρος των πηγών γνώσης και επιστρέφουν ένα μεγάλο όγκο απαντήσεων τον οποίο μετά πρέπει εμείς οι ίδιοι να φιλτράρουμε είτε χρησιμοποιώντας τεχνικές τοπικής επεξεργασίας οι οποίες επεξεργάζονται την ανακτηθήσα πληροφορία και επιστρέφουν ένα μικρό όγκο απαντήσεων αλλά εξαιτίας ακριβώς αυτού του υπολογιστικού φόρτου δεν είναι δυνατόν να προσπελαστεί όλο το εύρος της διαθέσιμης πληροφορίας. Αυτές οι τεχνικές είναι ευαίσθητες λοιπόν στις λέξεις κλειδιά που θα χρησιμοποιήσουμε άρα αν δεν χρησιμοποιήσουμε τις σωστές λέξεις κλειδιά είναι δεχομένως να μην πάρουμε σχετικά αποτελέσματα και βέβαια δεν λαμβάνουν υπόψε τους το όψιο υπονοούμενο περιεχόμενο ακόμη και αυτό που εμείς μπορούμε να έχουμε στο μυαλό μας και δεν μπορούμε να εκφράσουμε με λέξεις κλειδιά. Η απάντηση τουλάχιστον σήμερα σε αυτές τις προσπάθειες είναι η λεγόμενη σημασιολογική αναζήτηση η οποία βασίζεται στη χρήση ενειών αντί λέξεων κλειδιών. Χρησιμοποιώντας τεχνικές μεγάλο μέρος των οποίων βασίζεται τις οντολογίες είναι δυνατή η διεύρυνση των ερωτημάτων που απευθύνουμε προς τις βάσεις πληροφοριών και ο μετασχηματισμός και η επιξεργασία των απαντήσεων ώστε να τελειάζουν όσο δυνατόν περισσότερο με αυτό που εμείς πραγματικά ρωτάμε. Δύο λόγια για τις οντολογίες. Φαντάζομαι δεν είστε εξεκειωμένοι με αυτό το πεδίο. Χρησιμοποιούνται από δύο πλευρές. Μετασχηματισμός για να ορίσουν τη σημασιολογία της πληροφορίας με έναν τυπικό τρόπο ώστε να είναι εύκολη η μηχανοϊκή επεξεργασία της και ταυτόχρονα χρησιμοποιούνται για να παραστήσουν έννοιες του πραγματικού κόσμου οι οποίες συνήθως συνδυάζονται με τις αναζητήσεις για να διευρύνουν την αναζήτηση και να τη φέρουν πιο κοντά στη σημασία που εμείς οι άνθρωποι δίνουμε σε αυτό. Η έννοια των οντολογιών δεν είναι πρόσφατη. Ξεκινά από την Αρχαία Ελλάδα, από τον Αριστοτέλη και άλλους σύγχρονους στο Αριστοτέλη φιλόσοφους και μεταγενέστερους. Όμως η προσέγγιση τους και ο ορισμός τους είναι λίγο διαφορετικός από αυτόν που εμείς χρησιμοποιούμε στην πληροφορική. Στην πραγματικότητα οντολογία στην πληροφορική να το πω απλά είναι τα πάντα γύρω από κάτι. Είναι ένα μοντέλο αναπαράστασης μέρους της ανθρώπινης γνώσης με τρόπο που να είναι καταναοητή και επεξεργάσιμη από μηχανές, από πληροφοριακά συστήματα. Αυτός είναι ο πιο διαδεδομένος ορισμός σήμερα, αλλάζει κάθε τόσο. Η οντολογία είναι ένας ρητός κοινός και τυπικός προορισμός του προτιθέμελου νοήματος των όρων που απαρτίζουν ένα πεδίο γνώσης. Και κάθε λέξη σε αυτόν τον ορισμό έχει κάτι σημασία και το δικό της ρόλο. Συνεπώς, με την οντολογία επιχειρούμε να προσδιορίσουμε το νόημα των όρων. Δεν μας ενδιαφέρουν ακριβώς οι λέξεις, αλλά το τι σημαίνουν αυτές οι λέξεις. Και μάλιστα το νόημα που δίνει αυτός που χρησιμοποιεί, που κατασκευάζει την οντολογία σε αυτές τις λέξεις. Οι οντολογίες είναι υποκειμενικές κατασκευές. Κατασκευάζονται από ανθρώπους, από ομάδες και αντικατοπιέζουν την οπτική αυτών. Όμως, ο οποιοσδήποτε προσδιορισμός καταγράφεται μερικό τρόπο ώστε να είναι δυνατό μετά να μπορούμε να το χρησιμοποιήσουμε. Σε αυτό συνεισφέρει και το ότι καταγράφεται με τρόπο τυπικό, formal. Πίσω από τους οντολογίες βρίσκεται ένα μεγάλο μέρος της επιστήμης των μαθηματικών, που υποστηρίζει τον τρόπο χρήσης τους. Και βέβαια, ο προσδιορισμός των ύματων πρέπει να είναι κοινός, τουλάχιστον στην ομάδα που ανέπτυξε την συγκεκριμένη οντολογία. Θα στα γρήγορα να σας πω ότι οι οντολογίες αποτελούνται από κλάσεις και σχέσεις μεταξύ των κλάσεων. Οι κλάσεις αναπαριστούν έννοιες, πανεπιστήμιο, φοιτητής κλπ. Είναι έννοιες που θα τέργησαν σε μια οντολογία για ένα πανεπιστήμιο, καθηγητής. Και σχέσεις μεταξύ των ενοιών, όπως ότι μια έννοια είναι μέρος μιας άλλης έννοιας, μια έννοια είναι εξειδίκευση μιας άλλης έννοιας, μια έννοια σχετίζεται με κάποιον τρόπο με μια άλλη έννοια. Επιπλέον, έχουμε και ειδικότερα χαρακτηριστικά οντολογίες, συναρτήσεις που δίνουν τον τρόπο με τον οποίο σχετίζονται οι έννοιες μεταξύ τους, αξιώματα, αλήθειες δηλαδή που τις χρησιμοποιούμε χωρίς να χρειαστεί να αποδείξουμε την ορθότητά τους, και αυτά εκφράζουμε με τη μορφή κανόνων και βέβαια τιμές. Για παράδειγμα, στην κλάση φοιτητής, μια τιμή είναι ένας συγκεκριμένος φοιτητής με ένα συγκεκριμένο ονοματεπώνυμο και αριθμό μετρόου. Μέσα σε μια τέτοια δομή, εάν εμπλουτίσουμε μια τέτοια δομή με την απαραίτητη πληροφορία, είναι δυνατό μετά να χρησιμοποιήσουμε τη δομή αυτή για να εξάγουμε γνώση και πληροφορία. Οι οντολογίες εκφράζονται, αν απαραίσθηται, με πολλούς τρόπους, είτε σαν δίκτυα, όπως βλέπετε αριστερά, είτε σαν ιεραρχίες, όπως βλέπετε πάνω δεξιά ή κάτω αριστερά, ή με άλλους πρόσφορους τρόπους. Υπάρχουν εργαλεία που μας βοηθούν να τις κατασκευάσουμε. Ένα διαδομένο εργαλείο είναι το PROTEZE που έχει φτιαχθεί στο MIT και είναι αυτό που βλέπετε πάνω δεξιά, τα οποία βέβαια, ενδυστυχώς, το καθένα από τα οποία έχει το δικό του σύνολο περιορισμών, κανένα από αυτά δεν οδηγεί σε μια οντολογία που να είναι ένα πλήρες δίκτυο έννοιων. Σε αυτό που μας ενδιαφέρει, οι οντολογίες αναπαρρυσούν την πληροφορία που αφορά σε ένα συγκεκριμένο γνωστικό πεδίο με τρόπος να μπορεί αυτή η πληροφορία να διαμοιραστεί και να επαναχρησιμοποιηθεί. Αυτά είναι βασικές δραστηριότητες που συμβαίνουν σε μια βιβλιοθήκη. Επιτρέπουν τη διαλειτουργικότητα μεταξύ υπολογιστικών συστημάτων ακριβώς γιατί λειτουργούν ως μηχανισμί μετάφρασης και επιτρέπουν σε υπολογιστικά συστήματα να εξαγάγουν γνώση, αλλά και να επεκτείνουν τη γνώση που διαθέτουν, τη γνώση μέσα εισαγωγικά, την τοποθετώ, επεξαργαζόμενα τις πληροφορίες που ανακτούν. Ερχόμαστε, λοιπόν, στη δεύτερη διάσταση, στο δεύτερο, αν θέλετε, σημαντικό πηλώνα της ομιλίας, που έχει να κάνει με την εξαγωγή γνώσης, την εξαγωγή πληροφορίας. Πρόκειται για ένα άλλο μεγάλο ερευνητικό πεδίο, η αυτόματη εξαγωγή πληροφορίας, η οποία στις βιβλιοθήκες, για παράδειγμα, είναι χρήσιμη όταν πρέπει κανείς να αυτόματα ανακατηγοροποιήσει και να κατατάξει ένα σύνολο τεκμηρίων. Ως τώρα η δουλειά γίνεται με το χέρι, φαντάζομαι ακόμα γίνεται με το χέρι, όμως υπάρχουν εργαλεία τα οποία επεξεργάζονται το περιεχόμενο και μπορούν να παράξουν πληροφορία, η οποία μπορεί να χρησιμοποιηθεί ως μεταδεδομένο, ως μεταδεδομένα για το συγκεκριμένο τεκμηρίο. Τι είναι λοιπόν η εξαγωγή πληροφορίας, είναι η παραγωγή δομημένων πληροφοριών από αδόμητοις ή μηδομημένες πηγές, με αυτόματο ή μη αυτόματο τρόπο. Συνήθως είναι η μη αυτόματος ο τρόπος. Όσα αδόμητοις πηγές μπορούμε να θεωρήσουμε κείμενα φυσικής γλώσσας, που δεν περιλαμβάνουν κάποια μεταδεδομένα ή κάποια δομή, αλλά και ήμοι δομημένες πηγές, οι οποίες έχουν κάποια δομή, όπως διάφορες οδηγίες και κατάλογες, πίνακες, λίστες, ιστοσελίδες, ειδικά με τις γνώσεις γλώσσες, markup γλώσσες τελευταίας γενιάς, ιστοσελίδες ποια είναι δομημένες και άλλες δομημένες δημοσιεύσεις. Το αποτέλεσμα της εξαγωγής γνώσης είναι να παίρνουμε δομημένες πληροφορίες, δηλαδή πληροφορίες που είναι οργανωμένες με σαφήνια, περιέχουν ποσοδικά στοιχεία, μας βοηθούν να δημιουργήσουμε αναπαραστάσεις. Και τέτοιοι τύποι πληροφορίες μπορεί να είναι το επισυμμασμένο κείμενο, το tagged text, δηλαδή κείμενο που περιέχει και κωδικές λέξεις σε διάφορα σημεία, πίνακες, templates, βάσεις δομένων και οπωσδήποτε οδηλογίες. Η εξαγωγή πληροφορίας περιλαμβάνει κάποιες εργασίες, ξεκινώντας από απλές εργασίες όπως είναι η εξαγωγή τιμών από ένα κείμενο και πηγαίνοντας σε πιο πολύπλοκες εργασίες όπως είναι η εξαγωγή σενάριων. Τις περνάω στα γρήγορα. Όταν μιλάμε για εξαγωγή τιμών, αναφερόμαστε στο εντοπισμό και χαρακτηρισμό αριθμητικών τιμών, στοιχείων επικοινωνίας, χρονικών εκφράσεων, ονομάτων και λοιπά, μέσα από ένα κείμενο, ένα πίνακα ή οποιαδήποτε άλλη πηγή, στην αναγνώρισή τους ότι αυτά είναι αυτού του είδους η πληροφορία και στην καταγραφή τους. Η εξαγωγή ιδιωτήτων περιλαμβάνει οντότητες, όπως ανέφερα πριν, φοιτητής, καθηγητής, δηλαδή να αντιληφθούμε ότι το τάδιο όνομα που εμφανίζεται μέσα στο κείμενο είναι φοιτητής ή είναι καθηγητής. Να δούμε δηλαδή σε ποια κατηγορία ανήκει αυτό το όνομα, τύποι οντοτήτων που συνήθως εξάγονται, πρόσωπα, ανταποθεσίες, εταιρίες, πόλεις, χώρες και άλλες, αν θέλετε, κατηγορίες οντοτήτων. Η εξαγωγή ιδιωτήτων αφορά στην εξαγωγή χαρακτηριστικών των οντοτήτων που έχουν εξαχθεί. Για παράδειγμα, εντοπίσαμε την τιμή Νίκος Γεωργίου, ο οποίος καταλάβαμε ότι ανήκει στην οντότητα φοιτητής και ποια ιδιαίτερα χαρακτηριστικά έχει ο Νίκος Γεωργίου τα οποία συνιστούν χαρακτηριστικά της οντότητας φοιτητής, με επεξεργασία κειμένου μπορούμε να καταγράψουμε αυτά τα χαρακτηριστικά. Τέτοια χαρακτηριστικά μπορεί να είναι η μερωμηνία γέννησης του προσώπου, ηλικία, ύψος, βάρος, κόστος ενός αγαθού, όπως και πιο αφιερημένα χαρακτηριστικά γνώμη ή γνώμες που έχει εκφέρει αυτό το πρόσωπο ή που έχουν εκφραστεί για το πρόσωπο αυτό, αισθήματα και λοιπά. Η εξαγωγή συσχετίσεων αφορά στην παραγωγή σχέσεων ανάμεσα στις οντότητες που έχουν εξαχθεί, οι σχέσεις που λένε ιδιαδικές, τριμερής, πολυμερής. Οι πιο απλές σχέσεις, όπως καταλαβαίνετε, είναι οι ιδιαδικές, φίλος, πατέρας, αδελφός, προστάμενος, ιδιοκτήτης, συμφυτητής, καθηγητής και όλα αυτά, αλλά υπάρχουν και πιο σύνθετες σχέσεις. Υπάρχουν και εξειδικευμένες οντολογίες που εκφράζουν αυτές τις σχέσεις, όπως η γνωστή οντολογία friend of a friend που χρησιμοποιείται στα μέσα κοινωνικής δικτύουσες για να εντοπίσουμε τη συσχέτηση ατόμων που χρησιμοποιούν τα μέσα αυτά. Και η πιο σύνθετη εξαγωγή πληροφορίας είναι η εξαγωγή σενάριων, η οποία περιλαμβάνει όλα τα προηγούμενα μαζί. Ο εντοπισμός ενός κοινωνικού γεγονότους, για παράδειγμα, στο οποίο ενεπλάκισαν συγκεκριμένα άτομα, τα οποία ανήκουν σε κάποιες οντότητες, κάποιες κατηγορίες που έχουν κάποια σχέση μεταξύ τους και λοιπά. Αυτή είναι η πιο δύσκολη μορφή εξαγωγής πληροφορίας από ειμιδομημένες σπηλές. Ποιος είναι ο ρόλος των οντολογιών εδώ? Είναι διπλώς. Αφενός, οι οντολογίες μπορούν να αποτελέσουν τα αποτέλεσμα της εξαγωγής πληροφορίας. Δηλαδή, όλα τα προηγούμενα, όλη την πληροφορία που εξάγουμε με τους τρόπους που σας ανέφερα, μπορούμε να την καταγράψουμε σε μια οντολογία. Ήδη η ορολογία που χρησιμοποίησα για την εξαγωγή πληροφορίας ήταν συγγενής με τις οντολογίες. Δηλαδή, μιλούσε για κλάσεις, για συσκετήσεις, για τιμές. Ο δεύτερος ρόλος είναι να χρησιμοποιείται η οντολογία ως αφετηρία για την εξαγωγή πληροφορίας. Δηλαδή, ήδη έχω εγώ μια καταγραφή του πεδίου με τη μορφή μιας οντολογίας, τη χρησιμοποιώ για να κάνω αναζήτηση στη βάση πληροφορίας. Χρησιμοποιώ την οντολογία για να διευρύνω την αναζήτηση και άρα να κάνω σημασιολογικά πλούση αναζήτηση και το αποτέλεσμα της εξαγωγής πληροφορίας από τις πηγές το επιστρέφω στην οντολογία και την εμπλουτίζω. Συνεπώς, το αποτέλεσμα της διαδικασίας αυτής είναι μια πιο πλούσια οντολογία. Πώς, λοιπόν, μπορεί να γίνει σημασιολογική αναζήτηση σε ψηφιακές βιβλιοθήκες με τη βοήθεια των οντολογιών. Αυτές είναι οι τρεις τεχνικές που έχουμε δει να εφαρμόζονται. Οι δυο πρώτες είναι περισσότερο διαδεδομένες. Η τρίτη είναι καινούργια τεχνική και αποτελεί και τη δική μας ερευνητική εστιάση, αν θέλετε. Η τεχνική που βασίζεται σε μια γενική οντολογία απαιτεί την ύπαρξη μιας γενικευμένης οντολογίας για το πεδίο στο οποίο κάνουμε την αναζήτηση. Παράδειγμα, μια οντολογία για την πόλη της Πάτρας ή της πόλης γενικότερα. Αν θέλουμε να ζητήσουμε πληροφορίες σχετικά με πόλης. Το πρόβλημα που έχει αυτή η τεχνική είναι ότι είναι δύσκολο να έχεις μια γενικευμένη οντολογία στην οποία συμφωνούν όλοι. Επιπλέον είναι δύσκολο, επειδή ακριβώς αυτή η οντολογία παρέχει μια μοναδική άποψη της γνώσης, είναι δύσκολο να μην εμφανιστούν αποκλήσεις από αυτή την οντολογία. Και είναι δύσκολο αυτή η οντολογία να είναι σωστή. Άρα, με το που εμφανίζονται νέα τεκμήρια, απειθαινώνουν αυτή η οντολογία να αποδειχτεί αντιφατική. Και επιπλέον μια μεγάλη οντολογία είναι δύσκολο να την επεξεργαστεί. Κανείς απαιτεί χρόνο και χώρο αποθήκευσης. Η δεύτερη τεχνική βασίζεται στο τέργεσμα των οντολογιών. Η δεύτερη ομάδα τεχνικών. Εδώ έχουμε δύο τεχνικές. Η μία είναι η αυθιγράμιση οντολογιών όπου έχουμε πολλές μικρές οντολογίες και προσπαθούμε να βρούμε τον κοινό τους τόπο, πώς ταιριάζουν μεταξύ τους. Και τη συγχώνευση οντολογιών που προχωράει ένα βήμα παραπέρα και ενώνει τις μικρές οντολογίες σε μια μεγάλη. Η δεύτερη τεχνική που περιλαμβάνει τη συγχώνευση οντολογιών έχει τα πλαιονεκτήματα και τα εμειονεκτήματα της γενικής οντολογίας. Καθώς στο τέλος από τη συγχώνευση των οντολογιών θα παραχτεί μια γενική οντολογία και επιπλέον παρουσιάζει δυσκολία στην επεξεργασία. Στην κατασκευή της συγχωρευμένης οντολογίας καθότι απαιτεί υπολογιστικός φόρος και μπορούν να υπάρχουν αντιφάσεις ανάμεσα στις επιμέρους οντολογίες. Ναι μεν, όταν έχεις πολλές επιμέρους οντολογίες εκφράζεις απόψεις πολλών δημιουργών πληροφορίας. Προσπαθώντας όμως να συνεργιάξεις όλες αυτές τις απόψεις σε μια συγχωρευμένη οντολογία, είναι πιθανό ότι δεν θα πετύχει αυτή η προσπάθεια. Και ερχόμαστε στην τρίτη τεχνική που είναι αυτή που εμείς σαν ομάδα στηρίζουμε, τη χρήση δικτύου ευθυγραμμισμένων οντολογιών. Εδώ δεν γίνεται καμία συγχωρευσή, επιμέρους οντολογίες υπάρχουν, άρα κάθε τεκμήριο ή κάθε ομάδα τεκμηρίων μπορεί να έρχεται με τη δική του περιγραφή, υπομορφή μεταδομένων τα οποία βασίζονται σε κάποια οντολογία και όταν αναζητούμε, κάνουμε αναζήτηση σε ένα σύνολο τεκμηρίων, αυτό που χρειάζεται να κάνουμε είναι να ταιριάξουμε τις οντολογίες των μεταδομένων μεταξύ τους. Αυτό μπορεί να έχει γίνει από πριν και να έχουμε αποθηκευμένα τοτερειάσματα έτσι ώστε η επεξεργασία να είναι γρήγορη ή μπορεί να γίνεται online αλλά αυτό δεν μπορεί να γίνει σε πραγματικό χρόνο ακόμα με τις μηχανές που διαθέτουμε. Όμως με μια τέτοια προσέγγιση έχουμε πιο πλούσια σημασιολογία γιατί κανενός η άποψη δεν χάνεται, δεν καταπιέζεται, όλες οι απόψεις είναι διαθέσιμες, όλες οι οπτικές γωνίες είναι καλύτερα να πω. Έχουμε εξατομικευμένη προσέγγιση σε θέματα στην αναζήτηση διότι ο χρήστης μπορεί να διαλέξει το τέριασμα που επιθυμεί και όχι όποιο τέριασμα του προσφέρει το σύστημα. Και στην πραγματικότητα δεν δημιουργούμε νέα πληροφορία, απλά ταιριάζουμε την πληροφορία που υπάρχει. Ευχαριστώ για την προσοχή σας. Ήταν μια πιο τεχνική, αν θέλετε, ομιλία σε σχέση με τις προηγούμενες, αλλά προσπάθησα να σας δώσω insight, να σας δώσω, να ανοίξω μια πόρτα και να παρουσιάσω ότι γίνεται έρευνα στην επεξεργασία πληροφορίας η οποία εφαρμόζεται στις σύγχρονες βιβλιοθήκες. Για περισσότερες πληροφορίες, προφανώς, μπορείτε να επικερωνήσετε μαζί μου. Ευχαριστώ.
|