Ανοικτά Δημόσια Δεδομένα: Ορισμοί - Πολιτικές - Πρωτοβουλίες
Δεδομένα και Τεχνολογικές Δυνατότητες
Τα Ανοικτά Πολιτιστικά Δεδομένα
Χρονολόγιο για τα ανοικτά πολιτιστικά δεδομένα
Ανοικτή διάθεση επιστημονικών και πολιτιστικών δεδομένων από το ΕΚΤ
Το ΕΚΤ και η Ανοικτή Πρόσβαση στα Ερευνητικά Δεδομένα
Η ελληνική έκδοση του Εγχειριδίου Δημοσιογραφίας Δεδομένων
Τρεις Συνεντεύξεις για τα Ανοικτά (Διασυνδεδεμένα) Δεδομένα και τη σημασία τους
Τα δεδομένα είναι για την Κοινωνία της Γνώσης ό,τι ήταν το πετρέλαιο για τη βιομηχανική κοινωνία: απαραίτητη πρώτη ύλη για να μπορέσουν να λειτουργήσουν οι βασικές της παραγωγικές δομές. Σε αντίθεση, ωστόσο, με το πετρέλαιο που είναι ένας πόρος που εξαντλείται και για τον λόγο αυτό ο αποκλεισμός και έλεγχος της πρόσβασης σε αυτό αποτελεί το κυρίαρχο μοντέλο αξιοποίησης του, τα δεδομένα όσο περισσότερο χρησιμοποιούνται, τόσο περισσότερο αυξάνεται η αξία τους. Για τον λόγο αυτό, ενώ στις βιομηχανικές κοινωνίες και οικονομίες το βασικό μοντέλο δημιουργίας αξίας είναι ο περιορισμός πρόσβασης σε πόρους, στην κοινωνία της γνώσης είναι η ελεύθερη και ανοικτή πρόσβαση στην πληροφορία εκείνη που θέτει τις βάσεις για την ανάπτυξη.
Εθνικές και ευρωπαϊκές νομοθετικές παρεμβάσεις και πολιτικές, με κύρια την Αναθεώρηση της Κοινοτικής Οδηγίας για την Περαιτέρω Χρήση της Πληροφορίας του Δημοσίου Τομέα, υποστηρίζουν το άνοιγμα των δεδομένων που παράγονται από τους δημόσιους φορείς, με σημαντικά οφέλη για την οικονομία και την κοινωνία... Προγραμματιστές, γραφίστες και πολίτες παίρνουν μέρος στα hackathons που κάνουν χρήση ανοικτών δεδομένων, προτείνοντας καινοτόμες εφαρμογές που βελτιώνουν τη ζωή του πολίτη... Ολοένα και περισσότερο ακούμε για τα ανοικτά δεδομένα και μεταδεδομένα, τα δημόσια δεδομένα, τα διασυνδεδεμένα δεδομένα, τα ερευνητικά & πολιτιστικά δεδομένα, τα μεγάλα δεδομένα… Τί σημαίνουν όμως όλες αυτές οι έννοιες, πώς συσχετίζονται, και γιατί μας αφορούν;
Στόχος του παρόντος αφιερώματος είναι να παρουσιαστούν βασικά στοιχεία σε σχέση με το τι είναι και πως λειτουργούν τα ανοικτά δεδομένα, πώς συνδέονται με δράσεις έρευνας, ανάπτυξης, πολιτισμού και τεχνολογίας, και, τέλος, πώς μπορούν να συνεισφέρουν σε μία ισόρροπη, βιώσιμη και χωρίς αποκλεισμούς ανάπτυξη. Επίσης, παρουσιάζονται οι δράσεις του Εθνικού Κέντρου Τεκμηρίωσης (ΕΚΤ), ενός οργανισμού που διαδραματίζει κομβικό ρόλο στο οικοσύστημα της ανοικτής γνώσης, δημιουργώντας εργαλεία, προσφέροντας υπηρεσίες και προτείνοντας πολιτικές που ενισχύουν τα ανοικτά δεδομένα και συνεισφέρουν στην αναπτυξιακή τους διάσταση.
Ανοικτά Δημόσια Δεδομένα: Ορισμοί - Πολιτικές - Πρωτοβουλίες
Η ελεύθερη πρόσβαση στη γνώση υλοποιείται κυρίως μέσα από πολιτικές ανοικτών δεδομένων, δηλαδή δεδομένων στα οποία η πρόσβαση γίνεται με τους ελάχιστους δυνατούς τεχνικούς, νομικούς και οργανωτικούς περιορισμούς. Τα ανοικτά δεδομένα αποτελούν αναπτυξιακό προαπαιτούμενο για ένα διαρκώς ευρύτερο φάσμα οικονομικών και κοινωνικών δραστηριοτήτων: από το να μπορεί κανείς να δει το πότε έρχεται το λεωφορείο και πού κάνει στάση σε σχέση με το πού βρίσκεται ή πότε ανοίγει ένας αρχαιολογικός χώρος, μέχρι να βρίσκει τίτλους βιβλίων και μουσικής σχετικών με τα ενδιαφέροντα του, ή ακόμη να μπορεί η δημόσια διοίκηση να σχεδιάζει πολιτικές βασισμένες σε στοιχεία και ελέγξιμες από τον πολίτη, ή να μπορεί ο ερευνητής να έχει πρόσβαση σε δεδομένα και περιεχόμενο που έχουν χρηματοδοτηθεί με δημόσιους πόρους και είναι αναγκαία για την έρευνα του. Όλα αυτά αποτελούν εκφάνσεις υπηρεσιών που βασίζονται σε ανοικτά δεδομένα - απλά, διασυνδεδεμένα ή μεγάλα.
Οι πληροφορίες είναι οργανωμένα δεδομένα που προκύπτουν συνήθως από μετρήσεις και συστηματική παρατήρηση. Οι πιο απλές πληροφορίες που προκύπτουν μέσω της καθημερινής παρατήρησης, όπως τα ωράρια και τα δρομολόγια των λεωφορείων σε μία πόλη, έως και οι πλέον περίπλοκες πληροφορίες για κάθε είδους στατιστικά στοιχεία όπως τα μετεωρολογικά δεδομένα, τα ποσοστά εμφάνισης καρκίνου ανά περιοχή της επικρατείας και τα χρήματα που δαπανώνται ανά παραγωγικό κλάδο της οικονομίας, συνιστούν μετρήσιμα μεγέθη που χρησιμεύουν στην έρευνα, την ενημέρωση, τη λήψη αποφάσεων και τη δημιουργία κάθε είδους υπηρεσίας προς όφελος του πολίτη.
Τα τελευταία χρόνια, γίνονται συστηματικές προσπάθειες διαμοιρασμού και επαναχρησιμοποίησης της πληροφορίας, ιδίως με το άνοιγμα των δεδομένων του δημοσίου τομέα, που περιλαμβάνουν το σύνολο των πληροφοριών που παράγονται από δημόσιους φορείς. Οι προσπάθειες αυτές αποσκοπούν στη μεγιστοποίηση του οφέλους από την περαιτέρω χρήση δεδομένων που έχουν χρηματοδοτηθεί με δημόσιο χρήμα και στην επιστροφή της μέγιστης δυνατής αξίας στον φορολογούμενο.
Μέσω του ανοίγματος των δημόσιων δεδομένων προκύπτουν πολλαπλά κοινωνικοοικονομικά οφέλη, όπως διαφάνεια και δυνατότητα άσκησης ελέγχου προς τη δημόσια διοίκηση από τους πολίτες, οι οποίοι πλέον - είναι σε θέση να λαμβάνουν καλύτερη γνώση των αποφάσεων των νομοθετικών και διοικητικών οργάνων του κράτους, γνώση που οδηγεί και σε αύξηση της συμμετοχής τους στον δημόσιο βίο. Σημαντικά είναι, ακόμη, τα οικονομικά οφέλη που προκύπτουν από την απελευθέρωση της δημόσιας πληροφορίας, καθώς επιτρέπεται ακόμη και σε μικρές και νέες επιχειρήσεις να έχουν πρόσβαση σε δωρεάν πληροφορία για να αναπτύξουν υπηρεσίες προστιθέμενης αξίας. Με άλλα λόγια, η ανοικτή πληροφορία εξυπηρετεί και τους τρεις βασικούς στόχους της ανοικτής διακυβέρνησης, δηλαδή τη διαφάνεια, τη λογοδοσία και τη συμμετοχή και, ταυτόχρονα, ενώ, ταυτόχρονα, επιτρέπει την αύξηση της παραγωγικότητας και ανταγωνιστικότητας των επιχειρήσεων, μειώνοντας το κόστος της πρόσκτησης δεδομένων που είναι η πρώτη ύλη για την προσφορά των περισσότερων ψηφιακών υπηρεσιών.
Η Ευρωπαϊκή Επιτροπή θεωρεί τα ανοικτά δημόσια δεδομένα ως ιδιαίτερα σημαντικό παράγοντα για τη δημιουργία νέων θέσεων εργασίας και την εξοικονόμηση δισεκατομμυρίων ευρώ (η προώθηση των Ανοικτών Δεδομένων είναι βασικός πυλώνας του Ψηφιακού Θεματολογίου της Ευρώπης, http://ec.europa.eu/digital-agenda/en/open-data-0). Χαρακτηριστικά η Neelie Kroes, αντιπρόεδρος της Ευρωπαϊκής Επιτροπής, έχει δηλώσει ότι "καθόμαστε πάνω σε ένα χρυσορυχείο" (http://blogs.ec.europa.eu/neelie-kroes/open-data-agreement) αναφερόμενη και στο γεγονός ότι μεγάλο μέρος αυτής της πληροφορίας δεν έχει "εξορυχτεί" και μένει ακόμα ανεκμετάλλευτη.
Τί εννοούμε όμως με τα Ανοικτά Δεδομένα; Ανοικτά είναι "τα δεδομένα που διατίθενται με ορισμένη άδεια, ώστε ο οποιοσδήποτε να μπορεί να τα χρησιμοποιεί, να τα επαναχρησιμοποιεί και να αναδιανέμει τα ίδια ή τροποποιήσεις τους, με μοναδικό περιορισμό την αναφορά στην πηγή τους ή την παρόμοια διανομή" (πηγή: http://opendefinition.org/okd/). Ως ανοικτά δεδομένα, λοιπόν, ορίζονται τα δεδομένα που είναι προσβάσιμα μέσω διαδικτύου από όλους, και για τα οποία δεν υφίστανται τεχνολογικοί, νομικοί ή άλλοι περιορισμοί στην πρόσβαση και χρήση τους, πέραν των όσων αναφέρθηκαν ανωτέρω. Για παράδειγμα, περιορισμοί για "μη-εμπορική χρήση" ή περιορισμοί για χρήση μόνο για συγκεκριμένους σκοπούς (π.χ. μόνο στην εκπαίδευση) δεν είναι επιτρεπτοί στο πλαίσιο της ανοικτής διάθεσης των δεδομένων και καθιστούν τα δεδομένα που έχουν τέτοιους περιορισμούς επαναχρησιμοποιήσιμα, αλλά όχι ανοικτά.
Οι πλέον ενδεδειγμένες ανοικτές άδειες χρήσης για δεδομένα είναι η άδεια Creative Commons Public Domain Dedication (γνωστή και ως CC0) και η άδεια Creative Commons Αναφορά στο Δημιουργό. Η ρητή χρήση μίας ανοικτής προτυποποιημένης άδειας στη δημοσίευση των δεδομένων αίρει οποιεσδήποτε αμφιβολίες ως προς τη δυνατότητα περαιτέρω χρήσης των δεδομένων, δε χρειάζεται, δηλαδή, ο εκάστοτε χρήστης να ζητά άδεια για τη χρήση των δεδομένων. Οι ανοικτές άδειες, άρα, επιτρέπουν την επανάχρηση ή περαιτέρω χρήση δεδομένων με το ελάχιστο δυνατό διαχειριστικό κόστος τόσο για τον παροχέα όσο και για τον μετέπειτα χρήστη των δεδομένων. Το διαχειριστικό κόστος μπορεί να απομειωθεί περαιτέρω με την επιλογή της άδειας που έχει τους ελάχιστους δυνατούς περιορισμούς επανάχρησης, δηλαδή την CC0.
Το άνοιγμα των δεδομένων υποστηρίζεται από εθνικές και διεθνείς πολιτικές. Η προώθηση των Ανοικτών Δεδομένων αποτελεί βασικό πυλώνα του Ψηφιακού Θεματολογίου της Ευρώπης για το 2020. Η πλέον σημαντική σχετική πρωτοβουλία της ΕΕ είναι η αναθεώρηση της Κοινοτικής Οδηγίας για την Περαιτέρω Χρήση της Πληροφορίας του Δημοσίου Τομέα. Η αρχική Οδηγία είχε εκδοθεί το 2003 θέτοντας τις βασικές αρχές γύρω από τη διάθεση, τη διαφάνεια και τον περιορισμό του κόστους για την πρόσβαση και περαιτέρω χρήση της πληροφορίας του δημοσίου τομέα, με στόχο την καθιέρωση ενιαίων όρων διάθεσης των δεδομένων στην Ευρώπη, ακόμη και για εμπορική χρήση. Η αναθεωρημένη Οδηγία ψηφίστηκε το καλοκαίρι του 2013 από το Ευρωκοινοβούλιο και η εφαρμογή της στα κράτη μέλη αναμένεται μέσα στην επόμενη διετία.
Με την αναθεώρηση της Οδηγίας εισάγονται τα εξής νέα στοιχεία:
- Η δυνατότητα της περαιτέρω χρήσης αποκαθίσταται ως η βασική αρχή
- Όλα τα δεδομένα της δημόσιας διοίκησης καλύπτονται από την Οδηγία
- Οι δημόσιοι φορείς δεν μπορούν να χρεώσουν για την περαιτέρω χρήση οποιοδήποτε κόστος πέρα από τα έξοδα της καθεαυτής διάθεσης για την αναπαραγωγή και τη διάθεση της πληροφορίας
- Υποχρεώνονται οι δημόσιοι φορείς να είναι πιο διαφανείς ως προς τις χρεώσεις και τους όρους διάθεσης
- Ενισχύεται η διάθεση των κυβερνητικών δεδομένων σε μηχαναγνώσιμη και επεξεργάσιμη μορφή
- Εντάσσονται, για πρώτη φορά, στο πεδίο εφαρμογής της Οδηγίας οι βιβλιοθήκες, τα μουσεία και τα αρχεία.
Η Ελλάδα ως κράτος μέλος της Ε.Ε. συγκαταλέγεται στις πρώτες χώρες που δεσμεύτηκαν για την εφαρμογή της Οδηγίας, ενώ εδώ και κάποια χρόνια, το αρμόδιο Υπουργείο Διοικητικής Μεταρρύθμισης και Ηλεκτρονικής Διακυβέρνησης λαμβάνει μέτρα για το άνοιγμα της δημόσιας πληροφορίας. Η χώρα μας έχει ήδη ολοκληρώσει τη δημόσια ανοικτή διαβούλευση για τη μεταφορά της Οδηγίας στο ελληνικό δίκαιο και αναμένεται η άμεση εφαρμογή της στους επόμενους μήνες, υλοποιώντας, έτσι, μία από τις κεντρικές δεσμεύσεις της χώρας για το άνοιγμα των δεδομένων του δημοσίου τομέα.
Από τις πλέον σημαντικές κυβερνητικές πρωτοβουλίες είναι η Δι@ύγεια (diavgeia.gov.gr), η ηλεκτρονική πύλη στην οποία από το 2010 αναρτώνται σε ένα σημείο στο διαδίκτυο όλες οι αποφάσεις πράξεων των κυβερνητικών και διοικητικών οργάνων, με στόχο "την επίτευξη της μέγιστης δυνατής δημοσιότητας της κυβερνητικής πολιτικής και της διοικητικής δραστηριότητας, τη διασφάλιση της διαφάνειας και την εμπέδωση της υπευθυνότητας και της λογοδοσίας από την πλευρά των φορέων άσκησης της δημόσιας εξουσίας". Τόσο το περιεχόμενο των αποφάσεων όσο και τα μεταδεδομένα είναι διαθέσιμα ανοικτά (με άδειες Creative Commons Αναφορά) προς τρίτους και μέσω προγραμματιστικής διεπαφής (API), ώστε να είναι νομικά και τεχνικά δυνατή η ανάπτυξη εφαρμογών προστιθέμενης αξίας. Χάρη σε αυτό έχουν δημιουργηθεί διάφορες εφαρμογές προστιθέμενης αξίας, όπως η Υπερδιαύγεια, μία πύλη που προσφέρει επαυξημένες λειτουργίες αναζήτησης στη Διαύγεια και σε άλλες δημόσιες πηγές ή το publicsepending.net, επιτρέποντας τη συλλογή και παρουσίαση οικονομικών στοιχείων σε μορφή που να είναι ξεκάθαρη και χρηστική για όλους.
Κεντρική πλατφόρμα για τη δημοσίευση των δεδομένων της δημόσιας διοίκησης είναι το data.gov.gr, που ακολουθεί το παράδειγμα και άλλων χωρών όπως data.gov.uk, dati.gov.it, κ.λπ., ο επίσημος διαδικτυακός τόπος για τα γεωχωρικά δεδομένα και την εφαρμογή της οδηγίας INSPIRE www.inspire.okxe.gr, το geodata.gov.gr, ενώ σταδιακά κάνουν την εμφάνισή τους και κάποιες πύλες για τα δεδομένα της περιφερειακής και τοπικής αυτοδιοίκησης (π.χ. opencrete.gov.gr). Τα σύνολα δεδομένων που μπορεί κανείς να βρει αφορούν π.χ. τις τιμές των καυσίμων, στοιχεία διαγωνισμών του Δημοσίου, τις τιμές των καταναλωτικών προϊόντων και τα μεταδεδομένα των αρχείων της δημόσιας ραδιοτηλεόρασης. Επίσης στη διεύθυνση open-data.okfn.gr διατίθεται η Πύλη Ανοικτών Δεδομένων που υποστηρίζει το Ίδρυμα Ανοικτής Γνώσης Ελλάδας Open Knowledge Foundation Greece. Σημειώνεται ότι στο πλαίσιο της ΕΕΛ/ΛΑΚ λειτουργεί Ομάδα Εργασίας για τα Ανοιχτά Δεδομένα (opendata.ellak.gr).
Δεδομένα και Τεχνολογικές Δυνατότητες
Η σημασία της ανοικτής διάθεσης των δεδομένων αναδείχθηκε σε μεγάλο βαθμό μαζί με τη διάδοση και νεότερων τεχνολογιών όπως: οι προγραμματιστικές διεπαφές (APIs - Application Programming Interface) που επιτρέπουν τη δημιουργία mash-ups πληροφορίας και μάλιστα σε πραγματικό χρόνο, οι τεχνικές εξόρυξης πληροφορίας μέσα από τη μαζική επεξεργασία μεγάλων συνόλων δεδομένων, οι σύγχρονες τεχνικές οπτικοποίησης της πληροφορίας π.χ. μέσω χαρτών, τα Ανοικτά Διασυνδεδεμένα Δεδομένα και η χρήση της γνώσης του κοινού (πληθοπορισμός) για τη δημιουργία ή και τη βελτίωση των δεδομένων.
Τα APIs αποτελούν πλέον έναν πολύ διαδεδομένο τρόπο εξαγωγής των δεδομένων σε πραγματικό χρόνο, ώστε να επιτρέπεται η ενσωμάτωσή τους σε τρίτες εφαρμογές. Ένα διαδεδομένο API είναι εκείνο της εφαρμογής Open Street Map (OSM), το οποίο επιτρέπει σε οποιαδήποτε εφαρμογή να "τραβάει" τους χάρτες από την εφαρμογή και να παρουσιάζει πάνω σε αυτούς άλλα δεδομένα που διαθέτουν γεωγραφικές συντεταγμένες. Ο συνδυασμός πολλαπλών πηγών δεδομένων ονομάζεται data mash-up. Μία εφαρμογή μπορεί, π.χ. να συνδυάζει τα δεδομένα για τις τοποθεσίες των σχολείων μίας πόλης, με τα δεδομένα της εγκληματικότητας των διαφόρων γειτονιών της, και αυτά να οπτικοποιούνται με τη βοήθεια ενός χάρτη. Με αυτό τον τρόπο οι γονείς μπορούν, π.χ. να επιλέξουν ένα σχολείο για το παιδί τους, που βρίσκεται σε μία περιοχή με χαμηλό δείκτη εγκληματικότητας.
Τα Διασυνδεδεμένα Δεδομένα, αποτελούν μία ακόμη μέθοδο δημοσίευσης των δεδομένων. Αντίθετα με τα APIs, μέσω των οποίων πραγματοποιείται αναζήτηση και ανάκτηση των δεδομένων σε πραγματικό χρόνο, τα Διασυνδεδεμένα Δεδομένα δημοσιεύονται ως σύνολα, με την ταυτόχρονη δημιουργία σημασιολογικών συνδέσεων μεταξύ διαφορετικών συνόλων δεδομένων, και κατά τρόπο ώστε να είναι αντιληπτές εκτός από τους ανθρώπινους χρήστες και από τους υπολογιστές. Το δεδομένο, π.χ. "Ντα Βίντσι" συνδέεται με το δεδομένο "Μόνα Λίζα" μέσω της σχέσης "ζωγράφος". Το δεδομένο "Μόνα Λίζα" συνδέεται με το δεδομένο "Τζιοκόντα" μέσω της σχέσης «εναλλακτική ονομασία». Έτσι κάποιος ο οποίος πραγματοποιεί αναζήτηση για τη Μόνα Λίζα θα βρει ως αποτελέσματα και εκείνα που αναφέρονται στην ονομασία Τζιοκόντα, κάτι το οποίο δεν ήταν δυνατό στην προηγούμενη εκδοχή του παγκόσμιου ιστού.
Τα Διασυνδεδεμένα Δεδομένα υπόσχονται την επόμενη επανάσταση στον Παγκόσμιο Ιστό καθότι προσθέτουν ένα επίπεδο "αντίληψης" και "κατανόησης" πάνω σε αυτό. Ενώ, δηλαδή, η πρώτη εκδοχή του Παγκόσμιου Ιστού βασίστηκε στα κείμενα και τις ιστοσελίδες και τις μεταξύ τους διασυνδέσεις μέσω υπερκειμένων (hyperlinks), η εξέλιξη του Παγκόσμιου Ιστού αξιοποιεί τα μεμονωμένα δεδομένα και τις λογικές μεταξύ τους επαγωγικές και παραγωγικές σχέσεις (που ονομάζονται τριπλέτες), επιτρέποντας στον χρήστη να πλοηγείται από έννοια σε έννοια ακολουθώντας αυτές τις σχέσεις. Οι σχέσεις και οι συνδέσεις αυτές μπορεί να είναι άπειρες και η αξία του σημασιολογικού διαδικτύου, όπως υποστηρίζει και ο ιδρυτής του Παγκόσμιου Ιστού Tim Berners Lee, έγκειται, κατ’αυτόν τον τρόπο στο γεγονός της ανάδειξης νέων σχέσεων που δεν γνωρίζαμε πριν.
O Tim Berners-Lee, ο ιδρυτής του Παγκόσμιου Ιστού συνοψίζει τα βασικά δομικά στοιχεία των Ανοικτών Διασυνδεδεμένων Δεδομένων με βάση την εξής βαθμιδωτή κλίμακα:
I. δημοσίευση των δεδομένων στον Ιστό (σε οποιαδήποτε μορφή) με μία ανοικτή άδεια
II. δημοσίευση των δεδομένων ως δομημένων δεδομένων
III. δημοσίευση των δεδομένων με τη χρήση ανοικτών μορφότυπων (π.χ. CSV αντί για Excel)
IV. χρήση URIs (Uniform Resource Identifiers) για τον προσδιορισμό πραγμάτων ώστε και άλλοι να μπορούν να παραπέμψουν στα ίδια πράγματα
V. σημασιολογική διασύνδεση των δεδομένων με άλλα σύνολα ανοικτών δεδομένων.
Με την αυξημένη ικανότητα των μηχανών να παράγουν, να καταγράφουν και να μεταδίδουν δεδομένα με αυτόματο τρόπο, τα τελευταία χρόνια, και με το κόστος της αποθήκευσης να μειώνεται δραματικά, γίνεται λόγος για τα μεγάλα δεδομένα (big data). Ο όρος μεγάλα δεδομένα χρησιμοποιείται για να δηλώσει σύνολα δεδομένων με τεράστιο όγκο. Η κρίσιμη αυτή "μάζα" των δεδομένων μπορεί να ανέρχεται σε αρκετά petabytes (1015 bytes) και ενδέχεται να οδηγεί στην αδυναμία χειρισμού τους, μέσα από τις παραδοσιακές σχεσιακές βάσεις δεδομένων.
Ο μεγάλος τους όγκος, όμως, απαιτεί νέες προσεγγίσεις αναφορικά με την αποθήκευση αλλά και την επεξεργασία τους μέσα από αλγοριθμικές τεχνικές και τεχνικές εξόρυξης και ανάλυσης δεδομένων. Το παράδειγμα, π.χ. του Μεγάλου Αδρονικού Επιταχυντή στο CERN είναι χαρακτηριστικό: 150 εκατ. αισθητήρες παράγουν δεδομένα 40 εκατ. φορές το δευτερόλεπτο για τις 600 εκατ. προσκρούσεις που πραγματοποιούνται το δευτερόλεπτο. Η πύλη δημοπρασιών και αγορών eBay.com, χρησιμοποιεί δύο λεγόμενες "αποθήκες" δεδομένων (data warehouses) χωρητικότητας 7,5 petabytes για να διαχειριστεί τον όγκο των εκατομμυρίων αναζητήσεων, των συστάσεων των χρηστών και των ηλεκτρονικών κινήσεων των εμπορευμάτων που πραγματοποιούνται σε καθημερινή βάση. Όλα τα ανοικτά δεδομένα δεν είναι απαραίτητα μεγάλα δεδομένα, αλλά ούτε και όλα τα μεγάλα δεδομένα είναι απαραίτητα ανοικτά.
Το άνοιγμα των δεδομένων επιτρέπει μέχρι και την εμπλοκή του κοινού στη χωρίς προηγούμενο επαύξηση και βελτίωσή τους μέσα από ενέργειες που δεν είναι δυνατό να γίνουν από υπολογιστές, και οι οποίες ονομάζονται πληθοποριστικές. Μία από τις πλέον δημοφιλείς εφαρμογές για τους ερασιτέχνες επιστήμονες είναι το Galazy Zoo το οποίο καλεί τους πολίτες να συμβάλουν στη μορφολογική ταξινόμηση χιλιάδων γαλαξιών και το οποίο υλοποιείται από τα Πανεπιστήμιο Οξφόρδης, Τζον Χόπκινς, Γέιλ και Μπέρκλεϋ. Πάνω από 80.000 εθελοντές συντέλεσαν στην ταξινόμηση πάνω από 10 εκατ. εικόνων μόνο μέχρι την πρώτη φάση του έργου που ολοκληρώθηκε το 2007. Τέτοιες δράσεις δεν θα ήταν δυνατό να πραγματοποιηθούν από μεμονωμένους ερευνητές ή και μηχανές, και έχουν επιφέρει μία σημαντική αλλαγή παραδείγματος στον παραδοσιακό διαχωρισμό μεταξύ ερευνητών και κοινού, μεταξύ αυθεντίας και γνώσης του κοινού. Η πλέον σημαντική και γνωστή πρωτοβουλία πληθοπορισμού είναι φυσικά η Βικιπαίδεια.
Ωστόσο, το άνοιγμα των δεδομένων αλλά και οι τεράστιες δυνατότητες που προκύπτουν από τη μαζική επεξεργασία και τη διασύνδεσή τους δεν εγείρουν μόνο ευκαιρίες αλλά και σημαντικά ζητήματα, ιδίως γύρω από την προστασία των προσωπικών δεδομένων και την ιδιωτικότητα των πολιτών, καθώς μεγάλο μέρος από τις προσωπικές μας πληροφορίες βρίσκεται πλέον στα χέρια μεγάλων ιδιωτικών εταιριών όπως η Facebook και η Google, που επεξεργάζονται τις πληροφορίες που ανακτούν από τις επαφές μας, από τις προτιμήσεις μας και από τις αγορές μας, ανάμεσα στα άλλα, για να πραγματοποιήσουν στοχευμένες καμπάνιες προώθησης προϊόντων, ενώ όπως ανέδειξε και η πρόσφατη υπόθεση παρακολούθησης από την Εθνική Υπηρεσία Ασφάλειας των ΗΠΑ, δεν υπάρχει απόλυτη διαφάνεια αναφορικά με το πώς μπορεί να χρησιμοποιούνται τα προσωπικά δεδομένα σε πολλές περιπτώσεις στο διαδίκτυο.
Μία ακόμη επανάσταση, τέλος, προ των πυλών, είναι το λεγόμενο διαδίκτυο των πραγμάτων, με την ενσωμάτωση μικροεπεξεργαστών, αισθητήρων και μικρουπολογιστών, σε κάθε είδους μηχάνημα, και όχι μόνο, οι οποίοι θα καταγράφουν και αναμεταδίδουν δεδομένα σε πραγματικό χρόνο. Δεν βρισκόμαστε μακριά από την ημέρα που το έξυπνο ψυγείο θα ενημερώνει αυτόματα όταν τελειώσει ένα προϊόν ή και θα πραγματοποιεί νέα ηλεκτρονική παραγγελία, που ένα φορτίο με ντομάτες που φέρουν μικροτσίπ θα ενημερώνουν για την κατάσταση και την ποιότητα του φορτίου και θα επηρεάζουν αντίστοιχα την προσαρμογή της τιμής, μέχρι την εγκατάσταση μικροτσίπ σε εγχειρισμένους ασθενείς που θα μεταδίδουν πληροφορίες π.χ. για την πίεση και τη θερμοκρασία τους, ειδοποιώντας εγκαίρως για την κρισιμότητα μίας κατάστασης. Το διαδίκτυο των πραγμάτων ανοίγει μία νέα εποχή γύρω από τη σημασία και την αξιοποίηση των δεδομένων, με τεράστιες ηθικές, νομικές και τεχνολογικές προεκτάσεις.
Τα Ανοικτά Πολιτιστικά Δεδομένα
Μία ιδιαίτερη κατηγορία των δεδομένων είναι τα μεταδεδομένα. Αντίθετα με τα δεδομένα που συνιστούν συνήθως πρωτογενή πληροφορία, τα μεταδεδομένα είναι δεδομένα που χρησιμοποιούνται για να περιγράψουν άλλα δεδομένα. Ο όρος μεταδεδομένα απαντάται ιδίως στο χώρο των βιβλιοθηκών, των μουσείων και των αρχείων και προσδιορίζει τη δομημένη πληροφορία που παράγεται ως αποτέλεσμα μιας ολοκληρωμένης διαδικασίας τεκμηρίωσης, και που συχνά περιγράφει ένα έργο, όπως ένα πίνακα, μία φωτογραφία, ένα αρχείο ήχου, κ.λπ. Ως μεταδεδομένα, λοιπόν, ονομάζουμε τα δεδομένα εκείνα που μας παρέχουν πληροφορίες σχετικά με τον δημιουργό, το έτος δημιουργίας ή τη περιγραφή του αντικειμένου, κ.λπ. Η διαδικασία της τεκμηρίωσης είναι από τις πλέον σημαντικές λειτουργίες ενός πολιτιστικού φορέα και εξυπηρετεί στον εντοπισμό και τη διαχείριση τόσο των αντικειμένων όσο και των ψηφιακών τους υποκαταστάτων, στην ερμηνεία και την παροχή πρόσβασης σε αυτά.
Η τεκμηριωτική πολιτιστική πληροφορία αντιπροσωπεύει έναν τεράστιο όγκο γνώσης γύρω από την προέλευση και την ερμηνεία των πολιτιστικών αντικειμένων, και συγκροτεί ένα από τα πλέον κατάλληλα σύνολα δεδομένων για δημοσίευση ως διασυνδεδεμένα δεδομένα, καθώς παραδοσιακά οι πολιτιστικοί φορείς χρησιμοποιούν πρότυπα για την οργάνωση και την ταξινόμηση της πληροφορίας, και άλλες δομημένες γλωσσικές πηγές όπως λεξιλόγια, θησαυρούς, κ.λπ., για την περιγραφή του υλικού και άυλου πολιτισμικού τους πλούτου. Παρέχουν, δηλαδή, έτοιμες σημασιολογικές συνδέσεις μεταξύ διαφορετικών δεδομένων.
Με το άνοιγμά της πληροφορίας αυτής, καθίσταται δυνατή η διασύνδεσή της με άλλες πηγές δομημένης πληροφορίας όπως ημερομηνίες γεννήσεως και θανάτου δημιουργών, γεωγραφικές συντεταγμένες τοπωνυμίων, πληροφορίες από τη Βικιπαίδεια και άλλες έγκριτες πηγές πληροφόρησης, καθιστώντας πολύ πιο πλούσια την εμπειρία του χρήστη.
Η πλέον σημαντική πρωτοβουλία στον χώρο του ανοίγματος των πολιτιστικών μεταδεδομένων προέρχεται από την ευρωπαϊκή ψηφιακή βιβλιοθήκη Europeana, η οποία το 2012 υιοθέτησε την πλέον ανοικτή άδεια, δηλαδή την Creative Commons 0, και μέσω ενός δικτύου συνεργασίας 2.000 μουσείων, βιβλιοθηκών και αρχείων, δημοσίευσε πάνω από 20 εκατ. εγγραφές μεταδεδομένων. Το εγχείρημα δημιούργησε ένα θετικό προηγούμενο το οποίο ακολούθησαν με τη σειρά τους πολλοί μεγάλοι φορείς πολιτισμού όπως οι βιβλιοθήκες της Γερμανίας, της Αγγλίας και της Γαλλίας, το βασιλικό μουσείο της Ολλανδίας, η Δημόσια Ψηφιακή Βιβλιοθήκη της Αμερικής, κ.ά.
Όπως ανέδειξε η μακρά διαβούλευση της Europeana με τους πολιτιστικούς φορείς, η ανοικτή διάθεση των μεταδεδομένων δεν αντιμετωπίζεται ιδιαίτερα θετικά, ιδίως από τα μουσεία τα οποία θεωρούν ότι χάνουν μία πιθανή πηγή εσόδων και είναι ιδιαίτερα ευαίσθητα στην πιθανότητα η πληροφορία τους να συνδυαστεί με μη έγκριτες πηγές στο διαδίκτυο. Γενικότερα, η απώλεια του ελέγχου με τον οποίο χρησιμοποιείται η πληροφορία στο διαδίκτυο είναι ανασταλτικός παράγοντας για τους φορείς. Η τάση, όμως, αυτή αντιστρέφεται όταν οι φορείς αντιλαμβάνονται ότι η ανοικτή διάθεση των μεταδεδομένων επιτρέπει την ανάπτυξη νέων εφαρμογών που προβάλλουν και αξιοποιούν το περιεχόμενό τους, εφαρμογές τις οποίες οι ίδιοι δεν θα ήταν σε θέση να συλλάβουν και να υλοποιήσουν μόνοι τους.
Η αναθεωρημένη Οδηγία για την Περαιτέρω Χρήση της Δημόσιας Πληροφορίας εντάσσει για πρώτη φορά τα μουσεία, τις βιβλιοθήκες και τα αρχεία στο πεδίο εφαρμογής της, αναγνωρίζοντας ότι οι πολιτιστικοί φορείς διαθέτουν ένα τεράστιο πλούτο πληροφορίας, ο οποίος μπορεί να αξιοποιηθεί ιδίως στην εκπαίδευση και τον τουρισμό και ότι μπορεί να αποτελέσει σημαντικό μοχλό ανάπτυξης για τις δημιουργικές βιομηχανίες και για τη δημιουργία νέων θέσεων εργασίας. Από την Οδηγία εξαιρούνται το περιεχόμενο και τα δεδομένα των οποίων τα πνευματικά δικαιώματα ανήκουν σε τρίτους. Ταυτόχρονα, οι πολιτιστικοί φορείς μπορεί να απαιτήσουν διαφορετικό τρόπο αποζημίωσης για τη διάθεση της πολιτιστικής πληροφορίας σε σχέση με τους λοιπούς δημοσίους φορείς.
Κομβικό σημείο αποτελεί επίσης η συλλογή και η διάθεση των δεδομένων από δημόσιες αρχές, τοπική αυτοδιοίκηση και πηγές δεδομένων στη δημιουργία των οποίων έχουν συμβάλει πολίτες.
Χρονολόγιο για τα ανοικτά πολιτιστικά δεδομένα
Ιανουάριος 2001 |
Ίδρυση των Creative Commons που διαθέτουν τις ομώνυμες άδειες |
Σεπτέμβριος 2004 |
Ιδρύονται τα Κοινά της Wikimedia Πρόκειται για το αποθετήριο εικόνων και πολυμέσων της Wikimedia που περιλαμβάνει ελεύθερο και ανοικτό εκπαιδευτικό περιεχόμενο.
|
Ιανουάριος 2008 |
Τα Ομοσπονδιακά Αρχεία της Γερμανίας μεταφορτώνουν 80.000 εικόνες με ελεύθερη άδεια στα Κοινά της Wikimedia και συνεργάζονται για τη βελτίωση των μεταδεδομένων των αρχείων με την ενσωμάτωση δομημένων πληροφοριών και βιογραφιών που αφορούν πρόσωπα από τη Βικιπαίδεια, πληροφορίες, δηλαδή, που έχουν διαθέσει τελικοί χρήστες. |
Απρίλιος 2009
|
Το Μουσείο Powerhouse στην Αυστραλία δημοσιεύει ανοικτά την τεκμηρίωση από τις συλλογές του που περιλαμβάνει 104.610 αντικείμενα από το 1880 ως σήμερα. |
Νοέμβριος του 2010 |
Η Βρετανική Βιβλιοθήκη διαθέτει 3 εκατ. εγγραφές από την Εθνική Βιβλιογραφία με άδεια CC0 και δηλώνει "Τέτοιες δράσεις είναι σημαντικές για την κοινότητά μας καθότι εξελίξεις όπως τα Διασυνδεδεμένα Δεδομένα αποκτούν αξία μόνο όταν υπάρχει σωστό περιεχόμενο" |
Ιούνιος 2011 |
1η Διάσκεψη για τα Ανοικτά Πολιτιστικά Διασυνδεδεμένα Δεδομένα (LODLAM) |
Σεπτέμβριος 2011 |
Το Βρετανικό Μουσείο δημοσιεύει τα δεδομένα των συλλογών του ως Διασυνδεδεμένα Δεδομένα με ανοικτή άδεια |
Σεπτέμβριος 2011 |
Επτά μουσεία και αρχεία από την Ολλανδία όπως το Rijksmuseum και τα Εθνικά Αρχεία συμμετέχουν στο πρώτο hackathon για τη δημιουργία πιλοτικών πολιτιστικών εφαρμογών με χρήση των συλλογών μεταδεδομένων τους |
Δεκέμβριος 2011 |
Η Ευρωπαϊκή Επιτροπή δημοσιεύει πακέτο μέτρων για την προώθηση των Ανοικτών Δημόσιων Δεδομένων μέσω των οποίων αποβλέπει σε μία ενίσχυση κατά 140 δισ. ευρώ σε άμεσα και έμμεσα οικονομικά οφέλη στην Ευρώπη. Προτείνει την ενσωμάτωση των δημόσιων μουσείων, αρχείων και βιβλιοθηκών στην αναθεώρηση της Οδηγίας για την Περαιτέρω Χρήση της Δημόσιας Πληροφορίας (2003/98/EC γνωστή και ως PSI Directive) |
Ιανουάριος 2011 |
Δημοσιεύεται η μελέτη της Επιτροπής των Σοφών που περιλαμβάνει συστάσεις για την ψηφιοποίηση και διαδικτυακή διάθεση της Ευρωπαϊκής Πολιτιστικής Κληρονομιάς με στόχο “Τη Νέα Αναγέννηση”. Ανάμεσα στα άλλα συστήνει “Τα μεταδεδομένα που παράγονται από πολιτιστικούς φορείς και που σχετίζονται με τα ψηφιοποιημένα αντικείμενά τους θα πρέπει να καθίστανται ευρέως διαθέσιμα προς επανάχρηση”. |
Φεβρουάριος 2012
|
Το μουσείο Cooper Hewitt δημοσιεύει τα μεταδεδομένα των συλλογών του με άδεια CC0 και δηλώνει “καθιστούμε τα δεδομένα μας διαθέσιμα ώστε να μπορούν να γίνουν νέες συνδέσεις μεταξύ και να προκύψει νέα γνώση”. |
Σεπτέμβριος 2012
|
Μετά από πολύμηνες διαβουλεύσεις με τους 2.000 και πλέον συνεργαζόμενους πολιτιστικούς φορείς η Europeana υιοθετεί άδεια CC0 για περισσότερα από 20 εκατ. μεταδεδομένα θέτοντας ένα νέο δεδομένο για το χώρο. Από αυτά, περίπου 200.000 εγγραφές προέρχονται από ελληνικούς φορείς. Η Επίτροπος για την Ψηφιακή Ατζέντα Neelie Kroes, χαιρετίζει την πρωτοβουλία ως μία πρωτοβουλία με τεράστια οφέλη για τη δημιουργία νέων θέσεων εργασίας στην Ευρώπη. |
Ιανουάριος 2013
|
Η Δημόσια Ψηφιακή Βιβλιοθήκη της Αμερικής ακολουθεί το παράδειγμα της Europeana, υιοθετεί την άδεια CC0 και δηλώνει: "Η απόφαση για την υιοθέτηση του CC0 Public Domain για τα μεταδεδομένα, θα βελτιώσει σημαντικά τη διαλειτουργικότητα με την Europeana. Τώρα που όλο και περισσότεροι φορείς αρχίζουν να δημοσιεύουν την ψηφιακή τους κληρονομιά και τα μεταδεδομένα τους, η διαλειτουργικότητα καθίσταται ολοένα και πιο σημαντική για τη δημιουργία ενός ιστού πολιτιστικών δεδομένων, αντί για μεμονωμένες νησίδες δεδομένων". |
Ιούνιος 2013 |
Ψήφιση της Οδηγίας 2013/37/EE για την περαιτέρω χρήση της πληροφορίας του δημοσίου τομέα. |
Αύγουστος 2013 |
Η Γερμανική Εθνική Βιβλιοθήκη διαθέτει 11 εκατ. εγγραφές μέχρι το 2011 σε MARC21 με άδεια CC0. |
Ανοικτή διάθεση επιστημονικών και πολιτιστικών δεδομένων από το ΕΚΤ
Το Εθνικό Κέντρο Τεκμηρίωσης (ΕΚΤ) όντας θεσμικά αρμόδιο για τη συλλογή και την προτυποποιημένη οργάνωση και τεκμηρίωση της επιστημονικής και πολιτιστικής πληροφορίας στη χώρα, και υποστηρίζοντας την ανοικτή διάθεσή της για την προαγωγή της έρευνας και της καινοτομίας που οδηγούν σε ανάπτυξη, υλοποιεί μία σειρά από δράσεις που αποσκοπούν στο άνοιγμα ιδίως των επιστημονικών και πολιτιστικών δεδομένων που συλλέγει.
Επίσης, το ΕΚΤ είναι επικεφαλής της ευρωπαϊκής ομάδας εργασίας για τη διαμόρφωση οδηγιών για τις ανοικτές άδειες και τη διαλειτουργικότητα μεταξύ διαφορετικών τύπων ανοικτών αδειών, στο πλαίσιο του οικείου πακέτου εργασίας, στο πρόγραμμα Legal Aspects of Public Sector Information (LAPSI2) (www.lapsi-project.eu).
To EKT διαχειρίζεται μεγάλο όγκο σημαντικών επιστημονικών και πολιτιστικών δεδομένων, τα οποία διατίθενται μέσα από συστήματα ψηφιακών αποθετηρίων και ηλεκτρονικών εκδόσεων - όπως το Εθνικό Αρχείο Διδακτορικών Διατριβών (www.didaktorika.gr), το Αποθετήριο Ήλιος του ΕΙΕ (http://helios-eie.ekt.gr), ο Πανδέκτης - Αποθετήριο Συλλογών Ιστορίας και Πολιτισμού (http://pandektis.ekt.gr), το Αποθετήριο της Ζωφόρου της Παρθενώνα (http://repository.parthenonfrieze.gr), το Ψηφιακό Αποθετήριο Εκπαιδευτικού Περιεχομένου για την Ακρόπολη (http://repository.acropolis-education.gr), η Πλατφόρμα Ηλεκτρονικών Εκδόσεων EKT ePublishing (http://epublishing.ekt.gr), η Ψηφιακή Βιβλιοθήκη του Επιχειρησιακού Προγράμματος "Εκπαίδευση και Δια Βου Μάθηση" http://repository.edulll.gr. Όλα τα παραπάνω, μαζί με άλλες ψηφιακές συλλογές ελληνικών φορέων, συγκεντρώνονται και διατίθενται από το www.openarchives.gr, τη μεγαλύτερη ελληνική πύλη πρόσβασης σε ψηφιακό περιεχόμενο επιστήμης και πολιτισμού.
Τα δεδομένα που διαχειρίζεται το Εθνικό Κέντρο Τεκμηρίωσης, οργανώνονται εξαρχής με βάση διεθνή πρότυπα διαλειτουργικότητας που επιτρέπουν την ανοικτή διάθεσή τους σε μηχαναγνώσιμη μορφή, γεγονός που ευνοεί την επανάχρησή τους από συστήματα και εφαρμογές τρίτων. Χάρη στη συμμόρφωσή τους με υψηλού επιπέδου προδιαγραφές, τα δεδομένα του φορέα αξιοποιούνται επί σειρά ετών από τις σημαντικότερες διεθνείς και ευρωπαϊκές πρωτοβουλίες στον χώρο των ανοικτών δεδομένων και περιεχομένου, όπως η Europeana, το OpenAIRE / DRIVER, το DART Europe και το CLAROS.
Ομοίως, το ΕΚΤ υιοθετεί πολιτικές ανοικτής πρόσβασης τόσο μέσω των αποθετηρίων που αναπτύσσει για τους πολιτιστικούς και ερευνητικούς φορείς της χώρας, όσο και μέσω της νέας υπηρεσίας για Ψηφιακές Βιβλιοθήκες OpenΑΒΕΚΤ, με στόχο τη δημιουργία ενιαίων καταλόγων ανοικτών μεταδεδομένων για το πολιτιστικό και επιστημονικό ψηφιακό απόθεμα της χώρας. Οι δράσεις αυτές υλοποιούνται στο πλαίσιο του έργου "Πλατφόρμα Παροχής Υπηρεσιών Κατάθεσης, Διαχείρισης και Διάθεσης Ανοικτών Δεδομένων και Ψηφιακού Περιεχομένου" (saas.ekt.gr) στο πλαίσιο του Επιχειρησιακού Προγράμματος "Ψηφιακή Σύγκλιση" (ΕΣΠΑ), με τη συγχρηματοδότηση της Ελλάδας και της Ευρωπαϊκής Ένωσης - Ευρωπαϊκό Ταμείο Περιφερειακής Ανάπτυξης.
Για την ανοικτή διάθεση δεδομένων χρησιμοποιούνται τεχνολογίες ευρείας χρήσης, οικείες σε προγραμματιστές που δεν είναι ειδικοί του χώρου των ψηφιακών βιβλιοθηκών. Για παράδειγμα, τα δεδομένα διατίθενται σε μορφότυπα όπως XML, RDF μέσω προγραμματιστικών διεπαφών βασισμένων κυρίως σε τεχνολογίες του Παγκόσμιου Ιστού (HTTP, URIs, REST, SPARQL). Η ανάκτηση και επεξεργασία των δεδομένων μπορεί να πραγματοποιηθεί εύκολα και γρήγορα με κοινά εργαλεία, προσιτά στον μέσο μηχανικό λογισμικού. Ιδιαίτερη έμφαση δίνεται στην ποιότητα των δεδομένων και στη σύμπλευση με τις αρχές δημοσίευσης πληροφορίας του Σημασιολογικού ιστού και των Ανοικτών Διασυνδεδεμένων Δεδομένων. Με τον τρόπο αυτό ενθαρρύνεται η βελτίωση της ποιότητας των δεδομένων που διατίθενται και ενισχύεται η δυνατότητα διασύνδεσης και επανάχρησής τους.
Σημειώνεται ότι στο microsite open.ekt.gr ο χρήστης μπορεί να γνωρίσει την Ανοικτή Στρατηγική του ΕΚΤ και όλες τις δράσεις του φορέα για την ανοικτότητα (openness).
Το ΕΚΤ και η Ανοικτή Πρόσβαση στα Ερευνητικά Δεδομένα
Η ανοικτή πρόσβαση είναι η ελεύθερη, άμεση, διαρκής και απαλλαγμένη από τέλη και τους περισσότερους περιορισμούς πνευματικών δικαιωμάτων διαδικτυακή πρόσβαση σε επιστημονικό περιεχόμενο (άρθρα, μονογραφίες, ερευνητικά δεδομένα). Οι αναγνώστες μπορούν να χρησιμοποιούν ελεύθερα το διατιθέμενο υλικό για ερευνητικούς, εκπαιδευτικούς και άλλους σκοπούς.
Ως "ερευνητικά δεδομένα", ειδικότερα, χαρακτηρίζονται τα δεδομένα που χρησιμοποιούνται ως βασικές πηγές στην ερευνητική διαδικασία, π.χ. αριθμητικά δεδομένα, αρχεία κειμένων, εικόνων και ήχων. Η ανοικτή πρόσβαση στα ερευνητικά δεδομένα συμβάλει στη μακροχρόνια διατήρησή τους, στον έλεγχο της ακρίβειάς τους, στη διαθεσιμότητά τους για επαναχρησιμοποίηση από διαφορετικές ερευνητικές ομάδες, ακόμα και από επιχειρήσεις ή το ευρύ κοινό, στην εντατικοποίηση της έρευνας, αλλά και στον περιορισμό της αντιγραφής εργασιών χωρίς αναφορά στις πηγές. Σε διεθνές επίπεδο η εργασία για τη δημιουργία βάσεων επιστημονικών δεδομένων εξοικονομεί οικονομικούς και ανθρώπινους πόρους και επιφέρει αποτελέσματα υψηλών προδιαγραφών και προστιθέμενης αξίας.
Η συζήτηση για την ανοικτή πρόσβαση στα ερευνητικά δεδομένα δεν είναι νέα, καθώς ήδη από το 2004 η Διακήρυξη του ΟΟΣΑ (την οποία έχει υπογράψει και η Ελλάδα) ανακοίνωνε τη στήριξή της στην ανοικτή πρόσβαση στα ερευνητικά δεδομένα, ενώ το 2007 ο ΟΟΣΑ δημοσίευσε τις "Αρχές και Οδηγίες για την πρόσβαση σε ερευνητικά δεδομένα με δημόσια χρηματοδότηση". Σε επίπεδο Ευρωπαϊκής Ένωσης (ΕΕ) σημαντικό βήμα συνιστά η Σύσταση της Ευρωπαϊκής Επιτροπής (2012) για την "Πρόσβαση στην επιστημονική πληροφορία και τη διαφύλαξή της". Στο πλαίσιο ειδικότερα του Ορίζοντα 2020 προβλέπεται πιλοτική δράση για επιστημονικά δεδομένα στα οποία βασίζονται δημοσιεύσεις σε συγκεκριμένες θεματικές περιοχές.
Το Εθνικό Κέντρο Τεκμηρίωσης (ΕΚΤ), ως κεντρικός φορέας οργάνωσης, τεκμηρίωσης, πληροφόρησης και υποστήριξης σε θέματα επιστήμης, έρευνας και τεχνολογίας υιοθετεί και υποστηρίζει τις αρχές της κίνησης για την ανοικτή πρόσβαση, διοργανώνοντας σειρά εκδηλώσεων και συμβάλλοντας στη προώθηση του σχετικού διαλόγου. Την τρέχουσα περίοδο το ΕΚΤ υποστηρίζει και προωθεί την ανοικτή πρόσβαση στα ερευνητικά δεδομένα μέσω της συμμετοχής του στα ευρωπαϊκά χρηματοδοτούμενα έργα RECODE (www.recodeproject.eu) και PASTEUR4OA (www.pasteur4oa.eu).
Στο πλαίσιο του RECODE (Policy RECommendations for Open Access to Research Data in Europe) το ΕΚΤ έχει αναλάβει την επεξεργασία προτάσεων πολιτικής για την ανοικτή πρόσβαση στα ερευνητικά δεδομένα οι οποίες θα απευθύνονται σε συγκεκριμένους φορείς με κεντρικό ρόλο στην προώθηση της ανοικτής πρόσβασης, όπως -μεταξύ άλλων- οι φορείς χρηματοδότησης της έρευνας, τα πανεπιστήμια και τα ερευνητικά κέντρα, οι βιβλιοθήκες και οι εκδότες.
Ως συντονιστής του έργου PASTEUR4OA (Open Access Policy Alignment Strategies for European Union Research) το ΕΚΤ καλείται να αναπτύξει και να ενισχύσει τις πολιτικές ανοικτής πρόσβασης σε εθνικό επίπεδο και να υποστηρίξει το συντονισμό τους μεταξύ κρατών μελών, μέσω μιας σειράς αλληλοενισχυόμενων δράσεων και μετρήσιμων στόχων, λαμβάνοντας υπόψη την πρόσφατη σύσταση της Επιτροπής και την πολιτική του προγράμματος της Ευρωπαϊκής Ένωσης για την έρευνα και την καινοτομία "Ορίζοντα 2020" αναφορικά με την πρόσβαση στη χρηματοδοτούμενη από την ΕΕ έρευνα. Στο πλαίσιο του έργου προβλέπεται ειδικότερα η σύσταση ενός δικτύου εθνικών κέντρων τα οποία θα αναλάβουν την προώθηση της ανοικτής πρόσβασης στη βάση ενός κοινού προγράμματος δράσεων κάτω από την επίβλεψη και καθοδήγηση των εταίρων του έργου.
Η ελληνική έκδοση του Εγχειριδίου Δημοσιογραφίας Δεδομένων
Μια σημαντική έκδοση που αφορά την αξιοποίηση των δεδομένων, το Εγχειρίδιο Δημοσιογραφίας Δεδομένων (The Data Journalism Handbook), είναι πλέον διαθέσιμη και στα ελληνικά. Για τη δημιουργία του συνεργάστηκαν το Ίδρυμα Ανοικτής Γνώσης Ελλάδας OKF Greece, το Εργαστήριο Εφαρμογών Πληροφορικής στα ΜΜΕ του Τμήματος δημοσιογραφίας & ΜΜΕ και το Πρόγραμμα Μεταπτυχιακών Σπουδών στην Επιστήμη του Διαδικτύου του Τμήματος Μαθηματικών του ΑΠΘ.
Το Εγχειρίδιο Δημοσιογραφίας Δεδομένων "γεννήθηκε" σε ένα εργαστήριο 48 ωρών στο Mozilla Festival 2011 στο Λονδίνο. Στη συνέχεια επεκτάθηκε σε μια διεθνή, συλλογική προσπάθεια στην οποία συμμετείχαν δεκάδες από τους κορυφαίους υποστηρικτές της δημοσιογραφίας δεδομένων. Κατά τη διάρκεια μόνο των πρώτων 6 μηνών από τη δημοσίευση του βιβλίου στην πρώτη πλήρη έκδοσή του, εκατοντάδες άνθρωποι συνεισέφεραν με διάφορους τρόπους. Το Εγχειρίδιο Δημοσιογραφίας Δεδομένων είναι ένα έργο σε εξέλιξη. Οι δημιουργοί μάλιστα του Εγχειριδίου καλούν τους αναγνώστες να προτείνουν τροποποιήσεις ή αλλαγές, ώστε να συμπεριληφθούν στην επόμενη έκδοση. Επίσης, είναι ελεύθερα διαθέσιμο υπό την άδεια Creative Commons Attribution-ShareAlike.
Τι είναι Δημοσιογραφία Δεδομένων;
Η δημοσιογραφία δεδομένων (data journalism) αποτελεί ένα νέο είδος δημοσιογραφίας που γίνεται με τη χρήση δεδομένων. Στην σημερινή ψηφιακή εποχή τα σύνολα των δεδομένων που μπορούν να χρησιμοποιηθούν από τους δημοσιογράφους δεν περιορίζονται στην αποτύπωση αριθμών πάνω σε ένα λογιστικό φύλλο, όπως γινόταν στο παρελθόν, αλλά τώρα υπάρχει η δυνατότητα συγκέντρωσης συνόλων δεδομένων, δηλαδή αριθμών, που μπορούν να αφορούν και να περιγράφουν μια πληθώρα θεματικών τομέων, καθώς πλέον όλα σχεδόν είναι μετρήσιμα.
Φωτογραφίες, βίντεο, επίσημα έγγραφα, στατιστικά στοιχεία μπορούν να αποτελέσουν δεδομένα μετρήσιμα, τα οποία μάλιστα αποτυπώνονται ψηφιακά από δύο μόνο αριθμούς: 0 και 1. Επομένως, η δημοσιογραφία πρέπει να επωφεληθεί από τα σύνολα δεδομένων, ώστε μαζί με τις παραδοσιακές πρακτικές της δημοσιογραφία να μπορεί να διηγηθεί μια ιστορία, με ακόμα περισσότερες λεπτομέρειες και στοιχεία.
Είναι, ωστόσο, πολύ σημαντικό ο δημοσιογράφος να έχει την ικανότητα να μεταφράζει τα δεδομένα αυτά με τον κατάλληλο τρόπο και να τα αξιοποιεί με την καλύτερη δυνατή μέθοδο, σε τέτοιο σημείο ώστε η ιστορία που θα διηγείται να αποκτά ουσία για το κοινό του, να μην παρουσιάζει δηλαδή απλά τα δεδομένα, αλλά να αναπαριστά μια ιστορία και να βγάζει κάποιο συμπέρασμα.
Επιπλέον, η αυξανόμενη εφαρμογή της δημοσιογραφίας δεδομένων επηρεάζει και τον ρόλο του δημοσιογράφου και τις ειδικές δεξιότητες που αυτός χρειάζεται ώστε να διαβάζει, επεξεργάζεται, μεταφράζει και αξιοποιεί τα δεδομένα, όπως είναι ο προγραμματισμός, η χρήση κάποιου ειδικού λογισμικού ή η γραφιστική τέχνη. Ενδεικτικά, η παρουσίαση των δεδομένων από τους δημοσιογράφους γίνεται μέσω της γραφικής απεικόνισης πληροφοριών (Infographics), με διαδραστικά εργαλεία που μπορούν να παρουσιάζουν τα δεδομένα (π.χ. Gapminder), ή ακόμα και με προσωποποιημένο τρόπο, σύμφωνα με τις ανάγκες του χρήστη.
Κομβικό σημείο αποτελεί επίσης η συλλογή και η διάθεση των δεδομένων από τις τοπικές κυβερνήσεις, την αστυνομία, και άλλες πηγές πολιτών. Τα δεδομένα αυτά μπορούν να χρησιμοποιηθούν είτε ως πηγή με τον παραδοσιακό ορισμό της δημοσιογραφίας είτε ως μέσο με "την πλέον πρωτοποριακή οπτικοποίηση δεδομένων και τις ειδησεογραφικές εφαρμογές" όπως επισημαίνει και ο Aron Pilhofer των New York Times.
Επιπλέον, όπως αναφέρει και ο Philip Meyer, Professor Emeritus, University of North Carolina at Chapel Hill, η πληροφορία που προσφέρουν τα δεδομένα , από τη μια μπορεί να επεξεργαστεί έτσι ώστε να μπορέσει κανείς να κατανοήσει την ατελείωτη ροή των δεδομένων, και από την άλλη να παρουσιαστεί η πληροφορία σύμφωνα με το τι είναι σημαντικό για αυτόν. Η επιλογή, δηλαδή, του τρόπου αφήγησης των δεδομένων είναι θεμελιώδους σημασίας για τον δημοσιογράφο.
Περιεχόμενο Εγχειριδίου
Στο πρώτο μέρος του βιβλίου παρουσιάζεται στον χρήστη η έννοια της δημοσιογραφίας δεδομένων. Το βιβλίο απαντά σε κρίσιμα ερωτήματα όπως: Τί είναι δημοσιογραφία δεδομένων; Γιατί οι δημοσιογράφοι πρέπει να χρησιμοποιούν δεδομένα; Γιατί είναι απαραίτητη η δημοσιογραφία δεδομένων; Επίσης, ο αναγνώστης μαθαίνει από ειδικούς της δημοσιογραφίας δεδομένων, καθηγητές, δημοσιογράφους και συντάκτες, γιατί είναι σημαντική η ενσωμάτωση της δημοσιογραφίας δεδομένων στον λόγο της δημοσιογραφίας, και ειδικά στην εποχή που διανύουμε, δίνοντας μάλιστα παραδείγματα. Το βιβλίο εξετάζει και αναλύει μελέτες περίπτωσης, όπως το Datablog της Guardian και τη δημοσιογραφία δεδομένων στο BBC.
Στο δεύτερο μέρος του βιβλίου υπάρχουν πιο πρακτικές πληροφορίες γύρω από τη δημοσιογραφία δεδομένων. Ο δημοσιογράφος μπορεί να βρει έναν οδηγό για το πώς θα αποκτήσει τα δεδομένα, καθώς και τα νομικά δικαιώματά του προς αυτά. Επιπλέον, στην ενότητα αυτή επισημαίνονται τρόποι για την κατανόηση και την επεξεργασία των δεδομένων. Τέλος, το βιβλίο προτείνει τρόπους μετάδοσης και παρουσίασης των δεδομένων δίνοντας συμβουλές που ανταποκρίνονται στις ανάγκες της κάθε ιστορίας και μέσω παραδειγμάτων.
Ημερίδα παρουσίασης Εθνικού Σχεδίου Δράσης για Ανοικτή Διακυβέρνηση και Τελετή Βράβευσης "Open Public Data Hackathon"
Τα μικρά και μεγάλα βήματα που πραγματοποιεί η χώρα αναφορικά με το άνοιγμα των δημόσιων δεδομένων παρουσιάστηκαν στην εκδήλωση που διοργανώθηκε με αφορμή τη βράβευση των νικητών του πρώτου Open Public Data Hackathon, ενός ανοικτού μαραθώνιου προγραμματισμού, με στόχο την παραγωγή καινοτόμων εφαρμογών που αξιοποιούν τα ανοικτά δημόσια δεδομένα.
Τα ανοικτά δεδομένα αποτελούν μοχλό ενίσχυσης της καινοτομίας, της επιχειρηματικότητας, της ανάπτυξης, της διαφάνειας και της συμμετοχής του πολίτη στις αποφάσεις. Οι μαραθώνιοι προγραμματισμού, από την άλλη, προσφέρουν το κατάλληλο μέσο για να παραχθούν καινοτόμες και συχνά απρόσμενες και ευφάνταστες εφαρμογές, εφαρμογές που αποκτούν προστιθέμενη αξία με τον συνδυασμό πολλαπλών πηγών, και εφαρμογές που οι ίδιοι οι φορείς που διαθέτουν τα δεδομένα από μόνοι τους δεν θα είχαν τα μέσα να αναπτύξουν.
Απευθύνοντας χαιρετισμό στην εκδήλωση, ο Υπουργός Διοικητικής Μεταρρύθμισης και Ηλεκτρονικής Διακυβέρνησης, Κυριάκος Μητσοτάκης, αναφέρθηκε στη συμμετοχή της χώρας στο Open Government Partnership, καθώς και στη σημασία της ανάπτυξης μίας διεθνούς συνεργασίας που προάγει την Ανοικτή Διακυβέρνηση, και ενός forum ανταλλαγής καλών πρακτικών μεταξύ των κρατών - μελών σε παγκόσμιο επίπεδο.
Στη συνέχεια, τόσο ο ίδιος όσο και η Υφυπουργός Εύη Χριστοφιλοπούλου ανήγγειλαν τη δεύτερη διαβούλευση του 2ου Εθνικού Σχεδίου Δράσης για την Ανοικτή Διακυβέρνηση, καλώντας τους πολίτες να συμμετάσχουν ενεργά με τις προτάσεις τους για τη βελτίωση των παρεχομένων δημοσίων υπηρεσιών. Ακόμη, η κα Ε. Χριστοφιλοπούλου ανακοίνωσε τη νέα έκδοση της Διαύγειας, της υπηρεσίας ενιαίας πρόσβασης στο σύνολο των νόμων και των αποφάσεων της κυβέρνησης και των δημοσίων αρχών, που από τον Ιούνιο θα έχει βελτιωμένες λειτουργικότητες και εφαρμογές για τους χρήστες, και όλα τα δεδομένα της θα ανεβαίνουν σε ανοικτή μηχαναγνώσιμη μορφή.
Στις προτεραιότητες του Υπουργείου αναφορικά με το άνοιγμα των δημόσιων δεδομένων για το επόμενο διάστημα περιλαμβάνονται τα γεωχωρικά δεδομένα σε μηχαναγνώσιμη και επεξεργάσιμη μορφή, το άνοιγμα των πολιτιστικών δεδομένων που αφορούν τα κινητά και ακίνητα μνημεία της χώρας και η δημοσίευση της λίστας των εξωχώριων (offshore) εταιριών. Άλλες πρωτοβουλίες του Υπουργείου στις οποίες αναφέρθηκε η υφυπουργός είναι η διαδικτυακή δημοσίευση του οργανογράμματος της δημόσιας διοίκησης που θα ανανεώνεται σε πραγματικό χρόνο και θα λειτουργεί ως μητρώο των φορέων της ελληνικής διοίκησης και η διάθεση κρίσιμων συνόλων δεδομένων που αφορούν τους τομείς της φορολογίας, του εμπορίου και των δημοσίων έργων και συμβάσεων, με στόχο την επαναχρησιμοποίησή τους χωρίς περιορισμούς.
Ο Δρ. Αθανάσιος Παπαϊωάννου, Γεν. Γραμματέας της Βουλής των Ελλήνων αναφέρθηκε, στη συνέχεια, στις δράσεις που η Βουλή έχει προγραμματίσει στο προσεχές διάστημα για το άνοιγμα των δεδομένων της. Στη σχεδιαζόμενη ηλεκτρονική υπηρεσία θα μεταφορτώνονται όλοι οι νόμοι σε όλα τους τα στάδια, από την κοινοβουλευτική επιτροπή μέχρι την ψήφιση στην ολομέλεια. Θα προστεθούν, ακόμη, λειτουργίες όπως η αυτόματη σύνδεση των αποφάσεων με τις κοινοβουλευτικές ομάδες, τις σχετικές εκθέσεις και τα αποτελέσματα των ψηφοφοριών και όλη η διαδικασία κοινοποίησης και συλλογής υπογραφών από τις αρμόδιες ομάδες θα γίνεται ηλεκτρονικά και αυτοματοποιημένα.
Στην αναθεώρηση της Οδηγίας για την Περαιτέρω Χρήση της Δημόσιας Πληροφορίας αναφέρθηκε ο Francisco Garcia Moran από την Ευρωπαϊκή Επιτροπή ο οποίος παρουσίασε το σύνολο των πολιτικών και των δράσεων της Επιτροπής για τα Ανοικτά Δεδομένα. Ο F. Moran ανέφερε ότι η Ελλάδα βρίσκεται σε πολύ καλή θέση στην πανευρωπαϊκή κατάταξη των χωρών στο πλαίσιο της ανοικτής διακυβέρνησης και ότι θα είναι μία από τις πρώτες χώρες που θα εφαρμόσουν την Ευρωπαϊκή Οδηγία.
Oι εφαρμογές που βραβεύθηκαν
Την παράσταση όμως έκλεψαν οι τρεις εφαρμογές που βραβεύτηκαν και οι οποίες προέκυψαν από τον ανοικτό μαραθώνιο διαγωνισμό προγραμματισμού. Τα βραβεία συνοδεύονται από χρηματικά έπαθλα 3.000, 2.000 και 1.000 ευρώ, αντίστοιχα, και είναι ευγενική χορηγία της ΑΣΠΑΙΤΕ. Πρόκειται για εφαρμογές που ξεχώρισαν και βραβεύτηκαν για τη δημιουργική χρήση των ανοικτών δεδομένων του data.gov.gr, για τη χρήση ανοικτών τεχνολογιών και λογισμικού ανοικτού κώδικα στην υλοποίησή τους, για το εμπορικό ενδιαφέρον των εφαρμογών και τη δυνατότητα περαιτέρω επέκτασής τους.
Το 1ο βραβείο απέσπασε η εφαρμογή A.G.I.N.A.R.A (All Greek prices IN A Restful Application), μία εφαρμογή που αναπτύχθηκε από φοιτητές του Χαροκόπειου Πανεπιστημίου (Γεώργιος Παναγόπουλος, Ιωάννης Κατάκης, Ανδρέας Γρίβας και Νεκταρία Ρέκκα) και η οποία συνδυάζει τα δεδομένα του Παρατηρητηρίου Τιμών με το μητρώο καταστημάτων. Η εφαρμογή πραγματοποιεί σύγκριση τιμών σε πραγματικό χρόνο και δείχνει σε χάρτη στον χρήστη πού μπορεί να βρει τα προϊόντα που επιθυμεί και σε ποιες τιμές. Η εφαρμογή λειτουργεί ως σύμβουλος του καταναλωτή για εξυπνότερες αγορές και στοχεύει στην καταπολέμηση της αισχροκέρδειας.
Το 2ο βραβείο απέσπασε η εταιρία Niovity των Κώστα Σαΐδη, Αγάπιου Αβραμίδη και Σταυρούλας Χαριλόγη, με την εφαρμογή “Public Open Data Cloud”. Πρόκειται για μία υπηρεσία στο νέφος για την αξιοποίηση των ανοικτών δημόσιων δεδομένων μέσω ενός ισχυρού Restful API, η οποία τυποποιεί και “σερβίρει” τα ανοικτά δημόσια δεδομένα, με εύκολο, γρήγορο και αυτοματοποιημένο τρόπο, διευκολύνοντας περαιτέρω την ανάπτυξη νέων εφαρμογών από τρίτους χρήστες.
Το 3ο βραβείο απονεμήθηκε στην εφαρμογή GR Gov Mobile Search του Βαγγέλη Μπάνου – μία εφαρμογή για κινητά της υπάρχουσας υπηρεσίας της Υπερδιαύγειας, μίας υπηρεσίας η οποία πραγματοποιεί ταυτόχρονη σε πραγματικό χρόνο αναζήτηση στο πρόγραμμα Δι@ύγεια (diavgeia.gov.gr), δηλαδή στο πλήρες κείμενο συγκεκριμένων δημόσιων συνόλων/συλλογών (Πρόγραμμα Διαύγεια, προκηρύξεις και προμήθειες που δημοσιεύονται στο Κεντρικό Ηλεκτρονικό Μητρώο Δημοσίων Συμβάσεων – ΚΗΜΔΗΣ, ΦΕΚ που αναρτώνται από το Εθνικό Τυπογραφείο).
Συνολικά στο hackathon συμμετείχαν 19 προτάσεις που κάλυψαν πολλές διαφορετικές θεματικές, από τα Μέσα Μαζικής Μεταφοράς έως τον Τουρισμό. Στον διαγωνισμό συμμετείχαν προγραμματιστές, ιδιώτες, δημόσιοι υπάλληλοι, φοιτητές, ακόμη και μαθητές, και όλοι ανεξαιρέτως βραβεύτηκαν με έπαινο.
Διαβάστε το Αφιέρωμα στα Ανοικτά Δεδομένα στην έντυπη έκδοση του περιοδικού