Τα «Μεγάλα Δεδομένα, νέα μέσα, νέοι τρόποι διαχείρισης, ανάλυσης και ερμηνείας: Επιτεύγματα και Προκλήσεις» ήταν το θέμα της 2ης διάλεξης του κύκλου «Μεγάλα Δεδομένα, Νέα Μέσα, Ζητήματα Τεκμηρίωσης: Μαθαίνοντας από πρωτοπόρα εγχειρήματα», με εισηγητή τον Δρ. Χρήστο Αρβανιτίδη, Διευθυντή Ερευνών στο Ινστιτούτο Θαλάσσιας Βιολογίας, Βιοτεχνολογίας και Υδατοκαλλιεργειών, του Ελληνικού Κέντρου Θαλασσίων Ερευνών (ΕΛΚΕΘΕ).
Ο Χρ. Αρβανιτίδης, στην ενδιαφέρουσα διάλεξή του που πραγματοποιήθηκε στις 20 Μαρτίου 2019, στο Εθνικό Ίδρυμα Ερευνών, μίλησε για την παραγωγή, συλλογή, αποθήκευση και επεξεργασία Μεγάλων Δεδομένων στη μελέτη της θαλάσσιας βιοποικιλότητας, τόσο στην Ελλάδα όσο και παγκοσμίως, κάνοντας αναφορά στην εμπειρία του ως συντονιστής της ερευνητικής υποδομής LifeWatchGreece, και ως εθνικός εκπρόσωπος στο LifeWatch ERIC, την αντίστοιχη ευρωπαϊκή υποδομή.
Με τον όρο βιοποικιλότητα εννοείται η ποικιλία που υπάρχει σε ένα είδος, η ποικιλία ανάμεσα στα είδη και στα οικοσυστήματα. Η βιοποικιλότητα λοιπόν εμφανίζεται σε τρία επίπεδα των βιολογικών οργανισμών, κάτι που σημαίνει ότι τουλάχιστον τρεις επιστημονικοί κλάδοι εμπλέκονται στη μελέτη της: η γενετική, η ταξινομία και η οικολογία. Το γεγονός ότι τρεις διαφορετικές επιστημονικές κοινότητες με διαφορετική ερευνητική κουλτούρα εμπλέκονται στη συγκεκριμένη έρευνα κάνει από μόνο του τη μελέτη της βιοποικιλότητας μια εξαιρετικά πολύπλοκη διαδικασία. Η πραγματικότητα που έχουν να αντιμετωπίσουν οι επιστήμονες όμως, γίνεται ακόμη πιο σύνθετη αν σκεφτούμε ότι ζούμε σε μια εποχή όπου η ανάπτυξη της τεχνολογίας έχει καταστήσει δυνατή την καταγραφή μεγάλου όγκου δεδομένων που σχετίζονται με τη ζωή στον πλανήτη.
Σε αυτό το σημείο αποκτά πολύ μεγάλη σημασία η ύπαρξη των ερευνητικών υποδομών που χρησιμοποιούνται για τη συλλογή και αποθήκευση των δεδομένων. Από τι αποτελείται μια ερευνητική υποδομή; Στην περίπτωση της μελέτης της βιοποικιλότητας σύμφωνα με τον Χρ.Αρβανιτίδη, η υποδομή αποτελείται από τα δεδομένα που συλλέγονται, από τα παρατηρητήρια που χρησιμοποιούνται για τη λήψη των καταγραφών, από τα συστήματα που χρησιμοποιούνται για την αποθήκευση των δεδομένων, από τα ερευνητικά δίκτυα, και φυσικά του ανθρώπους που εκτελούν τη δουλειά που χρειάζεται για λειτουργήσει μια υποδομή. Η ύπαρξη αυτών των υποδομών μπορεί να προκαλέσει πολύ μεγάλη αλλαγή στον τρόπο που διεξάγεται η επιστήμη και να είναι ο καταλύτης για τη μετάβαση στη μέγα-επιστήμη, στην επιστήμη δηλαδή που θέτει ερευνητικές υποθέσεις όχι σε τοπικό αλλά σε παγκόσμιο επίπεδο.
Σημαντικό ρόλο σε αυτή τη μετάβαση παίζει το εικονικό εργαστήριο (virtual laboratory). Για να κατανοήσουμε τι σημαίνει εικονικό εργαστήριο, ο Χρ. Αρβανιτίδης χρησιμοποίησε το παράδειγμα ενός αξονικού τομογράφου, παρόμοιου με αυτόν που υπάρχει σε ένα νοσοκομείο, μόνο που χρησιμοποιείται για δείγματα πολύ μικρού μεγέθους, με διαστάσεις που μπορεί να φτάνουν μερικά χιλιοστά του μέτρου. «Με αυτή τη συσκευή και τη χρήση ακτίνων Χ, είναι δυνατό να ληφθεί ένας μεγάλος αριθμός απεικονίσεων για κάθε υπό μελέτη δείγμα. Αυτές οι απεικονίσεις αν συνδυαστούν μπορούν να δώσουν μια τρισδιάστατη ψηφιακή εικόνα του ζώου που αποτελεί το υπό μελέτη δείγμα, ενώ μας δίνουν τη δυνατότητα να παρατηρήσουμε τόσο το εξωτερικό μέρος του οργανισμού (μορφολογία) όσο και το εσωτερικό (ανατομία). Μπορούμε με άλλα λόγια να κάνουμε ανατομή σε ένα ζώο με ένα εικονικό τρόπο και χωρίς να αγγίξουμε το ίδιο το ζώο. Όμως για να συμβεί αυτό χρειάζονται χιλιάδες λήψεις για ένα και μόνο συγκεκριμένο δείγμα.
Τα αποτελέσματα αυτού του εικονικού πειράματος στη συνέχεια μπορούν να τοποθετηθούν σε μια βάση δεδομένων και να είναι προσιτά σε όλους τους ενδιαφερόμενους επιστήμονες και μη. Εκτός όλων των άλλων αλλαγών που μπορεί να φέρει στην ερευνητική κουλτούρα και στη συνεργασία μεταξύ επιστημόνων, ο συγκεκριμένος τρόπος διεξαγωγής της έρευνας αποτελεί μια αλλαγή στον τύπο των επιστημονικών τεκμηρίων. Από τον υλικό τύπο (material type) που έχει να κάνει με τα δείγματα οργανισμών που βρίσκονται στις συλλογές και είναι συνδεμένα με μια τοπικότητα (μουσείο, εργαστήριο κ.α.), μεταφερόμαστε στον κυβερνοτύπο (cybertype) που παράγεται σε ένα εικονικό εργαστήριο και μπορεί να βρίσκεται σε μια ψηφιακή βάση δεδομένων προσβάσιμος από οποιαδήποτε γωνιά του πλανήτη».
Η διαδικασία παραγωγής Μεγάλων Δεδομένων, εκτός από τη μεγάλη αξία για τη μελέτη της βιοποικιλότητας έχει και σημαντικές δυσκολίες όμως, σύμφωνα με τον δρ Αρβανιτίδη. «Για αρχή αναφέρουμε ότι απαιτούνται πολύ μεγάλες δυνατότητες αποθήκευσης, αν αναλογιστούμε για παράδειγμα ότι τα δεδομένα που προκύπτουν από τη σάρωση ενός μόνο δείγματος μπορεί να έχουν μέγεθος μερικές εκατοντάδες gigabytes. Αναφέρεται χαρακτηριστικά ότι στο πλαίσιο του LifeWatch Greece έχουν γίνει 650 σαρώσεις αλλά μόνο 17 έχει καταστεί δυνατό να «ανέβουν» στο σύστημα αποθήκευσης της υποδομής. Το μέγεθος των δεδομένων που προκύπτουν σχετίζονται και με τη δεύτερη δυσκολία που έχει να κάνει με το χρόνο που απαιτείται για να ληφθούν τα αρχεία από έναν ερευνητή που κάνει downloading από τον υπολογιστή του σπιτιού ή του γραφείου του. Όταν μιλάμε για αρχεία της τάξης των εκατοντάδων gigabytes ή ακόμα και του terabyte η δυσκολία ανάκτησής τους γίνεται εμφανής».
Ο Δρ. Χ. Αρβανιτίδης ολοκλήρωσε τη διάλεξή του καταλήγοντας ότι τα Μεγάλα Δεδομένα στη βιοποικιλότητα έχουν αλλάξει σημαντικά τον τρόπο με τον οποίο διεξάγεται η έρευνα σε αυτή την επιστημονική περιοχή. Προσφέρουν νέες, πολύ σημαντικές δυνατότητες στους επιστήμονες, όμως δημιουργούν και νέες προκλήσεις, τις οποίες οι επιστήμονες έχουν εντοπίσει και δουλεύουν σκληρά για να τις υπερβούν.
Ο κύκλος διαλέξεων «Μεγάλα Δεδομένα, Νέα Μέσα, Ζητήματα Τεκμηρίωσης: Μαθαίνοντας από πρωτοπόρα εγχειρήματα» διοργανώνεται από το Επιστημονικό Συμβούλιο του Εθνικού Κέντρου Τεκμηρίωσης, με την υποστήριξη του Διατμηματικού Μεταπτυχιακού Προγράμματος Σπουδών «Επιστήμη, Τεχνολογία, Κοινωνία - Σπουδές Επιστήμης και Τεχνολογίας» του Εθνικού και Καποδιστριακού Πανεπιστημίου Αθηνών και απευθύνεται σε φοιτητές, ερευνητές, επιστήμονες από διαφορετικά επιστημονικά πεδία, στελέχη του δημοσίου και του ιδιωτικού τομέα, αλλά και σε οποιονδήποτε ασχολείται με τον μετασχηματισμό δεδομένων μεγάλης κλίμακας σε πολύτιμη τεκμηρίωση. Μετά από κάθε διάλεξη ακολουθεί συζήτηση με το κοινό. Η είσοδος στις διαλέξεις είναι ελεύθερη (δεν απαιτείται προεγγραφή) και δίνονται βεβαιώσεις συμμετοχής σε όσους τις παρακολουθήσουν.
Ο κύκλος διαλέξεων θα ολοκληρωθεί στις 8 Μαΐου 2019 (18.00-20.00, στα αγγλικά), με την 4η ομιλία του William Allen, Fellow by Examination in Political and Development Studies, Madgalen College, University of Oxford, Research Officer, Centre on Migration, Policy, and Society (COMPAS), o oποίος θα μιλήσει με θέμα "The Politics of Big Data, Migration, and Mobility".