ROADRUNNER: ένα νέο πλαίσιο για μεγάλης κλίμακας ανάλυση Μεγάλων Δεδομένων από τo Πανεπιστήμιο Πειραιώς

Το ROADRUNNER, το νέο ερευνητικό έργο του Τμήματος Ψηφιακών Συστημάτων του Πανεπιστημίου Πειραιώς με τίτλο «Κλιμακώσιμη και Αποδοτική Ανάλυση Μεγάλων Δεδομένων», προτείνει ένα νέο πλαίσιο για μεγάλης κλίμακας ανάλυση Μεγάλων Δεδομένων, αξιοποιώντας επιτυχημένες πρακτικές, όπως η κλιμακωσιμότητα, σε συνδυασμό με προσαρμοσμένες τεχνικές για επεξεργασία και βελτιστοποίηση που αφορούν στην απόδοση και είναι γνωστές εδώ και χρόνια στην κοινότητα των παράλληλων συστημάτων βάσεων δεδομένων (ΠΣΒΔ).

Στην εποχή των Μεγάλων Δεδομένων (Big Data) η χρήση του υπολογιστικού νέφους θεωρείται πλέον απαραίτητη για την επιτυχημένη επεξεργασία και την αποδοτική και κλιμακώσιμη ανάλυση ογκώδων συνόλων δεδομένων. Μέχρι σήμερα, η πιο δημοφιλής και πραγματικά κλιμακώσιμη λύση για ανάλυση τέτοιων δεδομένων είναι το MapReduce, ένα προγραμματιστικό μοντέλο που επιτρέπει παράλληλη επεξεργασία εργασιών σε μεγάλες συστάδες φθηνών υπολογιστών, με ποικίλα καλά χαρακτηριστικά όπως κλιμακωσιμότητα, ανοχή σε σφάλματα, ευελιξία και ευκολία στον προγραμματισμό. Παρόλα αυτά, το MapReduce έχει κατακριθεί από την ερευνητική κοινότητα διαχείρισης δεδομένων για την έλλειψη αποδοτικότητας, όταν συγκρίνεται με ΠΣΒΔ.

Το έργο ROADRUNNER στοχεύει να αντιμετωπίσει τον περιορισμό της τρέχουσας επιστημονικής στάθμης σχετικά με αποδοτική και συνάμα κλιμακώσιμη ανάλυση δεδομένων, εισάγοντας ποικίλες καινοτομίες στην επεξεργασία με MapReduce, βελτιώνοντας τη λειτουργικότητα και την απόδοσή του.

Είναι σημαντικό να αναφερθεί ότι το ROADRUNNER δε θα θυσιάσει την κλιμακωσιμότητα ή την ανοχή σε σφάλματα για απόδοση, αλλά θα προτείνει αποδοτικούς μηχανισμούς επεξεργασίας επερωτήσεων, διατηρώντας τα καλά στοιχεία του MapReduce. Για την επίτευξη αυτού του στόχου, το Τμήμα Ψηφιακών Συστημάτων του Πανεπιστημίου Πειραιώς θα επικεντρωθεί στη βελτιστοποίηση της χρήσης των πόρων και στη ελαχιστοποίηση της αχρείαστης επεξεργασίας, εντοπίζοντας ευκαιρίες για τερματισμό της επεξεργασίας δίχως εξαντλητική πρόσβαση στα δεδομένα.