Επέκταση της DBpedia σε όλες τις γλώσσες του κόσμου από το Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης

27.06.2011

Η αγγλική DBpedia, η εφαρμογή που επιτρέπει τον εμπλουτισμό, την πλοήγηση και τη διασύνδεση του περιεχομένου της Βικιπαιδίας, ώστε οι πληροφορίες να συνδέονται μεταξύ τους, όχι απλώς με λέξεις-κλειδιά, αλλά σύμφωνα με τη σημασία των λέξεων, επεκτείνεται πλέον στα ελληνικά και σε όλες τις γλώσσες του κόσμου, χάρις στο καινοτόμο πρόγραμμα που ανέπτυξε το Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Το σύστημα αναπτύχθηκε από το Τμήμα Μαθηματικών, μέσω του Προγράμματος Μεταπτυχιακών Σπουδών στην Επιστήμη του Διαδικτύου, και απέσπασε συγχαρητήρια εκ μέρους της Διεθνούς Επιτροπής DBpedia.

Η DBpedia (http://www.dbpedia.org) λειτουργούσε μέχρι σήμερα μόνο για την αγγλική Βικιπαιδία και, μερικώς, για γλώσσες που χρησιμοποιούν λατινικούς χαρακτήρες. Η ανάγκη της πολυγλωσσίας του Σημασιολογικού Παγκόσμιου Ιστού (Web 3.0) ήταν η πρόκληση που αντιμετώπισε η ερευνητική ομάδα του ΑΠΘ με το νέο αυτό σύστημα. Το σύστημα εφαρμόστηκε αρχικά για τη δημιουργία της ελληνικής DBpedia (http://wiki.el.dbpedia.org), ώστε το περιεχόμενο της ελληνικής Βικιπαιδίας να μεταμορφώνεται σε δομημένη γνώση, παγκόσμια διαθέσιμη, χωρίς αλλοίωση των ελληνικών χαρακτήρων. Αυτή την περίοδο αναπτύσσονται οι εφαρμογές για τη γερμανική, τη ρωσική, την πολωνική και τη σλοβακική γλώσσα, ενώ δημιουργήθηκε η Επιτροπή Διεθνοποίησης της DBpedia http://dbpedia.org/internationalization για την προώθηση του νέου συστήματος.

Η επιτυχία της ερευνητικής ομάδας του ΑΠΘ, με επικεφαλής τον Διευθυντή του Προγράμματος Μεταπτυχιακών Σπουδών στην Επιστήμη του Διαδικτύου, Καθηγητή Ιωάννη Αντωνίου, αποτελεί ένα σημαντικό βήμα στην πορεία ολοκλήρωσης του Σημασιολογικού Παγκόσμιου Ιστού. Στο Semantic Web (3.0) γίνεται σημασιολογική επεξεργασία των πληροφοριών, μέσω κατάλληλα δομημένων οντολογιών, στοχεύοντας προς ένα διαδίκτυο με νοημοσύνη, όπου ο χρήστης δεν θα χάνεται στην ακατάσχετη και αδόμητη πληροφορία. Το πρώτο επίτευγμα προς αυτή την κατεύθυνση με δυνατότητες άμεσης πρακτικής εφαρμογής είναι τα Συνδεδεμένα Δεδομένα (Linked Data), μέσω των οποίων το διαδίκτυο των ιστοσελίδων μεταλλάσσεται σε ένα διαδίκτυο δεδομένων που επικοινωνούν σημασιολογικά.

Η DBpedia αποτελεί τον πυρήνα των Διασυνδεδεμένων Δεδομένων (http://richard.cyganiak.de/2007/10/lod/). Η ελληνική DBpedia είναι η πρώτη παγκοσμίως εφαρμογή του Web 3.0 που αντιμετώπισε επιτυχώς το πρόβλημα της διεθνοποίησής του. Επίσης, αποτελεί μια πρακτικά υλοποιήσιμη πρόταση προς την Κοινοπραξία του Παγκοσμίου Ιστού (World Wide Web Consortium) για την ενσωμάτωση στο Web 3.0 όλων των γλωσσών με μη λατινικούς χαρακτήρες. Οι αλγόριθμοι και το λογισμικό που αναπτύχθηκαν στο Τμήμα Μαθηματικών του ΑΠΘ είναι συμβατοί με κάθε φυσική γλώσσα.

Η επιστημονική ομάδα του ΑΠΘ για την ελληνική DBpedia αποτελείται από τον μεταπτυχιακό φοιτητή κ. Δ. Κοντοκώστα, τον Επιστημονικό Συνεργάτη και Διδάσκοντα Δρ Χ. Μπράτσα και τους Καθηγητές Ι. Αντωνίου και Γ. Μητακίδη. Το πρώτο βήμα προς αυτό το επίτευγμα ήταν η ομαδική εργασία των μεταπτυχιακών φοιτητών Σ. Αλεξίου, Α. Καραλή, Γ. Καρβουνά, Δ. Κοντοκώστα και Π. Ξανθοπούλου.