Η δύναμη των συνδεδεμένων ανοιχτών δεδομένων

Νέες ευκαιρίες*

από τους Denise Recheis και Thomas Thurner**

Μετάφραση: Βασίλης Χρυσός

Denise Recheis - Linked Open Data

Thomas Thurner - Linked Open DataΤα ανοιχτά δεδομένα και η ανοιχτή γνώση δεν έχουν να κάνουν μόνο με τη διαθεσιμότητα. Σχετίζονται επίσης με τη λογική διασύνδεση, η οποία καθιστά τα δεδομένα κατανοητά και τα μετατρέπει σε μια χρήσιμη πηγή για την έλευση σε μια πιο ισορροπημένη κοινωνία της πληροφορίας. Η διασύνδεση των δεδομένων είναι επίσης μια από τις βασικές έννοιες που χρησιμοποιεί η reegle.info για να λειτουργεί ως ένας ανοιχτός κόμβος δεδομένων για την εξειδικευμένη περιοχή της ανανεώσιμης ενέργειας και της ενεργειακής αποδοτικότητας.

Από το ξεκίνημά του, ο παγκόσμιος ιστός (www) μορφοποιήθηκε ως ένα πιο στενά συνδεδεμένο δίκτυο πληροφορίας. Προκειμένου κάποιος να κατανοήσει το όραμα του World Wide Web Consortium (W3C) για ένα νέο δίκτυο δεδομένων, θα πρέπει να φανταστεί το διαδίκτυο ως μία γιγαντιαία παγκόσμια βάση δεδομένων.

Χρησιμοποιώντας αυτή τη βάση οι προγραμματιστές μπορεί να θελήσουν να χτίσουν μια νέα εφαρμογή, η οποία θα απεικονίζει τη συσχέτιση μεταξύ οικονομικής ανάπτυξης, κατανάλωσης ανανεώσιμης ενέργειας, δεικτών θνησιμότητας και δημόσιων επενδύσεων για την εκπαίδευση. Την ίδια στιγμή μπορεί επίσης να θέλουν να βελτιώσουν τη διεπαφή με το χρήστη με μηχανισμούς όπως η σπονδυλωτή περιήγηση και η αυτόματη απεικόνιση σχετικού περιεχομένου από το WWW. Όλα αυτά είναι ήδη δυνατά, αλλά τα μέτρα που διαθέτουμε σήμερα για ενοποίηση πληροφοριών από διάφορες πηγές, πρακτική γνωστή και ως ‘πολτοποίηση δεδομένων’ (mashing data), είναι συχνά χρονοβόρα και με μεγάλο κόστος.

Οι λόγοι πίσω από αυτό είναι κυρίως οι εξής:

  • Πολύ συχνά οι βάσεις δεδομένων αντιμετωπίζονται ως ‘σιλό’ και οι σχετικοί υπεύθυνοι συχνά δε θέλουν να ανακατεύονται τρίτοι. Αυτός ο τρόπος σκέψης βασίζεται σε υποθέσεις της δεκαετίας του ’70: μόνο μερικοί έμπειροι γνωρίζουν πως να χειρίζονται τις βάσεις δεδομένων και μόνο ο πυρήνας του τμήματος ΙΤ είναι ικανός να κατανοήσει τη δομή και το νόημα των δεδομένων. Αυτός ο τρόπος σκέψης είναι απαρχαιωμένος. Στη σημερινή εποχή του διαδικτύου εκατομμύρια προγραμματιστών είναι ικανοί να χτίζουν πολύτιμες εφαρμογές όποτε αποκτήσουν πρόσβαση σε ενδιαφέροντα δεδομένα.
  • Δεύτερον, τα δεδομένα είναι ακόμα κλειδωμένα σε συγκεκριμένες εφαρμογές. Το τεχνικό πρόβλημα με την πιο συνηθισμένη σημερινή αρχιτεκτονική της πληροφορίας είναι ότι τα μεταδεδομένα και οι πληροφορίες για τη δομή των δεδομένων δε διαχωρίζονται επαρκώς από τη λογική της εφαρμογής. Αυτό οδηγεί σε μια κατάσταση όπου τα δεδομένα δεν μπορούν να επαναχρησιμοποιηθούν τόσο εύκολα όσο θα έπρεπε. Εάν κάποιος σχεδιάσει μια βάση δεδομένων, συχνά γνωρίζει τι είδους εφαργμογές μπορούν να χτιστούν πάνω σε αυτή. Εάν σταματήσουμε να δίνουμε έμφαση στο ποιες εφαρμογές θα χρησιμοποιήσουν τα δεδομένα μας και αντίθετα εστιάσουμε σε μια ουσιαστική περιγραφή των ίδιων των δεδομένων θα αποκτήσουμε μεγαλύτερη δυναμική σε μακροπρόθεσμο χρονικό ορίζοντα. Στην ουσία, ανοιχτά δεδομένα σημαίνει ότι τα δεδομένα είναι ανοιχτά για οποιαδήποτε εφαρμογή, συμπεριλαμβανομένων εφαρμογών που έχουν κατασκευαστεί από τρίτους, και αυτό είναι εφικτό αν χρησιμοποιηθούν ανοιχτά πρότυπα όπως το RDF2 για την περιγραφή των μεταδεδομένων.
  • Ιδανικά, αν τα σχετιζόμενα, πραγματικά δεδομένα του δικτύου είναι συνδεδεμένα μεταξύ τους καθίσταται δυνατό να ανακτήσουμε πολλά σημαντικά γεγονότα σε μικρό χρόνο. Εάν οι μηχανές μπορούν να ‘κατανοήσουν’ πως συνδέονται δύο σύνολα δεδομένων, ο ιστός γίνεται σημασιολογικός – αυτού του είδους τα δεδομένα καλούνται Συνδεδεμένα Ανοιχτά Δεδομένα (Linked Open Data – LOD).

Ένα καλό παράδειγμα για το γεγονός ότι η παραπάνω γιγαντιαία παγκόσμια βάση δεδομένων υπάρχει ήδη και χρησιμοποιείται ενεργά στον τομέα της καθαρής ενέργειας, είναι οι δικτυακοί τόποι reegle.info και η δικτυακή πύλη του Open Energy Information openei.org. Όλη η πληροφορία σε αυτούς τους δικτυακούς τόπους είναι ανοιχτή – τόσο η παραγόμενη, όσο και η καταναλισκόμενη. Αμφότεροι κάνουν χρήση της ‘πολτοποίησης’, όπου δεδομένα από διάφορες πηγές συνδυάζονται και παρουσιάζονται με νέους τρόπους. Το αυθεντικό περιεχόμενο είναι διαθέσιμο για εξωτερικές ιστοσελίδες, ενώ παράλληλα ανακτάται κατάλληλο επιπρόσθετο περιεχόμενο από διάφορες πηγές ανοιχτών δεδομένων με ένα τρόπο αυτο-συντήρησης, ο οποίος εξασφαλίζει ότι οι χρήστες θα μπορούν πάντα να έχουν πρόσβαση στα τελευταία υψηλής ποιότητας δεδομένα μέσω μιας οπτικά ελκυστικής παρουσίασης.

Καταναλώνοντας και παρέχοντας ανοιχτά δεδομένα

Μια δικτυακή πύλη μπορεί να επωφεληθεί με δύο βασικούς τρόπους όταν χρησιμοποιεί (Συνδεδεμένα) Ανοιχτά Δεδομένα:

  • Νέες πηγές που ικανοποιούν τις ποιοτικές προδιαγραφές της πύλης μπορούν να εξετάζονται συνεχώς και να ενσωματώνονται σε αυτήν. Ήδη ανοιχτά δεδομένα παρέχουν οι UN Data, World Bank Data, DBpedia, Eurostat, OpenEI, RES-Legal, REEEP και πολλοί άλλοι οργανισμοί σε διάφορα πεδία. Εφόσον όλοι αυτοί οι οργανισμοί προσφέρουν τα δεδομένα τους σε μια δομημένη μορφή και με άδεια ανοιχτών δεδομένων, τα τρίτα μέρη μπορούν επίσης να συγχωνεύσουν δεδομένα από διάφορες πηγές, π.χ. από τα Ηνωμένα Έθνη και την Παγκόσμια Τράπεζα, για να παρουσιάσουν τελείως νέα ευρήματα. Χρησιμοποιώντας τα LOD γίνεται δυνατή η επεξεργασία πολλαπλών συνόλων δεδομένων και η εξαγωγή προστιθέμενης αξίας από το συνδυασμό τους.
  • Δίνει τη δυνατότητα σε προγραμματιστές άλλων εφαρμογών / ιστοσελίδων να εξαγάγουν εύκολα και να χρησιμοποιήσουν ενδιαφέροντα δεδομένα, χωρίς χρέωση. Αυτό εξασφαλίζει ότι τα δεδομένα (της δικτυακής πύλης) θα διαδοθούν προς το στοχευμένο κοινό, ακόμα και αν αυτό δε γίνει μέσα από την αρχική πηγή τους. Συνεπώς όλα τα δεδομένα πρέπει να αναφέρουν ξεκάθαρα την πηγή τους.

Πλεονεκτήματα της χρήσης συνδεδεμένων δεδομένων

Ένα από τα σημαντικότερα πλεονεκτήματα της χρήσης και παροχής συνόλων (Συνδεδεμένων) Ανοιχτών Δεδομένων είναι η κατανομή των υπευθυνοτήτων. Για μικρότερους οργανισμούς αυτό σημαίνει τη δυνατότητα για παροχή ενός πλούτου χρήσιμης πληροφορίας προς τους πελάτες τους χωρίς την απαίτηση να συντηρούν μια μεγάλη βάση δεδομένων. Χωρίς τη δυνατότητα χρήσης συνόλων δεδομένων που μπορούν να διαβαστούν από μηχανές θα απαιτούνταν περισσότερη ανθρωποδύναμη για την παροχή μιας τέτοιας υπηρεσίας.

Τα σύνολα (Συνδεδεμένων) Ανοιχτών Δεδομένων καθιστούν επίσης δυνατή την παροχή προς τους χρήστες χρήσιμης και επίκαιρης επισκόπησης διαφόρων ειδικών θεμάτων. Εφόσον οι δικτυακές πύλες από τρίτους είναι άμεσα συνδεδεμένες με τις πληροφορίες εκείνου που παρέχει τα δεδομένα, κάθε ενημέρωση γίνεται αυτόματα και σε όλες τις εφαρμογές που χρησιμοποιούν τα δεδομένα αυτά χωρίς να υπάρχει ανάγκη για χειροκίνητη επικαιροποίηση.

Για περισσότερες πληροφορίες σχετικά με τα (Συνδεδεμένα) Ανοιχτά Δεδομένα και του πώς να χρησιμοποιήσετε αυτή την τεχνολογία, μπορείτε να αναζητήσετε τη μπροσούρα “Linked Open Data: The Essentials” των Renewable Energy and Energy Efficiency Partnership (REEEP) και Semantic Web Company (SWC), στην οποία συμμετέχουν συγγραφείς που δραστηριοποιούνται ενεργά στο σημασιολογικό ιστό.

————————————————
* Το πρωτότυπο κείμενο τιτλοφορείται: “The Power of Linked Open Data | New Opportunities” και δημοσιεύτηκε στο The open book, Reaktio #3, The Open Knowledge Foundation, 2013.

** Ο Thomas Thurner συντονίζει το Τμήμα Μεταφοράς της εταιρίας Semantic Web, καθώς και τις δημόσιες σχέσεις και καμπάνιες από το 2008. Ο Thomas ασχολείται επίσης ενεργά με τον κλάδο Στρατηγικής για τα Ανοιχτά Δεδομένα της εταιρίας, και συγκεκριμένα με την οικοδόμηση της κοινότητας και τη συμβουλευτική για τη διευρυνόμενη σκηνή των Συνδεδεμένων Ανοιχτών Κρατικών Δεδομένων της Αυστρίας.

Το κύριο πεδίο εργασίας της Denis Recheis είναι η Ανανεώσιμη Ενέργεια και το portal reegle.info για τα Συνδεδεμένα Ανοιχτά Δεδομένα από την Energy Efficiency Partnership (REEEP).

Tagged with: , , ,

Leave a Reply

Your email address will not be published. Required fields are marked *

*