Ψηφιακό Αρχείο Δεύτερης Γενιάς: η περίπτωση των Εθνικών Αρχείων του Ηνωμένου Βασιλείου
July 6, 2020
Μιλήσαμε με την δρ. Ειρήνη Γκουνταρούλη* σχετικά με τις προκλήσεις και τις ευκαιρίες που προκύπτουν από την εφαρμογή καινοτόμων τεχνολογιών και μεθόδων όπως η αυτοματοποίηση, η τεχνητή νοημοσύνη και οι μηχανικοί τρόποι επεξεργασίας για τη διαχείριση μεγάλου όγκου ψηφιακών αρχειακών δεδομένων και τη στρατηγική που έχουν αναπτύξει τα Εθνικά Αρχεία (ΕΑ) του Ηνωμένου Βασιλείου με στόχο να καταστούν ένα «Ψηφιακό Αρχείο Δεύτερης Γενιάς, ανοικτό προς όλους».
Τι είναι τα Εθνικά Αρχεία της Αγγλίας και ποιος ο ρόλος σου ως Υπεύθυνη Ψηφιακής Έρευνας;
Τα Εθνικά Αρχεία (EA) είναι το επίσημο αρχείο του Ηνωμένου Βασιλείου και ο επίσημος θεματοφύλακας ορισμένων από τα πιο εμβληματικά εθνικά έγγραφα. Τα βασικό αποθετήριο (repository) των ΕΑ βρίσκεται στο Νοτιοδυτικό Λονδίνο, στην περιοχή Κιού, ενώ το δεύτερο αποθετήριο, το “Deep Store”, βρίσκεται στην περιοχή Τσέσαϊρ και πρόκειται για ένα παλαιό αλατωρυχείο. Στην κατοχή τους, τα ΕΑ έχουν 200 χιλιόμετρα φυσικών συλλογών, κυρίως περγαμηνών και χαρτιού, αλλά και διάφορα αρχειακά αντικείμενα, όπως κέρινες σφραγίδες. Ωστόσο, τα τελευταία χρόνια, εκατομμύρια ψηφιοποιημένες σελίδες αλλά και ένας διαρκώς αυξανόμενος αριθμός born-digital αρχείων (δηλαδή υλικό το οποίο έχει απευθείας δημιουργηθεί σε ψηφιακή μορφή όπως emails, βίντεο, κώδικας και ψηφιακό περιεχόμενο από τις ιστοσελίδες και τα social media του UK Government Web Archive) έχουν εμπλουτίσει σημαντικά την ψηφιακή συλλογή των ΕΑ.
Τα ΕΑ είναι διαφορετικά πράγματα για διαφορετικές ομάδες ενδιαφέροντος. Για την κυβέρνηση, τα EA είναι ο επίσημος θεματοφύλακας του εθνικού αρχείου αλλά και εξειδικευμένος φορέας για τη διαχείριση, τη διατήρηση και τη χρήση πληροφοριών. Για το ευρύ κοινό, τα EA παρέχουν δωρεάν πρόσβαση σε ιστορικά τεκμήρια και συλλογές που αφορούν πάνω από 1,000 χρόνια ιστορίας του Ηνωμένου Βασιλείου. Για τον ευρύτερο κλάδο διαχείρισης Αρχείων και Αρχειακών υπηρεσιών, τα EA παρέχουν εξειδικευμένη γνώση και υποστήριξη σε Αρχεία της χώρας για τη διατήρηση και βιωσιμότητα της εθνικής αρχειακής κληρονομιάς. Επιπλέον, τα EA έχουν αναγνωριστεί από το Arts and Humanities Research Council ως Ανεξάρτητος Οργανισμός Έρευνας (Independent Research Organisation), το οποίο στην ουσία σημαίνει ότι μπορούν να ηγηθούν και να καταθέσουν ερευνητικές προτάσεις σε ένας πλήθος Ερευνητικών Συμβουλίων και Κέντρων Έρευνας στην Αγγλία και διεθνώς. Σε αυτό το πλαίσιο, για την ακαδημαϊκή και ευρύτερη ερευνητική κοινότητα, τα EA προσφέρουν ένα πλήθος ευκαιριών έρευνας και συνεργασίας για ένα ευρύ φάσμα επιστημονικών κλάδων.
Η ερευνητική ατζέντα των ΕΑ έχει στόχο να χτίσει μία ευρεία και πολυεπιστημονική ακαδημαϊκή κοινότητα γύρω από τις συλλογές και τα ερευνητικά ενδιαφέροντα των 600 ερευνητών και ειδικών που δουλεύουν σε διαφορετικά τμήματα του οργανισμού. Ο δικός μου ρόλος, μέσα από την ομάδα Έρευνας και Ακαδημαϊκής Διασύνδεσης, δίνει την δυνατότητα σε έμενα και την ομάδα μου να εμπλακούμε σε ένα αριθμό από ακαδημαϊκά προγράμματα και ερευνητικά δίκτυα τα οποία έχουν να κάνουν με θεωρητικούς και πρακτικούς προβληματισμούς σε σχέση με τις ιστορικές και τις ψηφιακές μας συλλογές, αλλά και με τα born-digital αρχεία τα οποία φέρνουν ένα σύνολο νέων προκλήσεων.
Ποιες είναι οι βασικές προκλήσεις που αντιμετωπίζουν σήμερα τα Εθνικά Αρχεία της Αγγλίας.
Η ταχεία και συνεχής ψηφιακή και τεχνολογική ανάπτυξη και καινοτομία φέρουν ένα σύνολο από ριζικές αλλαγές στο τοπίο της αρχειακής και πολιτισμικής κληρονομιάς. Τις τελευταίες δεκαετίες, περνώντας από τις περγαμηνές και το χαρτί, στα ψηφιοποιημένα και στα born-digitised αρχεία, οι νέοι τύποι αρχειακών αντικειμένων φέρνουν μία ριζική ρήξη στο καθιερωμένο αρχειακό πλαίσιο και αμφισβητούν την παραδοσιακή ορολογία, θεωρία και πρακτική. Οι μεγάλοι όγκοι αυτών των νέων τύπων εγγραφών, που διατίθενται σε μια ποικιλία νέων μορφών, με λίγη ή καθόλου δομή (όπως για παράδειγμα, έγγραφα Microsoft Word, email, βίντεο υψηλής ευκρίνειας, στιγμιότυπα ιστοσελίδων και σελίδες κοινωνικών μέσων, κώδικας, δομημένα σύνολα δεδομένων και εγγραφές που προέρχονται από συστήματα μηχανικής εκμάθησης), καθιστά αδύνατη την παραδοσιακή (χειροκίνητη) διαδικασία αρχειοθέτησης. Έτσι, απαιτούνται νέες πολύπλοκες ψηφιακές υποδομές και συστήματα νέας γενιάς, που θα μπορέσουν να αντιμετωπίσουν αποτελεσματικά την αυξανόμενη εισροή τους και μπορούν να επιτρέψουν την μακροχρόνια αποθήκευση τους σε μεγάλη κλίμακα.
Στα ΕΑ, για να αντιμετωπίσουμε αυτές τις νέες προκλήσεις διερευνήσαμε διαφορετικούς τρόπους χρήσης της γνώσης και της τεχνογνωσίας μας, καθώς επίσης δημιουργούμε γέφυρες με άλλα πεδία έρευνας και εξειδίκευσης και υιοθετούμε νέες προσεγγίσεις από άλλους τομείς. Τα τελευταία χρόνια, έχουμε ξεκινήσει έναν στρατηγικό μετασχηματισμό για να γίνουμε ένα αρχείο δεύτερης γενιάς που είναι εξολοκλήρου ψηφιακό (digital archive by instinct and design). Το ψηφιακό αρχείο φέρνει επανάσταση στην αρχειακή θεωρία και πρακτική, κυρίως με τη χρήση και εφαρμογή τεχνητής νοημοσύνης στο αρχειακό περιβάλλον. Ωστόσο, αυτό φέρνει μια ποικιλία νέων τύπων προκλήσεων, αλλά και ένα σύνολο από νέες δυνατότητες και προσεγγίσεις, τις οποίες ερευνούμε ενεργά και σε συνεργασία με εξωτερικούς συνεργάτες.
Με ποιον τρόπο μπορεί να συμβάλει η έρευνα στην προσέγγιση αυτών των προκλήσεων;
Στα ΕΑ βλέπουμε ένα μέλλον όπου η τεχνητή νοημοσύνη και οι αναδυόμενες νέες τεχνολογίες είναι μέρος της καθημερινής μας πρακτικής, γι αυτό και διερευνούμε διεξοδικά τις ηθικές, θεωρητικές και επιστημολογικές προκλήσεις που σχετίζονται με τη διατήρηση, περιγραφή, παρουσίαση και χρήση του ψηφιακού αρχείου. Για παράδειγμα, μας ενδιαφέρει ιδιαίτερα η διερεύνηση των νέων τρόπων αυτοματοποίησης της εγγραφής, μεταφοράς και αποθήκευσης ψηφιακών αρχείων που λαμβάνουμε από ποικίλες κυβερνητικές υπηρεσίες. Μας ενδιαφέρει επίσης η χρήση τεχνητής νοημοσύνης (όπως δίκτυα ανάλυσης/network analysis, επεξεργασία φυσικής γλώσσας/language processing, στατιστική μηχανική μάθηση/statistical machine learning και βαθιά μάθηση/deep learning) για να αυτοματοποιήσουμε τη δημιουργία μεταδεδομένων (metadata) όχι μόνο για να βελτιώσουμε την προσβασιμότητα (accessibility/findability) στις ιστορικές και ψηφιακές μας συλλογές, αλλά και για να δημιουργήσουμε νέες συσχετίσεις μεταξύ τους (linked data), έτσι ώστε να βοηθήσουμε τους χρήστες μας να αλληλοεπιδράσουν με το περιεχόμενο μας με νέους τρόπους.
Σε αυτό το ραγδαία εξελισσόμενο σύνθετο ψηφιακό περιβάλλον, τα EA επιδιώκουν ένα βιώσιμο ψηφιακό μέλλον. Σε μια εποχή όπου η τεχνητή νοημοσύνη μπαίνει δυναμικά στο χώρο της πολιτισμικής κληρονομιάς, η ανάγκη απόδειξης της προσαρμοστικότητας, της αξίας και της βιωσιμότητας των αρχείων δεν υπήρξε ποτέ πιο έντονη. Οι νέες προκλήσεις φέρνουν στο προσκήνιο ένα βασικό ερώτημα: τι θα πρέπει να κάνουμε σήμερα έτσι ώστε να διασφαλιστεί ένα αξιόπιστο και ανοιχτό αρχείο εντός ενός ταχέως και συνεχώς εξελισσόμενου σύνθετου ψηφιακού περιβάλλοντος; Στα ΕΑ πιστεύουμε ότι η απάντηση σε αυτό το ερώτημα έρχεται μέσα από την έρευνα, τον πειραματισμό και τη συνεργασία με ερευνητές από άλλες ειδικότητες και εξειδικεύσεις. Η έρευνα μάς δίνει τη δυνατότητα να ανοίξουμε ‘το μαύρο κουτί’ των νέων τεχνολογιών, να κατανοήσουμε και να διερευνήσουμε τις εννοιολογικές, μεθοδολογικές και πρακτικές προκλήσεις, αλλά και τις ηθικές επιπτώσεις, και να προτείνει νέους τρόπους να γίνουμε πιο υπεύθυνοι και πιο διαφανείς σε σχέση με τη συλλογική μας κληρονομιά και τη διατήρηση της στο μέλλον.
*Η δρ. Ειρήνη Γκουνταρούλη είναι υπεύθυνη Ψηφιακών Ερευνητικών Προγραμμάτων (Head of Digital Research Programmes) στα Εθνικά Αρχεία του Ηνωμένου Βασιλείου, και επιπλέον, προσκεκλημένο μέλος της Ψηφιακής Επιτροπής της Βασιλικής Ιστορικής Εταιρίας (Royal Historical Society) και της κλειστής ομάδας ειδικού ενδιαφέροντος Humanities and Data Science του Ινστιτούτου Alan Turing.
Σχετικά αναγνώσματα:
The National Archives’ New strategy, Archives for Everyone 2019: http://nationalarchives.gov.uk/about/our-role/plans-policies-performance-and-projects/our-plans/archives-for-everyone/
The National Archives, Digital Strategy 2017: https://www.nationalarchives.gov.uk/documents/the-national-archives-digital-strategy-2017-19.pdf
The National Archives, Archives Inspire 2015: http://nationalarchives.gov.uk/about/our-role/plans-policies- performance-and-projects/our-plans/archives-inspire/
Filed under: Uncategorized