H γλώσσα ως πολιτισμικό αγαθό στα Μεγάλα Γλωσσικά Μοντέλα

Ανάγκη η Ελλάδα να εντείνει τις προσπάθειές της προκειμένου να μην τεθεί εκποδών η ελληνική γλώσσα, αλλά και να επιβληθεί, ως πολύτιμο πολιτισμικό αγαθό
Open Image Modal
Boris SV via Getty Images

Γράφει η  Φερενίκη Παναγοπούλου Επίκουρη Καθηγήτρια Συνταγματικού Δικαίου, Δικαίου Προστασίας Δεδομένων και Βιοηθικής στο Πάντειο Πανεπιστήμιο και Διευθύντρια του Ευρωπαϊκού Εργαστηρίου Βιοηθικής, Τεχνοηθικής και Δικαίου του Παντείου Πανεπιστημίου. 

Η παραγωγική τεχνητή νοημοσύνη έχει οδηγήσει σε εφαρμογές που μπορούν να δίδουν αυτοματοποιημένες απαντήσεις  σε ερωτήματα μέσω της χρήσης Μεγάλων Γλωσσικών Μοντέλων. Αυτά είναι προγράμματα υπολογιστών επεξεργασίας φυσικής γλώσσας που χρησιμοποιούν τεχνητά νευρωνικά δίκτυα για τη δημιουργία κειμένου που μοιάζει στην ανθρώπινη ομιλία. Αποτελούν ένα είδος αλγορίθμου τεχνητής νοημοσύνης  που χρησιμοποιεί τεχνικές βαθιάς μάθησης (deep learning) και μαζικών δεδομένων (big data). Εκπαιδεύονται με χρήση τεράστιων όγκων κειμένων, προκειμένου να εξαγαγάγουν πιθανές συμπληρώσεις κειμένων. Το περιεχόμενο και ο τρόπος της απάντησης αποκτούν καθοριστική σημασία σε πολλούς τομείς της ζωής μας.

Στο πλαίσιο της παρούσης παρέμβασης θα συζητηθεί η σχετική προβληματική και θα δοθεί ιδιαίτερη έμφαση στο ζήτημα της γλώσσας ως πολιτισμικού αγαθού στα Μεγάλα Γλωσσικά Μοντέλα. 

Πρώτον, τα Μεγάλα Γλωσσικά Μοντέλα, τα οποία προωθούνται ως αποθήκες συλλογικής ανθρώπινης γνώσης, εγείρουν ένα καίριο ερώτημα: περιλαμβάνουν αυτά τα μοντέλα την ποικιλόμορφη γνώση που υιοθετείται από διαφορετικούς πολιτισμούς; Για παράδειγμα, η αγγλική γλωσσική κυριαρχία μπορεί να οδηγήσει σε μια πολιτισμική μονοκαλλιέργεια. Οι δομές που υπάρχουν στη γλώσσα διαμορφώνουν τον τρόπο με τον οποίο κατασκευάζουμε την πραγματικότητα και οι λέξεις που χρησιμοποιούμε είναι βαθιά συνδεδεμένες με τον τρόπο με τον οποίο σκεφτόμαστε για τον κόσμο. Περαιτέρω, είναι δυνατόν να χαθούν πολλές γλωσσικές αποχρώσεις, καθώς αυτό που δεν εκφράζεται στην αγγλική δεν θα εκφρασθεί σε άλλη γλώσσα. Γι’ αυτό και οι απαντήσεις στα αγγλικά εμφανίζονται «ορθότερες» από πλευράς ουσίας. Εν προκειμένω, τα Μεγάλα Γλωσσικά Μοντέλα που εκπαιδεύονται κυρίως σε αγγλικό κείμενο φαίνεται να χρησιμοποιούν μεταξύ τους την αγγλική γλώσσα, ακόμη και όταν τους ζητείται να εκφρασθούν σε άλλη γλώσσα. Οι απαντήσεις στην ελληνική δίνονται μέσω της αγγλικής μετάφρασης, με αποτέλεσμα να εξουδετερώνεται η ελληνική γλωσσική ιδιαιτερότητα. Το γεγονός αυτό δύναται να έχει σημαντικές συνέπειες όσον αφορά στη γλωσσική και πολιτισμική πρόσληψη. 

Δεύτερον, πώς επιλέγεται η γλωσσική ιδιομορφία και ορολογία του κειμένου; Ποιος θα αποφασίσει για τη γλωσσική ιδιοσυγκρασία; Φιλόλογοι πλέον εκπαιδεύουν τον αλγόριθμο επί τη βάσει καταγεγραμμένων Μεγάλων Γλωσσικών Μοντέλων. Τα μοντέλα αυτά επιδεικνύουν μεγαλύτερη πολιτισμική ευθυγράμμιση, όταν προτρέπονται στην κυρίαρχη γλώσσα ενός συγκεκριμένου πολιτισμού και όταν προ-εκπαιδεύονται σε ένα συγκεκριμένο γλωσσικό ιδίωμα. Με τον τρόπο αυτό τίθενται υπό διακινδύνευση οι ποικίλες γλωσσικές αποχρώσεις. Παράλληλα, η επιλογή χρήσεως συγκεκριμένης ορολογίας εκ μέρους του αλγορίθμου  προδιαθέτει τον χρήστη της τεχνητής νοημοσύνης σε συγκεκριμένο αποτέλεσμα. Η συνωνυμία των όρων «έκτρωση», «άμβλωση» και «τεχνητή διακοπή της κύησης» μας αποδεικνύει περίτρανα ότι δεν υφίσταται αξιολογικώς ουδέτερη γλώσσα  στις κοινωνικές επιστήμες, καθώς η χρησιμοποίηση διαφορετικών όρων αντανακλά συχνά διαφορετικές ηθικές προσεγγίσεις.  Το ίδιο συμβαίνει και με τους όρους «πληροφοριοδότης», «καταγγέλλων», «μάρτυρας δημοσίου συμφέροντος». Πολύ εύστοχα ο Weisgerber ορίζει τη γλώσσα «όχι από τη χρησιμοποίησή της ως μέσο επικοινωνίας, αλλά από την ουσία της ως δύναμη πνευματικής διαμόρφωσης».

Από τα ανωτέρω διαφαίνεται η ανάγκη η Ελλάδα να εντείνει τις προσπάθειές της προκειμένου όχι μόνον να μην τεθεί εκποδών η ελληνική γλώσσα, αλλά και να επιβληθεί, ως πολύτιμο πολιτισμικό αγαθό κατά τη δημιουργία των Μεγάλων Γλωσσικών Μοντέλων. Σκόπιμη κρίνεται η εκπαίδευση των μοντέλων στην ελληνική γλώσσα, προκειμένου να διατηρηθεί η γλωσσική ποικιλομορφία. Αυτό συνεπάγεται ότι δεν πρέπει να παραιτηθούμε από τη συγγραφή επιστημονικών κειμένων στα ελληνικά και τη δημιουργία κατάλληλων εργαλείων για τη διεθνή αξιοποίηση των κειμένων αυτών (π.χ. ψηφιακό αποθετήριο επιστημονικών δημοσιεύσεων στην ελληνική γλώσσα).

Το οφείλουμε στην ανθρωπότητα, καθώς η αφαίρεση της ελληνικής γλωσσικής ιδιαιτερότητας θα αποδυναμώσει τη συνθέτη σκέψη και θα περιορίσει τους γλωσσικούς ορίζοντες του ευρωπαϊκού και παγκόσμιου πολιτισμικού οικοδομήματος.