Ερευνητές του Northeastern University δημιούργησαν ένα εργαλείο Τεχνητής Νοημοσύνης (ΑΙ) που χρησιμοποιεί αλληλουχίες γεγονότων της ζωής ενός ανθρώπου (όπως το ιστορικό υγείας, η μόρφωση, η δουλειά και το εισόδημα) για να προβεί σε προβλέψεις για διάφορους τομείς, μεταξύ των οποίων η προσωπικότητα και η διάρκεια ζωής του.
Το νέο εργαλείο, life2vec, φτιάχτηκε μέσω transformer models, με τα οποία λειτουργούν LLM (large language models) όπως το ChatGPT. Εκπαιδεύτηκε με δεδομένα που αντλήθηκαν από το σύνολο του πληθυσμού της Δανίας (6 εκατομμύρια άνθρωποι). Τα δεδομένα διατέθηκαν μόνο στους ερευνητές από την κυβέρνηση της χώρας.
Το εργαλείο που έφτιαξαν οι ερευνητές με βάση αυτά τα δεδομένα είναι ικανό να κάνει προβλέψεις για το μέλλον, μεταξύ των οποίων και η διάρκεια ζωής των ανθρώπων, με ακρίβεια που, όπως υποστηρίζεται, ξεπερνά τα πλέον εξελιγμένα μοντέλα. Ωστόσο, παρά τις προγνωστικές του δυνατότητες, η ομάδα πίσω από την έρευνα λέει ότι είναι πιο κατάλληλο ως βάση για μελλοντικές δουλειές.
«Αν και χρησιμοποιούμε προγνώσεις για να αξιολογήσουμε πόσο καλά είναι αυτά τα μοντέλα, το εργαλείο δεν θα έπρεπε να χρησιμοποιείται για προγνώσεις σε πραγματικούς ανθρώπους» είπε η Τίνα Ελιάσι Ραντ, καθηγήτρια επιστημών υπολογιστή στο Northeastern University. «Είναι ένα μοντέλο πρόγνωσης με βάση ένα συγκεκριμένο data set σε έναν συγκεκριμένο πληθυσμό».
Η Ελιάσι Ραντ χρησιμοποίησε την εμπειρία της στον χώρο της ηθικής στην ΑΙ στο εγχείρημα: «Τα εργαλεία αυτά σου επιτρέπουν να δεις την κοινωνία σου με διαφορετικό τρόπο: Τις πολιτικές που έχεις, τους κανόνες και τους κανονισμούς που έχεις...μπορείτε να το δείτε σαν ένα “σκανάρισμα” αυτών που συμβαίνουν στην πραγματικότητα».
Εμπλέκοντας κοινωνικούς επιστήμονες στη διαδικασία ανάπτυξης αυτού του εργαλείου, η ομάδα ελπίζει πως θα φέρει μια ανθρωποκεντρική προσέγγιση στην ανάπτυξη ΑΙ που δεν «ξεχνά» τους ανθρώπους ανάμεσα στον τεράστιο όγκο δεδομένων πάνω στον οποίον έχει εκπαιδευτεί το εργαλείο της.
«Το μοντέλο αυτό προσφέρει μια πολύ πιο αναλυτική εικόνα του κόσμου όπως τον βιώνουν ανθρώπινα όντα συγκριτικά με πολλά άλλα μοντέλα» είπε ο Σούνε Λέμαν, συντάκτης του επιστημονικού άρθρου, που δημοσιεύτηκε πρόσφατα στο Nature Computational Science.
Στην «καρδιά» του life2vec βρίσκεται ο τεράστιος όγκος δεδομένων που χρησιμοποίησαν οι ερευνητές για να εκπαιδεύσουν το μοντέλο τους. Τα δεδομένα αυτά προέρχονται από την στατιστική υπηρεσία της Δανίας και τελούν υπό πολύ αυστηρό έλεγχο, καθώς περιλαμβάνουν λεπτομερή μητρώα για όλους τους πολίτες της χώρας.
Στα δεδομένα αυτά περιλαμβάνονται γεγονότα και στοιχεία από τα οποία αποτελείται μια ζωή- από παράγοντες που σχετίζονται με την υγεία και την εκπαίδευση μέχρι το εισόδημα. Οι ερευνητές χρησιμοποίησαν τα δεδομένα για να δημιουργήσουν μεγάλα μοτίβα επαναλαμβανόμενων γεγονότων για να τροφοδοτούν το μοντέλο τους. Όπως σημειώνει ο Λέμαν- καθηγητής δικτύων στο DTU Compute του Πολυτεχνείου της Δανίας και προηγουμένως μεταδιδακτορικός στο Northeastern- όλη η ιστορία μιας ανθρώπινης ζωής μπορεί να εκληφθεί ως μια «γιγαντιαία, μακρά πρόταση των πολλών πραγμάτων που μπορούν να συμβούν σε ένα άτομο».
To μοντέλο χρησιμοποιεί τις πληροφορίες που λαμβάνει από την παρατήρηση εκατοντάδων αλληλουχιών γεγονότων ζωής για να φτιάξει αναπαραστάσεις διανυσμάτων, συνεχίζοντας με κατηγοριοποιήσεις και συσχετισμούς. Αυτό οδηγεί στη δημιουργία θεμελίων για τις προβλέψεις που ακολουθούν.
Ένα από τα γεγονότα ζωής που οι ερευνητές ήταν σε θέση να προβλέψουν ήταν η πιθανότητα θανάτου κάποιου: «Όταν οπτικοποιούμε τον χώρο που το μοντέλο χρησιμοποιεί για να κάνει προβλέψεις, φαίνεται σαν ένας μακρύς κύλινδρος που σας παίρνει από τη χαμηλή πιθανότητα θανάτου στην υψηλή πιθανόητα θανάτου» λέει ο Λέμαν. «Τότε μπορούμε να δείξουμε ότι στο τέλος, όπου υπάρχει υψηλή πιθανότητα θανάτου, πολλοί από αυτούς τους ανθρώπους έχουν πραγματικά πεθάνει, και στο τέλος όπου υπάρχει χαμηλή πιθανότητα θανάτου τα αίτια θανάτου ήταν κάτι που δεν μπορούσαμε να προβλέψουμε, όπως τροχαία».
Πάντως οι Ελιάσι Ραντ και Λέμαν τονίζουν πως, αν και το μοντέλο κάνει αρκετά ακριβείς προβλέψεις, αυτές βασίζονται σε συσχετισμούς, πολύ συγκεκριμένα πολιτιστικά και κοινωνικά πλαίσια και τα είδη προκαταλήψεων που συναντώνται σε κάθε data set.
«Αυτό το εργαλείο είναι σαν ένα παρατηρητήριο της κοινωνίας- και όχι όλων των κοινωνιών» είπε η Ελιάσι Ραντ. «Η έρευνα έγινε στη Δανία και η Δανία έχει τη δική της κουλτούρα, τους δικούς της νόμους, και τους δικούς της κοινωνικούς κανόνες. Το αν αυτό θα μπορούσε να γίνει στην Αμερική είναι διαφορετική υπόθεση» σχολιάζει.
Οι ερευνητές βλέπουν το προγνωστικό τους μοντέλο λιγότερο ως τελικό προϊόν και πιο πολύ ως την αρχή μιας συζήτησης. Ο Λέμαν λέει πως μεγάλες εταιρείες τεχνολογίας πιθανότατα δημιουργούν τέτοια είδη προγνωστικών αλγορίθμων για χρόνια κεκλεισμένων των θυρών. Ο ίδιος ελπίζει ότι η δουλειά του μπορεί να φέρει μια πιο ανοιχτή, δημόσια κατανόηση του τρόπου με τον οποίο λειτουργούν αυτά τα εργαλεία, των δυνατοτήτων που έχουν και πώς θα έπρεπε να χρησιμοποιούνται ή να μην χρησιμοποιούνται.