Σύστημα τεχνητής νοημοσύνης «μεταφράζει» αυτόματα σε προτάσεις την εγκεφαλική δραστηριότητα ανθρώπων (video)

Κάτι που γίνεται για πρώτη φορά.
Οι επιστήμονες έκαναν ακόμη ένα βήμα για τη δημιουργία μηχανών που καταλαβαίνουν τι λέει ένας άνθρωπος, αναλύοντας μόνο τα εγκεφαλικά κύτταρά του και μετατρέποντας, στη συνέχεια, αυτόματα, σε γραπτό κείμενο, τις προτάσεις του.

Ερευνητές στις ΗΠΑ δημιούργησαν έναν αλγόριθμο τεχνητής νοημοσύνης, ο οποίος μπορεί να αποκωδικοποιήσει τη νευρωνική δραστηριότητα του εγκεφάλου και να τη «μεταφράσει» σε πραγματικό χρόνο σε προτάσεις με μεγάλη ακρίβεια (σφάλμα μόνο 3%), κάτι που επιτυγχάνεται για πρώτη φορά σε αυτό το βαθμό. Οι διεπαφές εγκεφάλου-μηχανής (brain-machine interfaces) είχαν έως τώρα περιορισμένη επιτυχία στο να αποκωδικοποιήσουν τη σκέψη με βάση μόνο την εγκεφαλική δραστηριότητα και έτσι να δημιουργήσουν τεχνητή ομιλία, έχοντας πετύχει ακρίβεια αρκετά μικρότερη από τη φυσική ομιλία. Μέχρι σήμερα δεν είχαν καταφέρει να «διαβάσουν» ολόκληρες προτάσεις παρά μόνο λέξεις.

Αυτή τη φορά, οι ερευνητές, με επικεφαλής τους Τζόζεφ Μέικιν και Έντουαρντ Τσανγκ του Πανεπιστημίου της Καλιφόρνια-Σαν Φρανσίσκο, που έκαναν τη σχετική δημοσίευση στο περιοδικό νευροεπιστήμης «Nature Neuroscience», αξιοποίησαν τις τελευταίες εξελίξεις στο πεδίο της μηχανικής μετάφρασης για να εκπαιδεύσουν τεχνητά νευρωνικά δίκτυα να μετατρέπουν απευθείας τα σήματα των νευρώνων σε προτάσεις.

Τέσσερις εθελοντές, στο κρανίο των οποίων είχαν εμφυτευθεί ηλεκτρόδια καταγραφής της νευρωνικής δραστηριότητας, διάβαζαν φωναχτά προτάσεις κειμένου. Το σύστημα τεχνητής νοημοσύνης έμαθε έτσι να συσχετίζει τα νευρωνικά σήματα με την ομιλία και τα συστατικά των λέξεων (φωνήεντα, σύμφωνα κ.ά.), ενώ στη συνέχεια έμαθε να «δένει» τις λέξεις σε προτάσεις.

Η ακρίβεια του αλγόριθμου είναι ανάλογη εκείνης που χρησιμοποιούν τα «έξυπνα» επαγγελματικά υπολογιστικά συστήματα αυτόματης μετατροπής της ομιλίας σε γραπτό κείμενο. Πάντως, σύμφωνα με τους ερευνητές, το σύστημα χρειάζεται ακόμη περαιτέρω βελτίωση, καθώς έως τώρα δεν μπορεί να ξεπεράσει τις 30 έως 50 προτάσεις με βάση ένα λεξιλόγιο έως 250 λέξεων. Το επόμενο βήμα θα είναι να μπορεί το σύστημα να μετατρέπει σε προτάσεις τη νευρωνική δραστηριότητα ανθρώπων που απλώς σκέφτονται και δεν μιλάνε.

«Για πρώτη φορά μπορέσαμε να δημιουργήσουμε ολοκληρωμένες φωνητικές προτάσεις με βάση την εγκεφαλική δραστηριότητα του ατόμου», επισημαίνει ο Εντουαρντ Τσανγκ, καθηγητής νευροχειρουργικής στο Πανεπιστήμιο της Καλιφόρνιας και συντάκτης της μελέτης. «Αποτελεί μία καταπληκτική απόδειξη επί της αρχής, ότι με την κατάλληλη τεχνολογία στην επιστημονική φαρέτρα, θα καταφέρουμε να προσφέρουμε μία συσκευή η οποία θα μπορεί να εξυπηρετήσει ασθενείς με απώλεια λόγου». Η συγκεκριμένη τεχνολογία υπόσχεται να αλλάξει τις ζωές των ανθρώπων που δεν διαθέτουν επαρκείς ικανότητες επικοινωνίας.

Oι συσκευές που συνθέτουν λόγο, όπως αυτή που χρησιμοποιούσε ο Στίβεν Χόκινγκ, συνήθως λειτουργούν με την αναγραφή λέξεων γράμμα γράμμα με τη βοήθεια των κινήσεων του οφθαλμού ή κάποιου μυός του προσώπου. Επιτρέπουν στον ασθενή να εκφέρει οκτώ λέξεις το λεπτό, συγκριτικά με τον φυσικό λόγο, που περιλαμβάνει 100 έως 150 λέξεις. Προηγούμενες προσπάθειες μετάφρασης της εγκεφαλικής δραστηριότητας σε λόγο εστιάστηκαν στην αποκρυπτογράφηση του τρόπου με τον οποίο ακούγεται ο ανθρώπινος λόγος στον εγκέφαλο. Ωστόσο, είχαν περιορισμένη επιτυχία.

Ο δρ Τσανγκ και οι συνεργάτες του δοκίμασαν κάτι διαφορετικό. Στόχευσαν στις περιοχές του εγκεφάλου που στέλνουν τις οδηγίες που απαιτούνται για να συντονιστεί η αλληλουχία κινήσεων της γλώσσας, των χειλιών,του σαγονιού και του λάρυγγα. «Σκεφθήκαμε ότι αν τα κέντρα λόγου στον εγκέφαλο κωδικοποιούν κινήσεις αντί για ήχους, θα έπρεπε να προσπαθήσουμε να κάνουμε το ίδιο, αποκωδικοποιώντας αυτά τα σήματα», εξηγεί ο Γκοπάλα Ανουμαντσιπαλί, ειδικός λόγου στο Πανεπιστήμιο της Καλιφόρνιας που συνυπογράφει τη μελέτη.