Οι μηχανές που μπορούν
να ερμηνεύουν τι
συμβαίνει στο κεφάλι των
ανθρώπων αποτελούν
εδώ και δεκαετίες βασικό
πυλώνα της επιστημονικής
φαντασίας. Εδώ και
χρόνια, επιστήμονες από
όλο τον κόσμο έχουν
δείξει ότι οι
υπολογιστές και οι
αλγόριθμοι μπορούν
πράγματι να κατανοήσουν
τα εγκεφαλικά κύματα και
να τα κάνουν να
αποκτήσουν οπτικό νόημα
μέσω μηχανημάτων
λειτουργικής μαγνητικής
τομογραφίας (fMRI) –
είναι οι ίδιες συσκευές
που χρησιμοποιούν οι
γιατροί για να
χαρτογραφήσουν τη
νευρική δραστηριότητα
κατά τη διάρκεια μιας
σάρωσης του εγκεφάλου.
Ήδη από το 2008, οι
ερευνητές
χρησιμοποιούσαν τη
μηχανική μάθηση για να
καταγράφουν και να
αποκωδικοποιούν την
εγκεφαλική
δραστηριότητα.
Αλλά τα τελευταία χρόνια
οι ερευνητές της
τεχνητής νοημοσύνης
έχουν στρέψει την
προσοχή τους στον τρόπο
με τον οποίο τα μοντέλα
τεχνητής νοημοσύνης
μπορούν να αναπαράγουν
τι συμβαίνει στον
ανθρώπινο εγκέφαλο και
να εμφανίζουν τις
σκέψεις των ανθρώπων
μέσω κειμένου, ενώ
γίνονται επίσης
προσπάθειες να
αναπαραχθούν οι σκέψεις
μέσω εικόνων.
Δύο ερευνητές από το
Πανεπιστήμιο της Οσάκα
στην Ιαπωνία δηλώνουν
ότι δημιούργησαν ένα νέο
μοντέλο τεχνητής
νοημοσύνης που μπορεί να
κάνει ακριβώς αυτό, αλλά
πιο γρήγορα και με
μεγαλύτερη ακρίβεια απ’
ό,τι άλλες προσπάθειες.
Το νέο μοντέλο φέρεται
να καταγράφει τη νευρική
δραστηριότητα με
ακρίβεια περίπου 80%,
δοκιμάζοντας μια νέα
μέθοδο που συνδυάζει
γραπτές και οπτικές
περιγραφές εικόνων που
είδαν οι συμμετέχοντες
στο πείραμα,
απλοποιώντας σημαντικά
τη διαδικασία
αναπαραγωγής των σκέψεων
από την τεχνητή
νοημοσύνη.
Οι νευροεπιστήμονες
συστημάτων, Yu Takagi
και Shinji Nishimoto,
παρουσίασαν τα ευρήματά
τους σε μια εργασία που
δημοσιεύθηκε τον
Δεκέμβριο και έγινε
δεκτή την περασμένη
εβδομάδα για παρουσίαση
στο φετινό συνέδριο
Computer Vision and
Pattern Recognition
(CVPR) στο Βανκούβερ,
ένα από τα σημαντικότερα
μέρη για την έρευνα στον
τομέα της πληροφορικής.
Ένας εκπρόσωπος του CVPR
επιβεβαίωσε στο Fortune
ότι η εργασία έγινε
δεκτή.
Η νέα πτυχή της μελέτης
των Takagi και Nishimoto
είναι ότι χρησιμοποίησαν
έναν αλγόριθμο που
ονομάζεται Stable
Diffusion (Σταθερή
Διάχυση) για τη
δημιουργία εικόνων. Το
Stable Diffusion είναι
ένα μοντέλο βαθιάς
μάθησης κειμένου-εικόνας
που ανήκει στην
Stability AI με έδρα το
Λονδίνο, το οποίο
κυκλοφόρησε δημοσίως
πέρυσι και αποτελεί
άμεσο ανταγωνιστή άλλων
generators
κειμένου-εικόνας
τεχνητής νοημοσύνης,
όπως το DALL-E 2, το
οποίο κυκλοφόρησε επίσης
πέρυσι από τον δημιουργό
του ChatGPT OpenAI.
Οι ερευνητές
χρησιμοποίησαν το Stable
Diffusion για να
παρακάμψουν ορισμένα από
τα εμπόδια που έκαναν
τις προηγούμενες
προσπάθειες για τη
δημιουργία εικόνων από
εγκεφαλικές σαρώσεις
λιγότερο
αποτελεσματικές. Οι
προηγούμενες μελέτες
απαιτούσαν συχνά την
εκπαίδευση νέων μοντέλων
τεχνητής νοημοσύνης από
το μηδέν σε χιλιάδες
εικόνες, αλλά οι Takagi
και Nishimoto βασίστηκαν
στον μεγάλο όγκο
δεδομένων του Stable
Diffusion για να
δημιουργήσουν στην
πραγματικότητα τις
εικόνες με βάση γραπτές
περιγραφές.
Οι γραπτές περιγραφές
έγιναν με δύο
προγράμματα τεχνητής
νοημοσύνης που
δημιούργησαν οι Takagi
και Nishimoto. Οι
ερευνητές χρησιμοποίησαν
ένα δημόσια διαθέσιμο
σύνολο δεδομένων από μια
μελέτη του Πανεπιστημίου
της Μινεσότα του 2021, η
οποία συγκέντρωσε τα
εγκεφαλικά κύματα και τα
δεδομένα fMRI τεσσάρων
συμμετεχόντων, καθώς ο
καθένας από αυτούς
έβλεπε περίπου 10.000
εικόνες. Αυτά τα
δεδομένα fMRI
τροφοδοτήθηκαν στη
συνέχεια στα δύο μοντέλα
που δημιουργήθηκαν για
τη μελέτη, ώστε να
δημιουργηθούν γραπτές
περιγραφές κατανοητές
από τη Stable Diffusion.
Όταν οι άνθρωποι βλέπουν
μια φωτογραφία ή μια
εικόνα, δύο διαφορετικά
σύνολα λοβών στον
εγκέφαλο συλλαμβάνουν τα
πάντα σχετικά με το
περιεχόμενο της εικόνας,
συμπεριλαμβανομένης της
προοπτικής, του χρώματος
και της κλίμακας. Η
χρήση ενός μηχανήματος
fMRI τη στιγμή της
μέγιστης νευρικής
δραστηριότητας μπορεί να
καταγράψει τις
πληροφορίες που
παράγονται από αυτούς
τους λοβούς. Οι Takagi
και Nishimoto πέρασαν τα
δεδομένα της fMRI από τα
δύο πρόσθετα μοντέλα
τους, τα οποία
μετέφρασαν τις
πληροφορίες σε κείμενο.
Στη συνέχεια, το Stable
Diffusion μετέτρεψε αυτό
το κείμενο σε εικόνες.
Παρόλο που η έρευνα
είναι σημαντική, δεν θα
μπορείτε να αγοράσετε
σύντομα έναν αναγνώστη
μυαλού που λειτουργεί
στο σπίτι με τη βοήθεια
της τεχνητής νοημοσύνης.
Επειδή τα εγκεφαλικά
κύματα κάθε υποκειμένου
ήταν διαφορετικά, οι
ερευνητές έπρεπε να
δημιουργήσουν νέα
μοντέλα για καθένα από
τα τέσσερα άτομα που
υποβλήθηκαν στο πείραμα
του Πανεπιστημίου της
Μινεσότα. Αυτή η
διαδικασία θα απαιτούσε
πολλαπλές συνεδρίες
σάρωσης του εγκεφάλου
και οι νευροεπιστήμονες
σημείωσαν ότι η
τεχνολογία δεν είναι
πιθανότατα έτοιμη για
εφαρμογές εκτός έρευνας.
Αλλά η τεχνολογία
εξακολουθεί να είναι
πολλά υποσχόμενη, αν οι
ακριβείς αναπαραστάσεις
της νευρικής
δραστηριότητας μπορούν
να απλοποιηθούν ακόμη
περισσότερο, δήλωσαν οι
ερευνητές. Ο Nishimoto
έγραψε στο Twitter την
περασμένη εβδομάδα ότι η
τεχνητή νοημοσύνη θα
μπορούσε τελικά να
χρησιμοποιηθεί για την
παρακολούθηση της
εγκεφαλικής
δραστηριότητας κατά τη
διάρκεια του ύπνου και
να βελτιώσει την
κατανόηση των ονείρων. Ο
Nishimoto δήλωσε αυτή
την εβδομάδα στο Science
ότι η χρήση της τεχνητής
νοημοσύνης για την
αναπαραγωγή της
εγκεφαλικής
δραστηριότητας θα
μπορούσε ακόμη και να
βοηθήσει τους ερευνητές
να κατανοήσουν
περισσότερα για το πώς
άλλα είδη
αντιλαμβάνονται το
περιβάλλον τους.
Πηγή: Fortune |