Η τεχνητή νοημοσύνη έχει γίνει τρομακτικά καλή

Δευτέρα, 00:01 - 13/03/2023

Του Tristan Bove

Η τεχνητή νοημοσύνη έχει γίνει τρομακτικά καλή. Μπορεί ήδη να περάσει σημαντικές εξετάσεις ιατρικής, να οργανώσει φιλικές συναντήσεις με άλλες τεχνητές νοημοσύνες στο διαδίκτυο, και όταν την πιέσουμε αρκετά, μπορεί να κάνει τους ανθρώπους να πιστέψουν ότι τους ερωτεύεται. Η τεχνητή νοημοσύνη μπορεί ακόμη και να δημιουργήσει πρωτότυπες εικόνες με βάση μόνο μια γραπτή περιγραφή, αλλά ακόμη και αυτό μπορεί να μην είναι το όριο των δυνατοτήτων της – η επόμενη μεγάλη εξέλιξη της τεχνητής νοημοσύνης θα μπορούσε να είναι η κατανόηση των εγκεφαλικών σημάτων και το να δώσει ζωή σε ό,τι συμβαίνει στο κεφάλι σας.

Οι μηχανές που μπορούν να ερμηνεύουν τι συμβαίνει στο κεφάλι των ανθρώπων αποτελούν εδώ και δεκαετίες βασικό πυλώνα της επιστημονικής φαντασίας. Εδώ και χρόνια, επιστήμονες από όλο τον κόσμο έχουν δείξει ότι οι υπολογιστές και οι αλγόριθμοι μπορούν πράγματι να κατανοήσουν τα εγκεφαλικά κύματα και να τα κάνουν να αποκτήσουν οπτικό νόημα μέσω μηχανημάτων λειτουργικής μαγνητικής τομογραφίας (fMRI) – είναι οι ίδιες συσκευές που χρησιμοποιούν οι γιατροί για να χαρτογραφήσουν τη νευρική δραστηριότητα κατά τη διάρκεια μιας σάρωσης του εγκεφάλου. Ήδη από το 2008, οι ερευνητές χρησιμοποιούσαν τη μηχανική μάθηση για να καταγράφουν και να αποκωδικοποιούν την εγκεφαλική δραστηριότητα.

Αλλά τα τελευταία χρόνια οι ερευνητές της τεχνητής νοημοσύνης έχουν στρέψει την προσοχή τους στον τρόπο με τον οποίο τα μοντέλα τεχνητής νοημοσύνης μπορούν να αναπαράγουν τι συμβαίνει στον ανθρώπινο εγκέφαλο και να εμφανίζουν τις σκέψεις των ανθρώπων μέσω κειμένου, ενώ γίνονται επίσης προσπάθειες να αναπαραχθούν οι σκέψεις μέσω εικόνων.

Δύο ερευνητές από το Πανεπιστήμιο της Οσάκα στην Ιαπωνία δηλώνουν ότι δημιούργησαν ένα νέο μοντέλο τεχνητής νοημοσύνης που μπορεί να κάνει ακριβώς αυτό, αλλά πιο γρήγορα και με μεγαλύτερη ακρίβεια απ’ ό,τι άλλες προσπάθειες. Το νέο μοντέλο φέρεται να καταγράφει τη νευρική δραστηριότητα με ακρίβεια περίπου 80%, δοκιμάζοντας μια νέα μέθοδο που συνδυάζει γραπτές και οπτικές περιγραφές εικόνων που είδαν οι συμμετέχοντες στο πείραμα, απλοποιώντας σημαντικά τη διαδικασία αναπαραγωγής των σκέψεων από την τεχνητή νοημοσύνη.

Οι νευροεπιστήμονες συστημάτων, Yu Takagi και Shinji Nishimoto, παρουσίασαν τα ευρήματά τους σε μια εργασία που δημοσιεύθηκε τον Δεκέμβριο και έγινε δεκτή την περασμένη εβδομάδα για παρουσίαση στο φετινό συνέδριο Computer Vision and Pattern Recognition (CVPR) στο Βανκούβερ, ένα από τα σημαντικότερα μέρη για την έρευνα στον τομέα της πληροφορικής. Ένας εκπρόσωπος του CVPR επιβεβαίωσε στο Fortune ότι η εργασία έγινε δεκτή.

Η νέα πτυχή της μελέτης των Takagi και Nishimoto είναι ότι χρησιμοποίησαν έναν αλγόριθμο που ονομάζεται Stable Diffusion (Σταθερή Διάχυση) για τη δημιουργία εικόνων. Το Stable Diffusion είναι ένα μοντέλο βαθιάς μάθησης κειμένου-εικόνας που ανήκει στην Stability AI με έδρα το Λονδίνο, το οποίο κυκλοφόρησε δημοσίως πέρυσι και αποτελεί άμεσο ανταγωνιστή άλλων generators κειμένου-εικόνας τεχνητής νοημοσύνης, όπως το DALL-E 2, το οποίο κυκλοφόρησε επίσης πέρυσι από τον δημιουργό του ChatGPT OpenAI.

Οι ερευνητές χρησιμοποίησαν το Stable Diffusion για να παρακάμψουν ορισμένα από τα εμπόδια που έκαναν τις προηγούμενες προσπάθειες για τη δημιουργία εικόνων από εγκεφαλικές σαρώσεις λιγότερο αποτελεσματικές. Οι προηγούμενες μελέτες απαιτούσαν συχνά την εκπαίδευση νέων μοντέλων τεχνητής νοημοσύνης από το μηδέν σε χιλιάδες εικόνες, αλλά οι Takagi και Nishimoto βασίστηκαν στον μεγάλο όγκο δεδομένων του Stable Diffusion για να δημιουργήσουν στην πραγματικότητα τις εικόνες με βάση γραπτές περιγραφές.

Οι γραπτές περιγραφές έγιναν με δύο προγράμματα τεχνητής νοημοσύνης που δημιούργησαν οι Takagi και Nishimoto. Οι ερευνητές χρησιμοποίησαν ένα δημόσια διαθέσιμο σύνολο δεδομένων από μια μελέτη του Πανεπιστημίου της Μινεσότα του 2021, η οποία συγκέντρωσε τα εγκεφαλικά κύματα και τα δεδομένα fMRI τεσσάρων συμμετεχόντων, καθώς ο καθένας από αυτούς έβλεπε περίπου 10.000 εικόνες. Αυτά τα δεδομένα fMRI τροφοδοτήθηκαν στη συνέχεια στα δύο μοντέλα που δημιουργήθηκαν για τη μελέτη, ώστε να δημιουργηθούν γραπτές περιγραφές κατανοητές από τη Stable Diffusion.

Όταν οι άνθρωποι βλέπουν μια φωτογραφία ή μια εικόνα, δύο διαφορετικά σύνολα λοβών στον εγκέφαλο συλλαμβάνουν τα πάντα σχετικά με το περιεχόμενο της εικόνας, συμπεριλαμβανομένης της προοπτικής, του χρώματος και της κλίμακας. Η χρήση ενός μηχανήματος fMRI τη στιγμή της μέγιστης νευρικής δραστηριότητας μπορεί να καταγράψει τις πληροφορίες που παράγονται από αυτούς τους λοβούς. Οι Takagi και Nishimoto πέρασαν τα δεδομένα της fMRI από τα δύο πρόσθετα μοντέλα τους, τα οποία μετέφρασαν τις πληροφορίες σε κείμενο. Στη συνέχεια, το Stable Diffusion μετέτρεψε αυτό το κείμενο σε εικόνες.

Παρόλο που η έρευνα είναι σημαντική, δεν θα μπορείτε να αγοράσετε σύντομα έναν αναγνώστη μυαλού που λειτουργεί στο σπίτι με τη βοήθεια της τεχνητής νοημοσύνης. Επειδή τα εγκεφαλικά κύματα κάθε υποκειμένου ήταν διαφορετικά, οι ερευνητές έπρεπε να δημιουργήσουν νέα μοντέλα για καθένα από τα τέσσερα άτομα που υποβλήθηκαν στο πείραμα του Πανεπιστημίου της Μινεσότα. Αυτή η διαδικασία θα απαιτούσε πολλαπλές συνεδρίες σάρωσης του εγκεφάλου και οι νευροεπιστήμονες σημείωσαν ότι η τεχνολογία δεν είναι πιθανότατα έτοιμη για εφαρμογές εκτός έρευνας.

Αλλά η τεχνολογία εξακολουθεί να είναι πολλά υποσχόμενη, αν οι ακριβείς αναπαραστάσεις της νευρικής δραστηριότητας μπορούν να απλοποιηθούν ακόμη περισσότερο, δήλωσαν οι ερευνητές. Ο Nishimoto έγραψε στο Twitter την περασμένη εβδομάδα ότι η τεχνητή νοημοσύνη θα μπορούσε τελικά να χρησιμοποιηθεί για την παρακολούθηση της εγκεφαλικής δραστηριότητας κατά τη διάρκεια του ύπνου και να βελτιώσει την κατανόηση των ονείρων. Ο Nishimoto δήλωσε αυτή την εβδομάδα στο Science ότι η χρήση της τεχνητής νοημοσύνης για την αναπαραγωγή της εγκεφαλικής δραστηριότητας θα μπορούσε ακόμη και να βοηθήσει τους ερευνητές να κατανοήσουν περισσότερα για το πώς άλλα είδη αντιλαμβάνονται το περιβάλλον τους.

Πηγή: Fortune

Greek Finance Forum Team

Σχόλια Αναγνωστών

Αποποίηση Ευθύνης....