|
Η άποψη αυτή αποκτά
ιδιαίτερο βάρος, καθώς ο
LeCun
θεωρείται ένας από τους
βασικούς δημιουργούς του
σύγχρονου πεδίου του
deep
learning.
Μαζί με τους
Geoffrey
Hinton
και Yoshua
Bengio
τιμήθηκε με το
Turing
Award
το 2018 για τη συμβολή
τους στην ανάπτυξη των
νευρωνικών δικτύων.
Σύμφωνα με τον ίδιο, τα
σημερινά Large
Language
Models,
όπως το ChatGPT
της OpenAI,
το Claude
της Anthropic
και το Gemini
της Google,
μπορεί να επιδεικνύουν
εντυπωσιακές γλωσσικές
ικανότητες, όμως δεν
διαθέτουν πραγματική
κατανόηση του κόσμου.
Εκπαιδεύονται απλώς να
προβλέπουν την επόμενη
λέξη σε τεράστιες
ποσότητες κειμένου,
γεγονός που εξηγεί γιατί
εμφανίζουν
«παραισθήσεις»,
επινοώντας πληροφορίες
που δεν υπάρχουν.
Η εναλλακτική προσέγγιση
που προτείνει ο
LeCun
βασίζεται στα λεγόμενα
World
Models.
Αντί να μαθαίνουν
αποκλειστικά από
κείμενο, αυτά τα
συστήματα εκπαιδεύονται
παρατηρώντας τον φυσικό
κόσμο και δημιουργώντας
εσωτερικά μοντέλα που
περιγράφουν τη σχέση
αιτίας και
αποτελέσματος. Με τον
τρόπο αυτό αποκτούν μια
μορφή «κοινής λογικής»
που τα σημερινά γλωσσικά
μοντέλα δεν διαθέτουν.
Η τεχνολογική βάση αυτής
της προσέγγισης είναι η
αρχιτεκτονική
Joint
Embedding
Predictive
Architecture
(JEPA),
την οποία ανέπτυξε ο
LeCun
στη Meta
και παρουσίασε το 2022.
Σε αντίθεση με τα
generative
models
που προσπαθούν να
αναπαράγουν κάθε
λεπτομέρεια μιας εικόνας
ή σκηνής, η JEPA
επιχειρεί να μάθει
αφηρημένες
αναπαραστάσεις και τους
βασικούς κανόνες που
διέπουν τον φυσικό
κόσμο.
Η διαφορά μεταξύ των δύο
προσεγγίσεων γίνεται
ιδιαίτερα εμφανής σε
εφαρμογές όπως η
ρομποτική, τα αυτόνομα
οχήματα ή τα βιομηχανικά
συστήματα παραγωγής. Ένα
LLM
μπορεί να εξηγήσει πώς
αλλάζει κανείς ένα
λάστιχο αυτοκινήτου,
αλλά δεν μπορεί να
εκτελέσει την εργασία.
Ένα σύστημα βασισμένο σε
World
Model,
αντίθετα, θα μπορούσε να
το κάνει επειδή κατανοεί
τη φυσική αλληλεπίδραση
των αντικειμένων.
Το στοίχημα που ανοίγει
είναι τεράστιο. Αν η
εκτίμηση του
LeCun
αποδειχθεί σωστή, τότε
εταιρείες όπως η
OpenAI,
η Google
και η Microsoft
επενδύουν εκατοντάδες
δισεκατομμύρια δολάρια
σε μια τεχνολογική
κατεύθυνση που δεν θα
οδηγήσει ποτέ στην
τεχνητή γενική
νοημοσύνη. Αν αποδειχθεί
λανθασμένη, τότε τα
LLMs
θα συνεχίσουν την πορεία
τους προς την AGI,
με επόμενες γενιές
συστημάτων όπως τα
GPT-6
ή GPT-7
να φέρνουν την επόμενη
μεγάλη επανάσταση.
Παρά το γεγονός ότι οι
επενδύσεις σε
LLMs
ξεπερνούν ήδη το 1 τρισ.
δολάρια, εμφανίζονται
και αντίθετα τεχνολογικά
στοιχήματα. Εκτός από
την AMI
Labs,
η World
Labs
της Fei-Fei
Li
έχει αποτίμηση περίπου 5
δισ. δολάρια και
προσελκύει επενδυτές
όπως η Nvidia,
η Samsung,
η Toyota
και η Temasek.
Η διαφωνία αυτή
αναβιώνει μια παλιά
φιλοσοφική συζήτηση
σχετικά με τη φύση της
νοημοσύνης. Ο φιλόσοφος
Andy
Clark
έχει αναπτύξει τη θεωρία
της «ενσώματης νόησης»,
σύμφωνα με την οποία η
σκέψη δεν είναι απλώς
υπολογισμός αλλά ένα
σύστημα που εκτείνεται
από τον εγκέφαλο στο
σώμα και στο περιβάλλον.
Ήδη από τη δεκαετία του
1970, ο φιλόσοφος
Hubert
Dreyfus
είχε υποστηρίξει στο
βιβλίο του What
Computers
Can't
Do
ότι η
τεχνητή νοημοσύνη θα
παραμείνει περιορισμένη
όσο δεν διαθέτει «σώμα»
που να αλληλεπιδρά με
τον πραγματικό κόσμο.
Περισσότερα από πενήντα
χρόνια αργότερα, ο
LeCun
επαναφέρει ουσιαστικά το
ίδιο επιχείρημα: η
πραγματική νοημοσύνη δεν
ξεκινά από τη γλώσσα
αλλά από την εμπειρία
του κόσμου. Αν η ιστορία
τον δικαιώσει, η
επένδυση του ενός
δισεκατομμυρίου δολαρίων
δεν αφορά απλώς την
ανάπτυξη ενός ακόμη
αλγορίθμου, αλλά την
προσπάθεια να δοθεί
«σώμα» στην τεχνητή
νοημοσύνη.
|