Οι
επενδυτές θεωρούν την
OpenAI
την αγαπημένη της
τεχνολογίας: σύμφωνα με
μια πρόσφατη αύξηση
κεφαλαίου, αξίζει 157
δισ. δολάρια. Ελπίζουν
ότι χάρη στην επιτυχία
προϊόντων όπως το
ChatGPT,
θα γίνει ο επόμενος
τεχνολογικός γίγαντας
του 1 τρισ. δολαρίων.
Ωστόσο, το υψηλότερο
κόστος των μοντέλων
τελευταίας τεχνολογίας,
καθώς και άλλες πιέσεις
από προμηθευτές,
διανομείς και
ανταγωνιστές,
υποδηλώνουν ότι η
κατασκευή μοντέλων
μπορεί να μην προσδώσει
το είδος των
μονοπωλιακών εξουσιών
που απολαμβάνουν οι
τεχνολογικοί γίγαντες.
«Κάτι πολύ σημαντικό που
πρέπει να κατανοήσουμε
για το μέλλον: τα
οικονομικά της τεχνητής
νοημοσύνης πρόκειται να
αλλάξουν εντελώς»,
δήλωσε ο
François
Chollet,
ένας βετεράνος ερευνητής
τεχνητής νοημοσύνης,
στον ιστότοπο κοινωνικής
δικτύωσης
X,
την ημέρα που
δημοσιοποιήθηκε το
o3.
Ο κ.
Chollet
συνέβαλε στην αύξηση του
ενθουσιασμού για το
o3.
Τον Ιούνιο προκήρυξε ένα
βραβείο ύψους 1 εκατ.
δολαρίων για μοντέλα που
θα μπορούσαν να τρέξουν
σε μια δοκιμασία που
είχε δημιουργήσει πέντε
χρόνια νωρίτερα και
ονομάζεται “Abstraction
and
Reasoning
Corpus”,
ή
ARC.
Πρόκειται για ένα σύνολο
απλών παζλ οπτικής
συλλογιστικής (βλ.
εικόνα) που έχουν ως
στόχο να είναι «εύκολα
για τους ανθρώπους και
αδύνατα για τη σύγχρονη
τεχνητή νοημοσύνη». (Το
εύκολο είναι σχετικό –
σε μια μελέτη του
Σεπτεμβρίου, οι άνθρωποι
που προσλήφθηκαν μέσω
διαδικτύου σημείωσαν
60-70% επιτυχία στο
τεστ). Το βραβείο δεν
ήταν απλώς πρόκληση αυτή
καθ’ αυτή. Ο κ.
Chollet
δήλωσε ότι το να νικήσει
κανείς σε μια δοκιμασία
ARC
ήταν ένα «κρίσιμο» βήμα
προς την οικοδόμηση
γενικής τεχνητής
νοημοσύνης, δηλαδή
μηχανών που θα νικούσαν
τους ανθρώπους σε πολλές
εργασίες.

Έξι
μήνες αργότερα, η
OpenAI
πέτυχε στο τεστ. Το
μοντέλο της
o3
πέτυχε μια επαναστατική
βαθμολογία 91,5%. Η
επιτυχία της στην
πρόκληση έδειξε μια
βαθμιαία αλλαγή στην
ικανότητα της τεχνητής
νοημοσύνης να
προσαρμόζεται σε νέα
καθήκοντα, δήλωσε ο κ.
Chollet.
Το νέο μοντέλο δεν είναι
απλώς καλύτερο, είναι
διαφορετικό. Όπως και το
o1,
χρησιμοποιεί μια
προσέγγιση «test-time
compute»
που σημαίνει ότι όσο
περισσότερο χρόνο
δαπανάει στην εξαγωγή
συμπερασμάτων (όταν ένα
εκπαιδευμένο μοντέλο
τεχνητής νοημοσύνης
απαντά σε ερωτήματα)
τόσο καλύτερα
αποτελέσματα παράγει.
Αντί να παράγει
απλώς
μια απάντηση όσο πιο
γρήγορα μπορεί, το
o3
είναι κατασκευασμένο να
σκέφτεται περισσότερο
την ερώτηση.
Σε αυτό
ακριβώς το σημείο
προκύπτει και το
υψηλότερο κόστος. Ο κ.
Chollet
έθεσε όριο 10.000
δολαρίων στο ποσό που
μπορούν να δαπανήσουν οι
διαγωνιζόμενοι για
υπολογιστική ισχύ για να
απαντήσουν στις 400
ερωτήσεις της πρόκλησής
του. Όταν η
OpenAI
υπέβαλε ένα μοντέλο κάτω
από το όριο, δαπάνησε
6.677 δολάρια (περίπου
17 δολάρια ανά ερώτηση)
για να επιτύχει
βαθμολογία 82,8%. Η
βαθμολογία του 91,5%,
που πέτυχε το
o3,
προήλθε από την
εκτόξευση του
προϋπολογισμού. Η
εταιρεία δεν αποκάλυψε
το ποσό που δαπανήθηκε,
αλλά δήλωσε ότι η ακριβή
εκδοχή της διαδικασίας
χρησιμοποίησε 172 φορές
περισσότερο «υπολογισμό»
από ό,τι η φθηνότερη
προσέγγιση – γεγονός που
υποδηλώνει περίπου 3.000
δολάρια για την επίλυση
ενός μόνο ερωτήματος που
ένας άνθρωπος χρειάζεται
δευτερόλεπτα.
Σίγουρα,
τα προηγούμενα μοντέλα
τεχνητής νοημοσύνης
έχουν ήδη αμφισβητήσει
τον κανόνα του χαμηλού
οριακού κόστους της
βιομηχανίας λογισμικού,
επειδή η απάντηση σε
ερωτήματα απαιτούσε
σημαντικά περισσότερη
επεξεργαστική ισχύ από
ό,τι η χρήση ισοδύναμων
εργαλείων όπως μια
μηχανή αναζήτησης. Όμως
το κόστος της κατασκευής
μεγάλων γλωσσικών
μοντέλων και της
λειτουργίας τους ήταν
αρκετά μικρό σε
απόλυτους όρους, ώστε η
OpenAI
να μπορεί ακόμα να δίνει
δωρεάν πρόσβαση.
Με τα
τελευταία μοντέλα αυτό
πλέον δεν ισχύει. Η
OpenAI
περιορίζει την έκδοση «pro»
του μοντέλου
o1
στους χρήστες της
συνδρομητικής βαθμίδας
των 200 δολαρίων το μήνα
(και χάνει χρήματα,
σύμφωνα με τον
Sam
Altman,
το αφεντικό της, επειδή
οι πελάτες ξοδεύουν
περισσότερα για
ερωτήματα από όσα είχε
προϋπολογίσει η
εταιρεία). Ο
Pierre
Ferragu
της
New
Street
Research,
μιας εταιρείας αναλυτών,
εκτιμά ότι η
OpenAI
μπορεί να χρεώνει έως
και 2.000 δολάρια το
μήνα για πλήρη πρόσβαση
στο
o3.
Η ισχύς
τέτοιων μοντέλων
βασίζεται στο ότι
φέρνουν μια εκδοχή των
«νόμων κλιμάκωσης» του
τομέα πιο κοντά στον
τελικό χρήστη. Μέχρι
τώρα, η πρόοδος στην
τεχνητή νοημοσύνη
βασιζόταν σε μεγαλύτερες
και καλύτερες εκτελέσεις
εκπαίδευσης, με
περισσότερα δεδομένα και
περισσότερη υπολογιστική
ισχύ για να δημιουργούν
περισσότερη νοημοσύνη.
Ωστόσο, μόλις ένα
μοντέλο είχε
εκπαιδευτεί, ήταν
δύσκολο η επιπλέον
επεξεργαστική ισχύς να
χρησιμοποιηθεί σωστά.
Όπως δείχνει η επιτυχία
του
o3
στην πρόκληση δοκιμασία
ARC,
αυτό πλέον δεν ισχύει.
Οι νόμοι κλιμάκωσης
φαίνεται να έχουν
μετακινηθεί από την
εκπαίδευση των μοντέλων
στην εξαγωγή
συμπερασμάτων.
Αυτή η
εξέλιξη αλλάζει τα
οικονομικά δεδομένα που
αντιμετωπίζουν οι
κατασκευαστές μοντέλων,
όπως η
OpenAI.
Η εξάρτηση των νέων
μοντέλων από περισσότερη
επεξεργαστική ισχύ
ενισχύει τους
προμηθευτές τους, όπως η
Nvidia,
κατασκευάστρια
εξειδικευμένων τσιπ
τεχνητής νοημοσύνης.
Ωφελεί επίσης τους
διανομείς των μοντέλων
τεχνητής νοημοσύνης,
ιδίως τους παρόχους
υπηρεσιών
cloud
όπως η
Amazon,
η
Microsoft
και η
Alphabet
(μητρική εταιρεία της
Google).
Επιπλέον μπορεί να
βοηθήσει να
δικαιολογηθούν οι
περιουσίες που αυτοί οι
τεχνολογικοί γίγαντες
έχουν επενδύσει σε
κέντρα δεδομένων, επειδή
η περισσότερη εξαγωγή
συμπερασμάτων θα
χρειαστεί περισσότερη
υπολογιστική ισχύ. Η
OpenAI
θα πιεστεί και από τις
δύο πλευρές.
Στη
συνέχεια, υπάρχει και ο
ανταγωνισμός. Η
Google
κυκλοφόρησε το δικό της
συλλογιστικό μοντέλο, το
Gemini
2.0
Flash,
και άλλες εταιρείες
τεχνολογίας πιθανώς να
κάνουν το ίδιο. Τα
μοντέλα ανοικτού κώδικα
αναμένεται να
ακολουθήσουν. Οι πελάτες
θα μπορούν να αντλούν
από πολλαπλά μοντέλα
διαφορετικών παρόχων.
Παρόλο που τα μοντέλα
δημιουργικής τεχνητής
νοημοσύνης μπορεί να
βελτιώνονται λίγο μέσω
των αλληλεπιδράσεων με
τους πελάτες, δεν έχουν
αληθινά δικτυακά
αποτελέσματα (όπου η
υπηρεσία γίνεται πολύ
καλύτερη
όσο
περισσότερους χρήστες
έχει), σε αντίθεση με τα
προϊόντα που έφτιαξαν η
Google
και το
Facebook
στο παρελθόν.
Το υψηλό
οριακό κόστος σημαίνει
ότι οι κατασκευαστές
μοντέλων προκειμένου να
χρεώνουν υψηλές τιμές θα
πρέπει να δημιουργήσουν
ουσιαστική αξία. Η
ελπίδα, λέει ο
Lan
Guan
της εταιρείας συμβούλων
Accenture,
είναι ότι μοντέλα όπως
το
o3
θα υποστηρίξουν
πράκτορες τεχνητής
νοημοσύνης που θα
χρησιμοποιούν άτομα και
εταιρείες για να
αυξήσουν την
παραγωγικότητά τους.
Ακόμα και μια υψηλή τιμή
για τη χρήση ενός
συλλογιστικού μοντέλου
μπορεί να αξίζει τον
κόπο σε σύγκριση με το
κόστος πρόσληψης, ας
πούμε, ενός εξαιρετικού
διδάκτορα μαθηματικών.
Βέβαια αυτό εξαρτάται
από το πόσο χρήσιμα
είναι τα μοντέλα.
Οι
διαφορετικές περιπτώσεις
χρήσης μπορεί επίσης να
οδηγήσουν σε μεγαλύτερο
κατακερματισμό. Ο
Jeremy
Schneider
της
McKinsey,
μιας συμβουλευτικής
εταιρείας, λέει ότι η
παροχή υπηρεσιών
τεχνητής νοημοσύνης σε
εταιρικούς πελάτες θα
απαιτήσει μοντέλα που θα
είναι εξειδικευμένα για
τις ανάγκες της κάθε
επιχείρησης και όχι
μοντέλα γενικής χρήσης
όπως το
ChatGPT.
Αντί να
κυριαρχείται από μία
επιχείρηση, ορισμένοι
αναμένουν ότι η
κατασκευή μοντέλων θα
μοιάζει περισσότερο με
ένα παραδοσιακό
ολιγοπώλιο, με υψηλούς
φραγμούς εισόδου αλλά
χωρίς ασφυκτικά ή
μονοπωλιακά κέρδη. Προς
το παρόν, η
OpenAI
είναι η ηγέτιδα, αλλά
μία από τις κύριες
αντιπάλους της, η
Anthropic,
φέρεται να συγκεντρώνει
χρήματα με αποτίμηση 60
δισ. δολάρια, και η
xAI,
η οποία ανήκει κατά
πλειοψηφία στον
Elon
Musk,
αξίζει 45 δισ. δολάρια.
Αυτά υποδηλώνουν ότι κι
αυτές έχουν πολλές
ελπίδες επιτυχίας. Με το
o3
η
OpenAI
απέδειξε την τεχνική της
υπεροχή, αλλά το
επιχειρηματικό της
μοντέλο παραμένει
αδοκίμαστο.
Πηγή: The Economist
|