Το τελευταίο μοντέλο της OpenAI θα αλλάξει τα οικονομικά του λογισμικού

Τετάρτη, 00:01 - 29/01/2025

Όταν, λίγες ημέρες πριν από τα Χριστούγεννα, η OpenAI ανακοίνωσε ένα νέο μοντέλο δημιουργικής τεχνητής νοημοσύνης (AI), το o3, προκάλεσε ενθουσιασμό αλλά και σκεπτικισμό. Ενθουσιασμό για όσους περίμεναν ότι οι ικανότητες συλλογισμού του θα αποτελούσαν ένα μεγάλο βήμα προς την υπεράνθρωπη νοημοσύνη (κάποιοι υπολόγιζαν ότι θα ήταν κάτι πολύ μεγαλύτερο από την παρουσίαση του ChatGPT από την OpenAI το 2022). Σκεπτικισμό επειδή η OpenAI δεν το έδωσε το κυκλοφόρησε και υπερτόνισε με κάθε τρόπο τον πρωτοποριακό ρόλο της εταιρείας στην τεχνητή νοημοσύνη για να κερδίσει την εύνοια του Donald Trump, του επερχόμενου προέδρου.

Ωστόσο, από τότε προέκυψε ένα σημείο συναίνεσης. Το μοντέλο, όπως και ο προκάτοχός του, το o1 (το o2 παραλείφθηκε επειδή είναι το όνομα ενός ευρωπαϊκού δικτύου κινητής τηλεφωνίας), παράγει καλύτερα αποτελέσματα όσο περισσότερο «σκέφτεται» σε απάντηση μιας προτροπής. Περισσότερη σκέψη σημαίνει περισσότερη υπολογιστική ισχύ – και υψηλότερο κόστος ανά ερώτημα. Με άλλα λόγια, μια μεγάλη αλλαγή συντελείται στα οικονομικά της ψηφιακής οικονομίας, η οποία βασίστηκε στην παροχή φθηνών υπηρεσιών σε μεγάλο αριθμό ανθρώπων με χαμηλό οριακό κόστος, χάρη στη δωρεάν διανομή στο διαδίκτυο. Κάθε φορά που τα μοντέλα γίνονται ακριβότερα για την υποβολή ερωτημάτων, η εποχή του μηδενικού οριακού κόστους μένει όλο και πιο πίσω.

Οι επενδυτές θεωρούν την OpenAI την αγαπημένη της τεχνολογίας: σύμφωνα με μια πρόσφατη αύξηση κεφαλαίου, αξίζει 157 δισ. δολάρια. Ελπίζουν ότι χάρη στην επιτυχία προϊόντων όπως το ChatGPT, θα γίνει ο επόμενος τεχνολογικός γίγαντας του 1 τρισ. δολαρίων. Ωστόσο, το υψηλότερο κόστος των μοντέλων τελευταίας τεχνολογίας, καθώς και άλλες πιέσεις από προμηθευτές, διανομείς και ανταγωνιστές, υποδηλώνουν ότι η κατασκευή μοντέλων μπορεί να μην προσδώσει το είδος των μονοπωλιακών εξουσιών που απολαμβάνουν οι τεχνολογικοί γίγαντες. «Κάτι πολύ σημαντικό που πρέπει να κατανοήσουμε για το μέλλον: τα οικονομικά της τεχνητής νοημοσύνης πρόκειται να αλλάξουν εντελώς», δήλωσε ο François Chollet, ένας βετεράνος ερευνητής τεχνητής νοημοσύνης, στον ιστότοπο κοινωνικής δικτύωσης X, την ημέρα που δημοσιοποιήθηκε το o3.

Ο κ. Chollet συνέβαλε στην αύξηση του ενθουσιασμού για το o3. Τον Ιούνιο προκήρυξε ένα βραβείο ύψους 1 εκατ. δολαρίων για μοντέλα που θα μπορούσαν να τρέξουν σε μια δοκιμασία που είχε δημιουργήσει πέντε χρόνια νωρίτερα και ονομάζεται “Abstraction and Reasoning Corpus”, ή ARC. Πρόκειται για ένα σύνολο απλών παζλ οπτικής συλλογιστικής (βλ. εικόνα) που έχουν ως στόχο να είναι «εύκολα για τους ανθρώπους και αδύνατα για τη σύγχρονη τεχνητή νοημοσύνη». (Το εύκολο είναι σχετικό – σε μια μελέτη του Σεπτεμβρίου, οι άνθρωποι που προσλήφθηκαν μέσω διαδικτύου σημείωσαν 60-70% επιτυχία στο τεστ). Το βραβείο δεν ήταν απλώς πρόκληση αυτή καθ’ αυτή. Ο κ. Chollet δήλωσε ότι το να νικήσει κανείς σε μια δοκιμασία ARC ήταν ένα «κρίσιμο» βήμα προς την οικοδόμηση γενικής τεχνητής νοημοσύνης, δηλαδή μηχανών που θα νικούσαν τους ανθρώπους σε πολλές εργασίες.

Έξι μήνες αργότερα, η OpenAI πέτυχε στο τεστ. Το μοντέλο της o3 πέτυχε μια επαναστατική βαθμολογία 91,5%. Η επιτυχία της στην πρόκληση έδειξε μια βαθμιαία αλλαγή στην ικανότητα της τεχνητής νοημοσύνης να προσαρμόζεται σε νέα καθήκοντα, δήλωσε ο κ. Chollet. Το νέο μοντέλο δεν είναι απλώς καλύτερο, είναι διαφορετικό. Όπως και το o1, χρησιμοποιεί μια προσέγγιση «test-time compute» που σημαίνει ότι όσο περισσότερο χρόνο δαπανάει στην εξαγωγή συμπερασμάτων (όταν ένα εκπαιδευμένο μοντέλο τεχνητής νοημοσύνης απαντά σε ερωτήματα) τόσο καλύτερα αποτελέσματα παράγει. Αντί να παράγει

απλώς μια απάντηση όσο πιο γρήγορα μπορεί, το o3 είναι κατασκευασμένο να σκέφτεται περισσότερο την ερώτηση.

Σε αυτό ακριβώς το σημείο προκύπτει και το υψηλότερο κόστος. Ο κ. Chollet έθεσε όριο 10.000 δολαρίων στο ποσό που μπορούν να δαπανήσουν οι διαγωνιζόμενοι για υπολογιστική ισχύ για να απαντήσουν στις 400 ερωτήσεις της πρόκλησής του. Όταν η OpenAI υπέβαλε ένα μοντέλο κάτω από το όριο, δαπάνησε 6.677 δολάρια (περίπου 17 δολάρια ανά ερώτηση) για να επιτύχει βαθμολογία 82,8%. Η βαθμολογία του 91,5%, που πέτυχε το o3, προήλθε από την εκτόξευση του προϋπολογισμού. Η εταιρεία δεν αποκάλυψε το ποσό που δαπανήθηκε, αλλά δήλωσε ότι η ακριβή εκδοχή της διαδικασίας χρησιμοποίησε 172 φορές περισσότερο «υπολογισμό» από ό,τι η φθηνότερη προσέγγιση – γεγονός που υποδηλώνει περίπου 3.000 δολάρια για την επίλυση ενός μόνο ερωτήματος που ένας άνθρωπος χρειάζεται δευτερόλεπτα.

Σίγουρα, τα προηγούμενα μοντέλα τεχνητής νοημοσύνης έχουν ήδη αμφισβητήσει τον κανόνα του χαμηλού οριακού κόστους της βιομηχανίας λογισμικού, επειδή η απάντηση σε ερωτήματα απαιτούσε σημαντικά περισσότερη επεξεργαστική ισχύ από ό,τι η χρήση ισοδύναμων εργαλείων όπως μια μηχανή αναζήτησης. Όμως το κόστος της κατασκευής μεγάλων γλωσσικών μοντέλων και της λειτουργίας τους ήταν αρκετά μικρό σε απόλυτους όρους, ώστε η OpenAI να μπορεί ακόμα να δίνει δωρεάν πρόσβαση.

Με τα τελευταία μοντέλα αυτό πλέον δεν ισχύει. Η OpenAI περιορίζει την έκδοση «pro» του μοντέλου o1 στους χρήστες της συνδρομητικής βαθμίδας των 200 δολαρίων το μήνα (και χάνει χρήματα, σύμφωνα με τον Sam Altman, το αφεντικό της, επειδή οι πελάτες ξοδεύουν περισσότερα για ερωτήματα από όσα είχε προϋπολογίσει η εταιρεία). Ο Pierre Ferragu της New Street Research, μιας εταιρείας αναλυτών, εκτιμά ότι η OpenAI μπορεί να χρεώνει έως και 2.000 δολάρια το μήνα για πλήρη πρόσβαση στο o3.

Η ισχύς τέτοιων μοντέλων βασίζεται στο ότι φέρνουν μια εκδοχή των «νόμων κλιμάκωσης» του τομέα πιο κοντά στον τελικό χρήστη. Μέχρι τώρα, η πρόοδος στην τεχνητή νοημοσύνη βασιζόταν σε μεγαλύτερες και καλύτερες εκτελέσεις εκπαίδευσης, με περισσότερα δεδομένα και περισσότερη υπολογιστική ισχύ για να δημιουργούν περισσότερη νοημοσύνη. Ωστόσο, μόλις ένα μοντέλο είχε εκπαιδευτεί, ήταν δύσκολο η επιπλέον επεξεργαστική ισχύς να χρησιμοποιηθεί σωστά. Όπως δείχνει η επιτυχία του o3 στην πρόκληση δοκιμασία ARC, αυτό πλέον δεν ισχύει. Οι νόμοι κλιμάκωσης φαίνεται να έχουν μετακινηθεί από την εκπαίδευση των μοντέλων στην εξαγωγή συμπερασμάτων.

Αυτή η εξέλιξη αλλάζει τα οικονομικά δεδομένα που αντιμετωπίζουν οι κατασκευαστές μοντέλων, όπως η OpenAI. Η εξάρτηση των νέων μοντέλων από περισσότερη επεξεργαστική ισχύ ενισχύει τους προμηθευτές τους, όπως η Nvidia, κατασκευάστρια εξειδικευμένων τσιπ τεχνητής νοημοσύνης. Ωφελεί επίσης τους διανομείς των μοντέλων τεχνητής νοημοσύνης, ιδίως τους παρόχους υπηρεσιών cloud όπως η Amazon, η Microsoft και η Alphabet (μητρική εταιρεία της Google). Επιπλέον μπορεί να βοηθήσει να δικαιολογηθούν οι περιουσίες που αυτοί οι τεχνολογικοί γίγαντες έχουν επενδύσει σε κέντρα δεδομένων, επειδή η περισσότερη εξαγωγή συμπερασμάτων θα χρειαστεί περισσότερη υπολογιστική ισχύ. Η OpenAI θα πιεστεί και από τις δύο πλευρές.

Στη συνέχεια, υπάρχει και ο ανταγωνισμός. Η Google κυκλοφόρησε το δικό της συλλογιστικό μοντέλο, το Gemini 2.0 Flash, και άλλες εταιρείες τεχνολογίας πιθανώς να κάνουν το ίδιο. Τα μοντέλα ανοικτού κώδικα αναμένεται να ακολουθήσουν. Οι πελάτες θα μπορούν να αντλούν από πολλαπλά μοντέλα διαφορετικών παρόχων. Παρόλο που τα μοντέλα δημιουργικής τεχνητής νοημοσύνης μπορεί να βελτιώνονται λίγο μέσω των αλληλεπιδράσεων με τους πελάτες, δεν έχουν αληθινά δικτυακά αποτελέσματα (όπου η υπηρεσία γίνεται πολύ καλύτερη

όσο περισσότερους χρήστες έχει), σε αντίθεση με τα προϊόντα που έφτιαξαν η Google και το Facebook στο παρελθόν.

Το υψηλό οριακό κόστος σημαίνει ότι οι κατασκευαστές μοντέλων προκειμένου να χρεώνουν υψηλές τιμές θα πρέπει να δημιουργήσουν ουσιαστική αξία. Η ελπίδα, λέει ο Lan Guan της εταιρείας συμβούλων Accenture, είναι ότι μοντέλα όπως το o3 θα υποστηρίξουν πράκτορες τεχνητής νοημοσύνης που θα χρησιμοποιούν άτομα και εταιρείες για να αυξήσουν την παραγωγικότητά τους. Ακόμα και μια υψηλή τιμή για τη χρήση ενός συλλογιστικού μοντέλου μπορεί να αξίζει τον κόπο σε σύγκριση με το κόστος πρόσληψης, ας πούμε, ενός εξαιρετικού διδάκτορα μαθηματικών. Βέβαια αυτό εξαρτάται από το πόσο χρήσιμα είναι τα μοντέλα.

Οι διαφορετικές περιπτώσεις χρήσης μπορεί επίσης να οδηγήσουν σε μεγαλύτερο κατακερματισμό. Ο Jeremy Schneider της McKinsey, μιας συμβουλευτικής εταιρείας, λέει ότι η παροχή υπηρεσιών τεχνητής νοημοσύνης σε εταιρικούς πελάτες θα απαιτήσει μοντέλα που θα είναι εξειδικευμένα για τις ανάγκες της κάθε επιχείρησης και όχι μοντέλα γενικής χρήσης όπως το ChatGPT.

Αντί να κυριαρχείται από μία επιχείρηση, ορισμένοι αναμένουν ότι η κατασκευή μοντέλων θα μοιάζει περισσότερο με ένα παραδοσιακό ολιγοπώλιο, με υψηλούς φραγμούς εισόδου αλλά χωρίς ασφυκτικά ή μονοπωλιακά κέρδη. Προς το παρόν, η OpenAI είναι η ηγέτιδα, αλλά μία από τις κύριες αντιπάλους της, η Anthropic, φέρεται να συγκεντρώνει χρήματα με αποτίμηση 60 δισ. δολάρια, και η xAI, η οποία ανήκει κατά πλειοψηφία στον Elon Musk, αξίζει 45 δισ. δολάρια. Αυτά υποδηλώνουν ότι κι αυτές έχουν πολλές ελπίδες επιτυχίας. Με το o3 η OpenAI απέδειξε την τεχνική της υπεροχή, αλλά το επιχειρηματικό της μοντέλο παραμένει αδοκίμαστο.

Πηγή: The Economist

Greek Finance Forum Team

Σχόλια Αναγνωστών

Αποποίηση Ευθύνης....