«Το
Qwen
2.5-Max
ξεπερνάει ... σχεδόν σε
όλα τα
GPT-4o,
DeepSeek-V3
και
Llama-3.1-405B»,
αναφέρει η μονάδα
cloud
της
Alibaba
σε ανακοίνωσή της την
οποία ανήρτησε στον
επίσημο λογαριασμό της
στο
WeChat,
αναφερόμενη στα πιο
εξελιγμένα μοντέλα
τεχνητής νοημοσύνης
ανοικτού κώδικα.
Η
παρουσίαση στις 10
Ιανουαρίου του βοηθού
τεχνητής νοημοσύνης της
DeepSeek,
με βάση το μοντέλο
DeepSeek-V3,
καθώς και η παρουσίαση
στις 20 Ιανουαρίου του
μοντέλου της
R1,
προκάλεσε σοκ στην
Σίλικον Βάλεϊ και έριξε
τις μετοχές των
τεχνολογικών εταιρειών,
καθώς τα χαμηλά κόστη
ανάπτυξης και χρήσης της
κινεζικής
startup
έκαναν τους επενδυτές να
αμφισβητήσουν τα σχέδια
για τεράστιες δαπάνες
από τις κορυφαίες
εταιρείες τεχνητής
νοημοσύνης στις ΗΠΑ.
Ωστόσο η
επιτυχία της
DeepSeek
έκανε επίσης τους
εγχώριους ανταγωνιστές
της να αναβαθμίσουν τα
δικά τους μοντέλα
τεχνητής νοημοσύνης.
Δύο
ημέρες μετά την
παρουσίαση του
DeepSeek-R1,
η ιδιοκτήτρια του
TikTok,
η
ByteDance,
παρουσίασε μια
επικαιροποίηση του δικού
της βασικού μοντέλου
τεχνητής νοημοσύνης, για
το οποίο ισχυρίστηκε πως
έχει καλύτερες επιδόσεις
από το υποστηριζόμενο
από τη
Microsoft
o1
της
OpenAI
στο
AIME,
ένα τεστ που μετράει
πόσο καλά τα μοντέλα
τεχνητής νοημοσύνης
κατανοούν περίπλοκες
οδηγίες και
ανταποκρίνονται σ'
αυτές.
Αυτό
απηχεί τον ισχυρισμό της
DeepSeek
ότι το μοντέλο της
R1
υπερτερεί σε αρκετά
κριτήρια απόδοσης του
o1
της
OpenAI.
|