Η κινεζική εταιρεία Alibaba παρουσίασε το νέο της μοντέλο τεχνητής νοημοσύνης, το Qwen 2.5-Max, το οποίο, σύμφωνα με την εταιρεία, υπερτερεί σε απόδοση των DeepSeek-V3, GPT-4o και Llama-3.1-405B. Η ανακοίνωση έγινε την πρώτη μέρα του Σεληνιακού Νέου Έτους, υπογραμμίζοντας την πίεση που έχει προκαλέσει η ραγδαία άνοδος της DeepSeek.
Η DeepSeek, μια κινεζική startup τεχνητής νοημοσύνης, κυκλοφόρησε το μοντέλο R1 στις 20 Ιανουαρίου 2025, προκαλώντας αναταραχή στην αγορά. Το R1, το οποίο είναι ανοιχτού κώδικα, επιτυγχάνει απόδοση συγκρίσιμη με τα κορυφαία μοντέλα της OpenAI, χρησιμοποιώντας λιγότερους πόρους και χαμηλότερο κόστος. Μετά την κυκλοφορία του, η εφαρμογή της DeepSeek έγινε η πιο κατεβασμένη στο App Store της Apple, οδηγώντας σε μαζικές πωλήσεις μετοχών τεχνολογίας και προκαλώντας ανησυχίες στη Silicon Valley.
Η επιτυχία της DeepSeek δεν πέρασε απαρατήρητη από τον ανταγωνισμό. Η ByteDance, η εταιρεία πίσω από το TikTok, αναβάθμισε το δικό της μοντέλο τεχνητής νοημοσύνης, ισχυριζόμενη ότι υπερτερεί του o1 της OpenAI στο AIME test, μια δοκιμή κατανόησης περίπλοκων οδηγιών.
Η μάχη για την κυριαρχία στην τεχνητή νοημοσύνη εντείνεται, με την Κίνα να δείχνει αποφασισμένη να αλλάξει τις ισορροπίες. Η ανάπτυξη μοντέλων όπως το Qwen 2.5-Max της Alibaba και το R1 της DeepSeek υπογραμμίζει την ταχεία πρόοδο της Κίνας στον τομέα της τεχνητής νοημοσύνης και την πρόθεσή της να ανταγωνιστεί τις δυτικές εταιρείες τεχνολογίας.