Ενημερωτικό Portal του Ράδιο Γάμμα 94 FM, Πάτρα
 

Στην Xiaomi ανήκει το «μυστηριώδες» πρόγραμμα τεχνητής νοημοσύνης υψηλών επιδόσεων

Ένα ισχυρό μοντέλο τεχνητής νοημοσύνης που εμφανίστηκε ανώνυμα σε μια πλατφόρμα προγραμματιστών την περασμένη εβδομάδα αποκαλύφθηκε ότι προέρχεται από τον κινεζικό γίγαντα smartphone και ηλεκτρικών οχημάτων Xiaomi αφού προκάλεσε εικασίες ότι η νεοφυής DeepSeek δοκίμαζε διακριτικά το επόμενο σύστημά της πριν από την επίσημη κυκλοφορία.

Η κυκλοφορία των χαμηλού κόστους μοντέλων DeepSeek-V3 και R1 από τη DeepSeek προκάλεσε πέρυσι παγκόσμια πτώση στις μετοχές τεχνολογίας, κάνοντας τους επενδυτές να αναρωτηθούν αν οι αμερικανικές εταιρείες χρειάζεται να δαπανούν δισεκατομμύρια δολάρια για υπολογιστική ισχύ AI.

 

Έκτοτε υπάρχει έντονο ενδιαφέρον για το DeepSeek-V4, ένα μοντέλο επόμενης γενιάς που δεν έχει ακόμη κυκλοφορήσει. Το μυστηριώδες δωρεάν μοντέλο με την ονομασία Hunter Alpha εμφανίστηκε στην πλατφόρμα OpenRouter στις 11 Μαρτίου χωρίς καμία αναφορά δημιουργού και αργότερα χαρακτηρίστηκε ως «stealth model».

Η ομάδα AI της Xiaomi, MiMo, υπό την ηγεσία της ερευνήτριας Λούο Φούλι (πρώην μέλος της DeepSeek) δήλωσε την Τετάρτη ότι το Hunter Alpha ήταν μια «πρώιμη εσωτερική δοκιμαστική έκδοση του MiMo-V2-Pro», ενός μοντέλου σχεδιασμένου να λειτουργεί ως «εγκέφαλος» για AI agents — εργαλεία που επιτρέπουν στους χρήστες να εκτελούν πολύπλοκες εργασίες με λιγότερη ανθρώπινη καθοδήγηση σε σχέση με ένα chatbot.

Η κίνηση της Xiaomi έρχεται σε μια περίοδο όπου το OpenClaw, ένα framework ανοιχτού κώδικα για agents, υιοθετείται ραγδαία από χρήστες στην Κίνα. «Το αποκαλώ μια σιωπηλή ενέδρα όχι επειδή το σχεδιάσαμε, αλλά επειδή η μετάβαση από το μοντέλο συνομιλίας (chat) στο μοντέλο agents έγινε τόσο γρήγορα που ακόμη κι εμείς δυσκολευτήκαμε να το πιστέψουμε. Οι άνθρωποι ρωτούν γιατί κινούμαστε τόσο γρήγορα. Το είδα από πρώτο χέρι χτίζοντας το DeepSeek R1» έγραψε η Λούο σε ανάρτηση στο X.

Το chatbot Hunter Alpha περιέγραψε τον εαυτό του ως «κινεζικό μοντέλο AI που έχει εκπαιδευτεί κυρίως στα κινεζικά» και ανέφερε ότι τα δεδομένα του φτάνουν έως τον Μάιο του 2025, το ίδιο χρονικό όριο γνώσης που έχει αναφερθεί και για το chatbot της DeepSeek.

Όταν ρωτήθηκε για τον δημιουργό του, ωστόσο, αρνήθηκε να τον αποκαλύψει, λέγοντας: «Γνωρίζω μόνο το όνομά μου, το μέγεθος των παραμέτρων μου και το μήκος του παραθύρου συμφραζομένων μου». Στη σελίδα του το Hunter Alpha περιγράφεται ως μοντέλο με ένα τρισεκατομμύριο παραμέτρους δηλαδή εκπαιδεύτηκε με περίπου ένα τρισεκατομμύριο ρυθμιζόμενες τιμές που καθορίζουν τον τρόπο με τον οποίο επεξεργάζεται τη γλώσσα και παράγει απαντήσεις.

Διαθέτει επίσης παράθυρο συμφραζομένων έως και ένα εκατομμύριο tokens, δηλαδή την ποσότητα κειμένου που μπορεί να επεξεργαστεί ή να «θυμάται» σε μία αλληλεπίδραση. «Αυτό που ξεχώρισε ήταν ο συνδυασμός του παραθύρου ενός εκατομμυρίου tokens με δυνατότητες λογικής και δωρεάν πρόσβαση», δήλωσε ο μηχανικός AI agents Nabil Haouam.

«Τα περισσότερα κορυφαία μοντέλα με τέτοιο παράθυρο έχουν σημαντικό κόστος σε μεγάλη κλίμακα», πρόσθεσε. Αυτά τα χαρακτηριστικά μοιάζουν με όσα αναμένονται για το επόμενο μοντέλο V4 της DeepSeek, το οποίο σύμφωνα με κινεζικά μέσα ενδέχεται να κυκλοφορήσει ήδη από τον Απρίλιο.

Μοιραστείτε το άρθρο
Χωρίς σχόλια

Αφήστε ένα σχόλιο