Η OpenAI κυκλοφορεί νέα μοντέλα Reasoning Open Source

Η OpenAI ανακοίνωσε την κυκλοφορία δύο νέων, προηγμένων γλωσσικών μοντέλων ανοιχτού βάρους, τα gpt-oss-120b και gpt-oss-20b, σηματοδοτώντας μια σημαντική αλλαγή στη στρατηγική της εταιρείας. Αυτή η κίνηση έρχεται περισσότερα από πέντε χρόνια μετά την τελευταία κυκλοφορία μοντέλου ανοιχτής γλώσσας, το GPT-2, και τοποθετεί την OpenAI σε πιο άμεσο ανταγωνισμό με ηγέτες του ανοιχτού κώδικα όπως η Meta και η Mistral AI.

Τα νέα μοντέλα έχουν σχεδιαστεί για να προωθήσουν τα όρια της συλλογιστικής στην τεχνητή νοημοσύνη ανοιχτού κώδικα, παρέχοντας ισχυρά εργαλεία για προγραμματιστές και ερευνητές. Τα μοντέλα διατίθενται υπό την ευέλικτη άδεια Apache 2.0, επιτρέποντας την ελεύθερη χρήση, τροποποίηση και εμπορική ανάπτυξη. Ο Διευθύνων Σύμβουλος της OpenAI, Sam Altman, περιέγραψε την κυκλοφορία ως μια προσπάθεια «να φτάσει η τεχνητή νοημοσύνη στα χέρια όσο το δυνατόν περισσότερων ανθρώπων», τονίζοντας τη δέσμευση της εταιρείας στον εκδημοκρατισμό της καινοτομίας στην ΤΝ.

Τα δύο μοντέλα διαφέρουν σε μέγεθος και απαιτήσεις υλικού. Το gpt-oss-120b, με 117 δισεκατομμύρια παραμέτρους, μπορεί να εκτελεστεί σε μία μόνο GPU της Nvidia, ενώ το ελαφρύτερο μοντέλο gpt-oss-20b είναι βελτιστοποιημένο για καταναλωτικούς φορητούς υπολογιστές με 16GB μνήμης. Αυτή η προσβασιμότητα καθιστά τα μοντέλα κατάλληλα για πρακτικές εφαρμογές σε πραγματικές συνθήκες. Και τα δύο μοντέλα χρησιμοποιούν αρχιτεκτονική Mixture-of-Experts (MoE) και ένα σχήμα κβαντισμού 4-bit για γρήγορη εξαγωγή συμπερασμάτων με χαμηλή χρήση πόρων.

Σύμφωνα με την OpenAI, τα μοντέλα gpt-oss εκπαιδεύτηκαν χρησιμοποιώντας ένα μείγμα ενισχυτικής μάθησης και τεχνικών που προέρχονται από τα πιο προηγμένα εσωτερικά μοντέλα της OpenAI. Είναι σχεδιασμένα για να υπερέχουν σε εργασίες που απαιτούν συλλογισμό, να επιδεικνύουν ισχυρές δυνατότητες χρήσης εργαλείων και να είναι βελτιστοποιημένα για αποδοτική ανάπτυξη σε καταναλωτικό υλικό. Η Nvidia συνεργάστηκε με την OpenAI σε αυτά τα ανοιχτά μοντέλα, τα οποία εκπαιδεύτηκαν σε GPUs Nvidia H100.

Παρά τον χαρακτηρισμό «ανοιχτού βάρους», τα μοντέλα δεν είναι πλήρως διαφανή. Κρίσιμα στοιχεία, όπως οι μηχανισμοί δρομολόγησης και οι μέθοδοι εκπαίδευσης, παραμένουν απόρρητα. Αυτή η προσέγγιση επιτρέπει στην OpenAI να παρέχει ένα χρήσιμο εργαλείο στην κοινότητα, προστατεύοντας παράλληλα την πολύτιμη πνευματική της ιδιοκτησία. Η κυκλοφορία θεωρείται ένα σημαντικό βήμα στη δέσμευση της εταιρείας στο οικοσύστημα ανοιχτού κώδικα και στην αποστολή της να διασφαλίσει ότι η τεχνητή νοημοσύνη ωφελεί όλη την ανθρωπότητα.