Ο κινεζικός τεχνολογικός γίγαντας Tencent έκανε ένα σημαντικό βήμα προόδου στη δημιουργία περιεχομένου με τεχνητή νοημοσύνη, κυκλοφορώντας το Hunyuan-3D World Model 1.0. Αυτό το πρωτοποριακό εργαλείο AI, το οποίο είναι πλέον ανοιχτού κώδικα, μπορεί να δημιουργήσει καθηλωτικούς, εξερευνήσιμους και διαδραστικούς τρισδιάστατους κόσμους από μία μόνο πρόταση ή εικόνα.
Το μοντέλο αντιμετωπίζει μια θεμελιώδη πρόκληση στα γραφικά υπολογιστών: τη δημιουργία συνεκτικών και διαδραστικών τρισδιάστατων περιβαλλόντων. Παραδοσιακά, οι μέθοδοι είτε βασίζονταν σε βίντεο, το οποίο δεν είχε τρισδιάστατη συνέπεια, είτε σε τρισδιάστατες μεθόδους που περιορίζονταν από τα δεδομένα εκπαίδευσης. Το Hunyuan-3D συνδυάζει τις καλύτερες πτυχές και των δύο, χρησιμοποιώντας πανοραμικές εικόνες ως ενδιάμεσο για τη δημιουργία καθηλωτικών εμπειριών 360°. Μία από τις πιο αξιοσημείωτες δυνατότητές του είναι η δυνατότητα εξαγωγής πλεγμάτων (mesh), καθιστώντας τα παραγόμενα στοιχεία άμεσα συμβατά με δημοφιλείς μηχανές παιχνιδιών και λογισμικό μοντελοποίησης.
Η αρχιτεκτονική του Hunyuan-3D είναι πολυεπίπεδη. Ξεκινά μετατρέποντας το κείμενο ή την εικόνα εισόδου σε μια πλήρη πανοραμική εικόνα 360°. Στη συνέχεια, χρησιμοποιεί μια διαδικασία που ονομάζεται «agentic world layering» για να αποσυνθέσει αυτόματα την πανοραμική εικόνα σε σημασιολογικά στρώματα, διαχωρίζοντας αντικείμενα όπως δέντρα, κτίρια και το έδαφος. Αυτή η προσέγγιση επιτρέπει αποσυνδεδεμένες αναπαραστάσεις αντικειμένων και αυξημένη διαδραστικότητα. Το αποτέλεσμα είναι ένας δομημένος, εξερευνήσιμος κόσμος και όχι ένα στατικό περιβάλλον.
Οι εφαρμογές για το Hunyuan-3D είναι ευρείες. Μπορεί να χρησιμοποιηθεί στην εικονική πραγματικότητα (VR), τη δημιουργία ψηφιακού περιεχομένου και την ανάπτυξη παιχνιδιών. Οι προγραμματιστές μπορούν να επιταχύνουν σημαντικά τις ροές εργασίας τους δημιουργώντας γρήγορα πολύπλοκα περιβάλλοντα και στοιχεία. Τα παραγόμενα πλέγματα μπορούν να εισαχθούν απευθείας σε πλατφόρμες όπως το Unity και το Unreal Engine. Καθιστώντας το μοντέλο ανοιχτού κώδικα, η Tencent στοχεύει να προωθήσει τη συνεργασία μεταξύ προγραμματιστών και ενθουσιωδών, επιταχύνοντας περαιτέρω την καινοτομία στη δημιουργία τρισδιάστατου περιεχομένου με τεχνητή νοημοσύνη. Η εταιρεία έχει επίσης κυκλοφορήσει άλλα σχετικά εργαλεία, όπως το Hunyuan3D-PolyGen, για τη βελτίωση της απόδοσης της τρισδιάστατης μοντελοποίησης.