Китайская компания Tencent представила первую в отрасли открытую модель искусственного интеллекта, способную генерировать интерактивные 3D-миры на основе текстового описания или статического изображения. Речь идёт об алгоритме Hunyuan 3D World Model 1.0, который создаёт 360-градусные сцены, подходящие для использования в приложениях виртуальной реальности, а также при создании цифрового контента и разработке игр.
Отмечается, что созданные с помощью Hunyuan 3D-миры можно экспортировать в формате 3D-сетки, а затем импортировать в популярные игровые движки и программное обеспечение для моделирования, чтобы использовать их при разработке игр. Некоторые пользователи соцсети X уже успели опробовать алгоритм в деле и опубликовали свои работы, демонстрирующие различные стили, детализированные текстуры и возможность ограниченного перемещения в центре сцены.
Генерируемые пользователями 3D-миры соответствуют тому, что ранее публиковала сама Tencent. Так, один пользователь сгенерировал полностью исследуемую 360-градусную сцену по простой текстовой подсказке: «Лесной пожар угрожает маленькому городку на Аляске в засушливый летний день». Вся сцена выполнена в классическом игровом стиле. Другой пользователь создал трёхмерный мир, словно сошедший со страниц сказки.
Учитывая трёхмерную природу объектов, создаваемых с помощью Hunyuan, алгоритм можно использовать для разработки контента, адаптированного под устройства виртуальной реальности — такие как Apple Vision Pro и Meta✴ Quest. Модель доступна для ознакомления на официальном сайте Tencent, а также размещена на платформах Hugging Face и GitHub.