Tencent представляет Hunyuan3D 2.0, искусственный интеллект, который ускоряет 3D-проектирование с дней до секунд

Лента новостей

Подпишитесь на наши ежедневные и еженедельные информационные бюллетени, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли технологиях искусственного интеллекта. Узнать больше


Тенсент обнародовал «Хунюань3D 2.0», — система искусственного интеллекта, которая за считанные секунды превращает отдельные изображения или текстовые описания в подробные 3D-модели. Система превращает обычно длительный процесс, который может занять у опытных художников дни или недели, в быструю автоматизированную задачу.

Вслед за своей предшественницей, эта новая версия модели доступна как проект с открытым исходным кодом на обеих платформах. Обнимающее лицо и GitHubделая технологию немедленно доступной разработчикам и исследователям по всему миру.

«Создание высококачественных 3D-ресурсов — это трудоемкий процесс для художников, поэтому автоматическая генерация становится долгосрочной целью для исследователей», — пишет исследовательская группа компании в отчете. технический отчет. Модернизированная система построена на основе своей предшественницы, но при этом значительно улучшена в скорости и качестве.

Как Hunyuan3D 2.0 превращает изображения в 3D-модели

Hunyuan3D 2.0 использует два основных компонента: Хунюань3D-ДиТ создает базовую форму, в то время как Хунюань3D-Paint добавляет детали поверхности. Сначала система создает несколько 2D-видов объекта, а затем объединяет их в полную 3D-модель. Новая система наведения обеспечивает совпадение всех представлений объекта, что решает распространенную проблему в 3D-моделях, создаваемых искусственным интеллектом.

«Мы размещаем камеры на определенной высоте, чтобы захватить максимальную видимую область каждого объекта», — объясняют исследователи. Этот подход в сочетании с методом смешивания различных точек зрения помогает системе улавливать детали, которые часто упускают другие модели, особенно сверху и снизу объектов.

Tencent представляет Hunyuan3D 2.0, искусственный интеллект, который ускоряет 3D-проектирование с дней до секунд
Диаграмма, показывающая, как Hunyuan3D 2.0 преобразует одно изображение панды в трехмерную модель с помощью методов многоракурсной диффузии и реконструкции с разреженным представлением. (Фото: arxiv.org)

Быстрее и точнее: что отличает Hunyuan3D 2.0

Технические результаты впечатляют. Согласно стандартным отраслевым измерениям, Hunyuan3D 2.0 создает более точные и визуально привлекательные модели, чем существующие системы. Стандартная версия создает полную 3D-модель примерно за 25 секунд, а меньшая и более быстрая версия работает всего за 10 секунд.

ЧИТАТЬ  Почему ваша собака трясется? 8 причин от стресса до серьезных заболеваний. Что делать, если вашу собаку трясет?

Что отличает Hunyuan3D 2.0, так это его способность обрабатывать как текстовые, так и графические входные данные, что делает его более универсальным, чем предыдущие решения. В системе также представлены инновационные функции, такие как «адаптивное руководство без классификаторов» и «гибридные входные данные», которые помогают обеспечить согласованность и детализацию создаваемых 3D-моделей.

Согласно опубликованным тестам, Hunyuan3D 2.0 достигает Оценка CLIP 0,809, что превосходит как открытые, так и проприетарные альтернативы. Эта технология обеспечивает значительные улучшения в синтезе текстур и геометрической точности, превосходя существующие решения по всем стандартным отраслевым показателям.

Ключевым техническим достижением системы является ее способность создавать модели высокого разрешения, не требуя огромных вычислительных мощностей. Команда разработала новый способ повышения детализации, сохраняя при этом управляемость требований к обработке — частое ограничение других систем 3D-ИИ.

Эти достижения имеют значение для многих отраслей. Разработчики игр могут быстро создавать тестовые версии персонажей и окружения. Интернет-магазины смогут показывать товары в 3D. Киностудии могли бы более эффективно просматривать спецэффекты.

Tencent поделилась почти всеми частями своей системы через Hugging Face. Теперь разработчики могут использовать этот код для создания 3D-моделей, которые работают со стандартным программным обеспечением для проектирования, что делает его практичным для немедленного использования в профессиональных условиях.

Хотя эта технология знаменует собой значительный шаг вперед в автоматизированном создании 3D, она поднимает вопросы о том, как художники будут работать в будущем. Tencent рассматривает Hunyuan3D 2.0 не как замену художникам-людям, а как инструмент, который решает технические задачи, в то время как создатели сосредотачиваются на художественных решениях.

Поскольку 3D-контент становится все более важным в играх, покупках и развлечениях, такие инструменты, как Hunyuan3D 2.0, предлагают будущее, в котором создавать виртуальные миры так же просто, как и описывать их. Предстоящей задачей может быть не создание 3D-моделей, а решение, что с ними делать.


Source
Оцените статью
( Пока оценок нет )
Строительство. Ремонт. Садоводство