ИИ в настоящее время является мейнстримом и управляет беспрецедентным спросом на ИИ фабрики -Специальная инфраструктура, посвященная обучению и выводу искусственного интеллекта-и производству интеллекта.
Многие из этих фабрик ИИ будут Gigawatt-Scale. Привлечение одной фабрики Gigawatt AI является необычайным актом инженерии и логистики, требующей десятков тысяч работников поставщиков, архитекторов, подрядчиков и инженеров для строительства, доставки и сборки почти 5 миллиардов компонентов и более 210 000 миль волоконного кабеля.
Чтобы помочь спроектировать и оптимизировать эти фабрики ИИ, Nvidia сегодня представила на GTC а Nvidia Omniverse План дизайна и эксплуатации AI Factory.
Во время его GTC KeynoteОснователь и генеральный директор NVIDIA Дженсен Хуанг продемонстрировал, как команда инженерных центров обработки данных NVIDIA разработала приложение на Omniverse Blueprint для планирования, оптимизации и имитации фабрики AI 1 Gigawatt. Подключенные к ведущим инструментам моделирования, таким как Digital Twin Platform и ETAP, команды инженерных групп могут проверить и оптимизировать мощность, охлаждение и сетевые связи задолго до начала строительства.
https://www.youtube.com/watch?v=trc0z_qcze0
Инженерные заводы ИИ: подход-сначала симуляция
Проект NVIDIA Omniverse для проектирования и операций AI Factory использует библиотеки OpenUSD, которые позволяют разработчикам собирать 3D -данных из разрозненных источников, таких как само здание, Nvidia ускоренные вычислительные системы и единицы питания или охлаждения от таких поставщиков, как Schneider Electric и Vertiv.
Объединив проектирование и моделирование миллиардов компонентов, план помогает инженерам решать сложные задачи, такие как:
- Интеграция компонентов и оптимизация пространства — объединение дизайна и моделирования NVIDIA DGX SuperpodsСистемы GB300 NVL72 и их 5 миллиардов компонентов.
- Производительность и эффективность системы охлаждения — Использование Digital Twin платформы Cadence Reality, ускоренная Nvidia cuda и библиотеки Omniverse, чтобы имитировать и оценить гибридные растворы воздушного и жидкости от Vertiv и Schneider Electric.
- Распределение и надежность электроэнергии -Проектирование масштабируемых, избыточных электрических систем с ETAP для моделирования эффективности и надежности блока питания.
- Сетевая топология и логика -тонкая настройка инфраструктуры с высокой пропускной способностью с Nvidia Spectrum-X сеть и NVIDIA AIR платформа
Разрушение инженерных силосов с вспомогательностью
Одной из самых больших проблем в строительстве фабрики ИИ является то, что разные команды — мощность, охлаждение и сеть — работают в бункерах, что приводит к неэффективности и потенциальным сбоям.
Используя план, инженеры теперь могут:
- Сотрудничать в полном контексте — Многочисленные дисциплины могут переходить параллельно, разделяя живые симуляции, которые показывают, как изменения в одном домене влияют на другое.
- Оптимизировать использование энергии -Обновления симуляции в реальном времени позволяют командам найти наиболее эффективные проекты для рабочих нагрузок искусственного интеллекта.
- Устранить точки отказа — Проверка конфигураций избыточности перед развертыванием, организации снижают риск дорогостоящего простоя.
- Модели реальных условий — Прогнозируйте и проверьте, как различные рабочие нагрузки ИИ будут влиять на охлаждение, устойчивость к мощности и перегрузку сети.
Интегрируя моделирование в реальном времени в разных дисциплинах, план позволяет инженерным группам исследовать различные конфигурации для моделирования стоимости владения и оптимизации использования электроэнергии.
Симуляции в реальном времени для более быстрого принятия решений
В демонстрации Хуанга инженеры регулируют конфигурации фабрики ИИ в режиме реального времени — и сразу же видят влияние.
Например, небольшой настройка в макете охлаждения значительно повысил эффективность — деталь, которая могла быть пропущена на бумаге. И вместо часов ожидания результатов моделирования команды могли проверять и усовершенствовать стратегии за считанные секунды.
Как только оптимальный дизайн был завершен, Omniverse упрощенная связь с поставщиками и строительными командами — обеспечение того, что то, что создается, совпадает с моделью, вплоть до последней детали.
Фабрики ИИ в будущем
Рабочие нагрузки ИИ не статичны. Следующая волна приложений искусственного интеллекта будет продвигать мощность, охлаждение и сетевые требования еще больше. Основный план для дизайна и операций AI Factory помогает гарантировать, что фабрики AI готовы, предлагая:
- Рабочая нагрузка-моделирование — Прогнозируйте, как изменения в рабочих нагрузках ИИ будут влиять на мощность и охлаждение в шкале центра обработки данных.
- Сценарий сценария — Модель сбоев сетки, утечки охлаждения и пики мощности, чтобы обеспечить устойчивость.
- Масштабируемые обновления — Планируйте расширение фабрики ИИ и оценить, что инфраструктура нуждается в нескольких годах.
А при планировании модернизации и обновлений пользователи могут легко тестировать и моделировать стоимость и время простоя-предоставление будущей защитной фабрики ИИ.
Для операторов фабрики искусственного интеллекта оставаться впереди — это не только эффективность — это предотвращение сбоев инфраструктуры, которые могут стоить миллионы долларов в день.
Для фабрики AI 1 Gigawatt каждый день простоя может стоить более 100 миллионов долларов. Решая заранее проблемы инфраструктуры, план снижает как риск, так и время для развертывания.
Дорога к агентскому ИИ для эксплуатации ИИ
Nvidia работает над следующей эволюцией Blueprint, чтобы расширить операции с поддержкой AI, работая с ключевыми компаниями, такими как Vertech и Phaidra.
Vertech сотрудничает с командой инженерных центров обработки данных NVIDIA в области современной системы управления AI от NVIDIA, которая интегрирует данные ИТ и операционных технологий для повышения устойчивости и эксплуатационной видимости.
Phaidra работает с NVIDIA, чтобы интегрировать AI-агенты, обучающие AI, в Omniverse. Эти агенты оптимизируют тепловую стабильность и энергоэффективность посредством моделирования сценариев в реальном времени, создания цифровые близнецы Это постоянно адаптируется к изменению оборудования и условий окружающей среды.
Бум центра обработки данных искусственного интеллекта
ИИ меняет ландшафт глобального центра обработки данных. С прогнозируемыми на 1 триллион долларов на обновления центра обработки данных, управляемые AI, цифровая технология Twin больше не является необязательной-это важно.
Всчетный план NVIDIA для дизайна и операций AI Factory готовы помочь NVIDIA и ее экосистеме партнеров руководить этой трансформацией-позволяя операторам фабрики AI оставаться впереди постоянно развивающихся рабочих нагрузок ИИ, минимизировать время и максимизировать эффективность.
Узнайте больше о Nvidia OmniverseСмотреть GTC KeynoteВ Зарегистрируйтесь на сессию GTC Cadence Чтобы увидеть всеверительный план в действии и узнать больше о фабриках искусственного интеллекта.
Видеть уведомление Что касается информации о программном продукте.