Проектирование системы для эпохи искусственного интеллекта: Nvidia расширяет возможности искусственного интеллекта с помощью переключателя NVLink

Как я уже упоминал в первой статье этой серии, Проектирование систем для эпохи искусственного интеллекта: центры обработки данных искусственного интеллекта требуют целостного подходацентры обработки данных — это сердце эпохи искусственного интеллекта. Однако экспоненциальный рост производительности требует целостного подхода к проектированию, позволяющего преодолеть ограничения по возросшей мощности и тепловой энергии. Существуют инновации во многих областях, которые помогут решить эту проблему, включая вычислительные архитектуры, память, источники питания, решения для распределения питания и охлаждения, и это лишь некоторые из них, но наиболее значительное влияние окажут сетевые технологии. Повышение производительности сети не только увеличивает производительность и снижает задержку, но также может изменить характер обработки вычислительных рабочих нагрузок. В связи с этим одной из наиболее важных инноваций, представленных в этом году, стал коммутатор NVLink от Nvidia для экзафлопсной стоечной компьютерной системы GB200 NLV72.

ФорбсПроектирование систем для эпохи искусственного интеллекта: центры обработки данных требуют целостного подхода

NVLink Switch — это архитектура перекрестного сетевого коммутатора, которая позволяет всем портам напрямую взаимодействовать с любым другим портом через NVLink, высокоскоростное эффективное вычислительное соединение. Первоначальный коммутатор NVLink был разработан для поддержки двунаправленных неблокируемых каналов связи со скоростью 50 гигабайт в секунду (ГБ/с) на платформе DGX-2. Nvidia продолжает совершенствовать технологии NVLink и NVLink Switch. Для поддержки текущего поколения графических процессоров Blackwell и системы GB200 NLV72 NVLink 5-го поколения обеспечивает скорость 100 ГБ/с на канал. Для графического процессора Blackwell с 18 портами это соответствует пропускной способности 1,8 терабайта в секунду (ТБ/с) на каждый графический процессор. Системная стойка GB200 NVL72 оснащена 18 коммутаторами NVLink, соединяющими 36 процессоров Nvidia Grace и 72 графических процессора Blackwell, что обеспечивает общую неблокирующую пропускную способность системы 130 ТБ/с. Но на этом все не заканчивается. Возможность использования коммутаторов NVLink для подключения между узлами позволяет масштабировать до 576 графических процессоров.

Влияние на центр обработки данных

Усовершенствования коммутатора NVLink в сочетании с обширной конструкцией системы позволяют создать одну из самых плотных конфигураций серверов, что приводит к более высокой общей производительности и более высокой эффективности производительности. Хотя это не позволит существующему центру обработки данных заменить все стойки в существующем центре обработки данных из-за более высоких требований к мощности и сложной инфраструктуре, особенно жидкостному охлаждению, это позволяет существующим центрам обработки данных выполнять больше рабочих нагрузок искусственного интеллекта и высокопроизводительных вычислений за долю времени. пространство. Новые центры обработки данных искусственного интеллекта и высокопроизводительных вычислений могут быть спроектированы с учетом эффективности использования пространства для уменьшения занимаемой площади или с учетом уникальных требований к инфраструктуре полномасштабного центра обработки данных.

Влияние на ИИ

Хотя преимущества для центров обработки данных значительны, истинная ценность заключается в способности удовлетворять постоянно растущие требования к рабочим нагрузкам искусственного интеллекта и высокопроизводительных вычислений. По данным Nvidia, GB200 NVL72 может поддерживать 27 триллионов размеров моделей параметров, что превышает размеры даже нынешних крупнейших моделей больших языков (LLM) для генеративного ИИ (GenAI), таких как GPT-4 и 4o. Хотя существует стремление использовать эти большие модели в качестве базовых моделей для разработки более мелких, более оптимизированных моделей, самые большие модели будут продолжать расти для таких приложений, как научный анализ и стремление к общему искусственному интеллекту (AGI). Однако ресурсы GB200 NVL72 также можно анализировать для поддержки нескольких рабочих нагрузок, обеспечивая большую эффективность как для обучения ИИ, так и для обработки логических выводов.

Tirias Research продолжит изучать, как меняется системная архитектура в эпоху искусственного интеллекта и компаний, которые являются движущей силой инноваций, но не было лучшего места для начала, чем компания, которая находится в самом сердце этой волны инноваций. Хотя Nvidia продолжает внедрять инновации в процессорах, графических процессорах, межсоединениях и системной архитектуре, коммутатор NVLink является важной инновацией, позволяющей как масштабировать рабочие нагрузки ИИ, так и повышать эффективность центров обработки данных, чтобы сделать ИИ более экономически эффективным.

Source

ЧИТАТЬ  Как был спроектирован дом мечты площадью 226 м² для большой семьи без дизайнера — INMYROOM
Оцените статью
( Пока оценок нет )
Строительство. Ремонт. Садоводство