Согласно отчету Nvidia, компания рассматривает возможность принятия дизайна сокета, по крайней мере, для некоторых из своих будущих графических процессоров Blackwell B300 для приложений искусственного интеллекта и высокопроизводительных вычислений. Трендфорс это цитирует Экономические ежедневные новости и ДеньгиDJ. Говорят, что компания примет новый дизайн с разъемами для чего-то под кодовым названием GB300, и на данный момент информация выглядит, мягко говоря, неубедительно. Тем не менее, учитывая тот факт, что в цепочке поставок ведется болтовня, об этом, по крайней мере, стоит задуматься.
MoneyDJ сообщает, что, учитывая частоту отказов графических процессоров AI при высоких нагрузках, стоимость замены материнских плат и проблемы с охлаждением, Nvidia и другие разработчики графических процессоров AI могут рассмотреть возможность использования конструкций сокетов для своих графических процессоров следующего поколения вместо пайки графических процессоров к материнским платам.
EDN цитирует Чэнь Шуовэня, аналитика CLSA, который сказал, что на основе проверок цепочки поставок Nvidia разрабатывает разъемы для графических процессоров для своих продуктов, возможно, начиная с GB200 Ultra. Сообщается, что Чен упомянул четырехпроцессорную конструкцию графического процессора Nvidia с одним процессором Nvidia. Ни в одном из отчетов не упоминается ничего под названием GB300, поэтому TrendForce добавила эту часть, возможно, на основе каких-то дополнительных разговоров.
Следует отметить несколько моментов, касающихся отчетов. Вместо этого конструкции с разъемами усугубят проблемы с питанием и охлаждением, а не помогут их решить, поэтому первый отчет неточен. Наиболее энергоемкие графические процессоры обычно используют корпус BGA.
4-процессорный графический процессор Blackwell с материнской платой с одним процессором не выглядит чем-то необычным, учитывая, что на серверах DGX мы видим 8-процессорную материнскую плату с графическим процессором и 2-процессорную материнскую плату с процессором, но такая конструкция выглядит невероятно.
Номенклатура центров обработки данных Nvidia разделяет платформы графических процессоров компании (A100, H100, B100/B200) и Grace CPU + GPU (GH100, GB200). На данный момент платформы GB200 используют корпус BGA как для ЦП, так и для графического процессора; мы не уверены, что что-то изменится с обновлением B200 Ultra, особенно с возможным обновлением GB200 Ultra где-то во второй половине года.
Мы все любим стандартные процессорные разъемы за их простоту ремонта и возможность модернизации. Но на серверах они занимают больше места и имеют больше ограничений по мощности и температуре, чем пакеты BGA или модули SXM/OAM. Хотя модули обеспечивают возможность ремонта, процесс может различаться в зависимости от конкретной конструкции материнской платы, а удаление модуля OAM/SXM требует осторожного обращения, поэтому они не так хороши, как разъемы.
Есть еще один момент. Карты расширения, модули SXM и OAM производить сложно и дорого, и на данный момент большинство модулей Nvidia SXM производятся компанией Foxconn. Переход с карты или модуля на сокет сокращает затраты, но ограничивает производительность.
Аппаратные возможности Blackwell
Прежде чем перейти к предполагаемому продукту для центров обработки данных на базе Blackwell (GB300, GB200 Ultra и т. д.) с встроенным графическим процессором, давайте вспомним, какие графические процессоры для центров обработки данных на базе Blackwell уже представила Nvidia.
К настоящему времени Nvidia официально представила свой графический процессор B200 (1000 Вт+), который будет использоваться на платах GB200 (под кодовым названием Bianca с одним процессором Grace и двумя графическими процессорами Blackwell, а также Ariel с одним процессором Ariel и одним графическим процессором Blackwell) и будет поставляться в Форм-фактор BGA. Кроме того, у Nvidia также есть платы графического процессора Umbriel, поддерживающие восемь форм-факторов модулей SXM B200 (1000 Вт) и B100 (700 Вт). Кроме того, согласно данным, существуют платформы под кодовым названием Miranda (повышает производительность (думаю, более высокий TDP), PCIe 6.0 и 800G) и платформы под кодовым названием Oberon GB200. Полуанализ.
Несмотря на то, что существуют карты расширения Nvidia H100 и даже H200 (на основе архитектуры Hopper) с пониженной производительностью, чтобы вписаться в типичные энергетические и тепловые бюджеты, обеспечиваемые классическими серверами, Nvidia никогда не анонсировала какие-либо карты расширения с графическими процессорами на базе Blackwell.
Тем не менее, по неофициальной информации, мы знаем, что Nvidia готовит свой продукт под кодовым названием B200A на базе монолитного процессора B102 с четырьмя стеками памяти HBM3E, соединенными с помощью технологии упаковки CoWoS-S от TSMC. В этом отличие от конструкций B100/B200 с двумя кристаллами, которые собираются вместе с помощью CoWoS-L TSMC, а затем подключаются к восьми стекам памяти HBM3E.
Учитывая, что с предполагаемым B200A мы имеем дело с однокристальным продуктом, не предназначенным для того, чтобы стать рекордсменом по производительности, этот процессор может иметь несколько форм-факторов. Сюда входит модульная конструкция SXM (особенно в китайской форме B20) и форм-фактор карты расширения. Может это розетка? Возможно. Мы собираемся посмотреть на это. Intel выпустила свой процессор Xeon CPU Max 9480 «Sapphire Rapids» со встроенным процессором HBM, и он не имел успеха за пределами избранной аудитории суперкомпьютеров. Хочет ли Nvidia создать что-то подобное? Мы это увидим.