Узнайте больше о том, как мы продвигаемся к выполнению наших обязательств в области устойчивого развития, из серии блогов «Устойчивое развитие по замыслу», начиная с Устойчивость по замыслу: повышение устойчивости ИИ.
Ранее этим летом моя коллега Ноэль Уолш опубликовала блог, в котором подробно описала, как мы работаем над экономией воды в наших центрах обработки данных: «Устойчивое развитие по замыслу: повышение эффективности использования воды в центрах обработки данных» в рамках наших обязательств по достижению целей устойчивого развития, заключающихся в достижении отрицательных выбросов углерода, положительного потребления воды, нулевых отходов и защите биоразнообразия.
В Microsoft мы проектируем, создаем и эксплуатируем инфраструктуру облачных вычислений, охватывающую весь стек, от центров обработки данных до серверов и заказных кремниевых чипов. Это создает уникальные возможности для организации совместной работы элементов для повышения производительности и эффективности. Мы считаем работу по оптимизации мощности и энергоэффективности критически важным путем к выполнению нашего обещания стать углеродно-отрицательными к 2030 году, наряду с нашей работой по продвижению безуглеродной электроэнергии и удалению углерода.
- Узнайте, как мы способствуем устойчивому развитию ИИ
- Повышение эффективности от центров обработки данных до серверов и кремния
- Максимальное использование оборудования за счет интеллектуального управления рабочей нагрузкой
- Безопасный сбор неиспользуемой энергии в нашем парке центров обработки данных
- Повышение эффективности ИТ-оборудования за счет жидкостного охлаждения
- Узнайте больше и изучите ресурсы для повышения эффективности облачных технологий и искусственного интеллекта
Узнайте, как мы способствуем устойчивому развитию ИИ
Изучите три направления нашей деятельности
Стремительный рост спроса на инновации в области искусственного интеллекта для продвижения новых рубежей исследований предоставил нам возможность перепроектировать наши инфраструктурные системыот центров обработки данных до серверов и кремния, с эффективностью и устойчивостью на переднем плане. Помимо получения электроэнергии без выбросов углерода, мы внедряем инновации на каждом уровне стека, чтобы снизить энергоемкость и требования к мощности облачных и ИИ-рабочих нагрузок. Еще до того, как электроны попадут в наши центры обработки данных, наши команды сосредоточены на том, как мы можем максимизировать вычислительную мощность, которую мы можем генерировать из каждого киловатт-часа (кВт-ч) электроэнергии.
В этом блоге я хотел бы поделиться некоторыми примерами того, как мы повышаем эффективность мощности и энергопотребления ИИ. Это включает в себя системный подход к эффективности и применение ИИ, в частности машинного обучения, к управлению облачными и ИИ-рабочими нагрузками.
Повышение эффективности от центров обработки данных до серверов и кремния
Максимальное использование оборудования за счет интеллектуального управления рабочей нагрузкой
Верные своим корням как компании-разработчика программного обеспечения, мы используем один из способов повышения энергоэффективности наши центры обработки данных через программное обеспечение, которое позволяет планировать рабочую нагрузку в режиме реального времени, поэтому мы можем максимально использовать существующее оборудование для удовлетворения спроса на облачные сервисы. Например, мы можем увидеть более высокий спрос, когда люди начинают свой рабочий день в одной части мира, и более низкий спрос по всему миру, когда другие заканчивают работу к вечеру. Во многих случаях мы можем согласовать доступность для внутренних потребностей в ресурсах, таких как запуск рабочих нагрузок обучения ИИ в непиковые часы, используя существующее оборудование, которое в противном случае простаивало бы в течение этого периода времени. Это также помогает нам улучшить использование энергии.
Мы используем возможности программного обеспечения для повышения энергоэффективности на каждом уровне инфраструктуры: от центров обработки данных до серверов и кремниевых чипов.
Исторически в отрасли выполнение рабочих нагрузок ИИ и облачных вычислений основывалось на назначении центральных процессоров (ЦП), графических процессоров (ГП) и вычислительной мощности для каждой команды или рабочей нагрузки, обеспечивая коэффициент использования ЦП и ГП около 50–60%. Это оставляет некоторые ЦП и ГП с недоиспользованной мощностью, потенциальной мощностью, которая в идеале могла бы быть использована для других рабочих нагрузок. Чтобы решить проблему использования и улучшить управление рабочей нагрузкой, мы перевели рабочие нагрузки обучения ИИ от Microsoft в единый пул, управляемый технологией машинного обучения под названием Project Forge.

В настоящее время в производстве в службах Microsoft это программное обеспечение использует ИИ для виртуального планирования рабочих нагрузок обучения и вывода, а также прозрачную контрольную точку, которая сохраняет снимок текущего состояния приложения или модели, чтобы его можно было приостановить и перезапустить в любое время. Независимо от того, работает ли он на процессоре партнера или на специальном процессоре Microsoft, таком как Майя 100Project Forge последовательно повышает эффективность использования Azure до 80–90% при масштабировании.
Безопасный сбор неиспользуемой энергии в нашем парке центров обработки данных
Другой способ повышения энергоэффективности заключается в разумном размещении рабочих нагрузок в центре обработки данных для безопасного сбора любой неиспользуемой мощности. Сбор мощности относится к практикам, которые позволяют нам максимально использовать имеющуюся у нас мощность. Например, если рабочая нагрузка не потребляет весь объем выделенной ей мощности, эта избыточная мощность может быть заимствована или даже переназначена другим рабочим нагрузкам. С 2020 года эта работа позволила восстановить около 800 мегаватт (МВт) электроэнергии из существующих центров обработки данных, что достаточно для обеспечения электромобиля пробегом около 2,8 миллиона миль.1
За последний год, даже несмотря на рост нагрузки на ИИ-клиентов, наши показатели экономии электроэнергии удвоились. Мы продолжаем внедрять эти передовые практики в нашем парке центров обработки данных, чтобы восстанавливать и перераспределять неиспользуемую мощность без ущерба для производительности или надежности.
Повышение эффективности ИТ-оборудования за счет жидкостного охлаждения
Помимо управления питанием рабочих нагрузок, мы сосредоточены на снижении потребности в энергии и воде для охлаждения чипов и серверов, на которых размещены эти чипы. С мощной обработкой современных рабочих нагрузок ИИ увеличивается тепловыделение, а использование серверов с жидкостным охлаждением значительно снижает электроэнергию, необходимую для управления температурой по сравнению с серверами с воздушным охлаждением. Переход на жидкостное охлаждение также позволяет нам получить большую производительность от нашего кремния, поскольку чипы работают более эффективно в оптимальном температурном диапазоне.
Значительная инженерная проблема, с которой мы столкнулись при внедрении этих решений, заключалась в том, как модернизировать существующие центры обработки данных, предназначенные для серверов с воздушным охлаждением, чтобы они соответствовали последним достижениям в области жидкостного охлаждения. индивидуальные решения, такие как «сайдкик», компонент, который находится рядом со стойкой серверов и циркулирует жидкость как автомобильный радиатор, мы приносим решения жидкостного охлаждения в существующие центры обработки данных, сокращая энергию, необходимую для охлаждения, и увеличивая плотность стоек. Это, в свою очередь, увеличивает вычислительную мощность, которую мы можем генерировать с каждого квадратного фута в наших центрах обработки данных.
Узнайте больше и изучите ресурсы для повышения эффективности облачных технологий и искусственного интеллекта
Оставайтесь с нами, чтобы узнать больше об этой теме, включая то, как мы работаем над тем, чтобы вывести перспективные исследования эффективности из лаборатории в коммерческую эксплуатацию. Вы также можете узнать больше о том, как мы продвигаем устойчивость в нашей серии блогов Sustainable by design, начиная с Устойчивость по замыслу: повышение устойчивости ИИ и Устойчивое развитие по замыслу: Преобразование эффективности использования воды в центрах обработки данных.
Архитекторам, ведущим разработчикам и лицам, принимающим решения в сфере ИТ, которые хотят узнать больше об эффективности облачных вычислений и искусственного интеллекта, мы рекомендуем изучить Руководство по устойчивому развитию в Azure Well-Architected Framework. Этот комплект документации соответствует принципам проектирования Фонд зеленого программного обеспечения и призван помочь клиентам планировать и соблюдать меняющиеся требования и правила устойчивого развития, касающиеся разработки, развертывания и эксплуатации ИТ-возможностей.
1Предположения об эквивалентности основаны на оценках, что электромобиль может проехать в среднем около 3,5 миль за киловатт-час (кВт-ч) x 1 час x 800.