Генеративный искусственный интеллект меняет будущее, в том числе геополитику, и в основе этого переворота лежат кремниевые чипы с гравировкой на транзисторах. Но узкое место в производстве чипов, особенно со стороны Nvidia, грозит замедлить внедрение ИИ. В ответ на это наблюдается шквал активности по разработке новых и лучших чипов.
Основатель OpenAI Сэм Альтман собирает миллиарды для создания сети заводов по производству чипов, Закон администрации Байдена о чипах и науке выделяет 52,7 миллиарда долларов на исследования чипов, а такие компании, как Тайваньская компания по производству полупроводников (TSMC) и Intel, инвестируют миллиарды в новые мощности в США Эти шаги подчеркивают решающую роль чипов в стимулировании инноваций, экономической мощи и технологической независимости.
Лидерам бизнеса не нужны глубокие технические знания в области архитектуры микросхем, но понимание стратегических последствий достижений в проектировании микросхем имеет важное значение. Помимо отслеживания технологических тенденций, лидеры могут использовать эти достижения для повышения операционной эффективности, обеспечения устойчивости цепочки поставок, стимулирования инноваций и сохранения конкурентоспособности в экономике, основанной на данных.
Спустя десятилетие после того, как в конце 1950-х годов транзисторы заменили электронные лампы в электронике, Fairchild Semiconductor начала размещать несколько транзисторов на одном чипе, что положило начало закону Мура, который гласит, что количество транзисторов на микрочипе удваивается примерно каждые два года. Но поскольку закон Мура дает сбои, спрос на вычислительные мощности выше, чем когда-либо, из-за развития генеративного искусственного интеллекта и периферийных вычислений.
Сегодняшние производители микросхем выходят за рамки дальнейшей миниатюризации и разрабатывают специализированные чипы с новой архитектурой. Монолитный процессор, который долгое время доминировал в вычислительной технике, дополняется «ускорителями» — специализированными чипами, оптимизированными для конкретных рабочих нагрузок. Это похоже на расширение двухполосной автомагистрали до шести полос, что позволит транспортному потоку течь быстрее.
Оптимизированные для искусственного интеллекта ускорители, такие как графические процессоры (GPU), программируемые вентильные матрицы (FPGA), специализированные интегральные схемы (ASIC) и нейроморфные чипы, являются частью этой трансформации, каждый из которых предназначен для ускорения вычислений для решения уникальных задач. Например, последние чипы Nvidia Blackwell и Rubin предлагают значительные улучшения производительности для обучения моделей искусственного интеллекта, оптимизированные для таких рабочих нагрузок, как большие языковые модели.
Этот спрос на более эффективные ускорители спровоцировал гонку по созданию новых архитектур. Такие компании, как Cerebras, расширяют границы, создавая чипы, которые содержат сотни тысяч процессоров, оптимизированных для искусственного интеллекта, на одной пластине. Между тем, высокоскоростной чип Groq использует огромную встроенную память для повышения пропускной способности моделей искусственного интеллекта.
В то время как Nvidia доминирует на рынке чипов искусственного интеллекта со своей платформой CUDA — платформой для программирования графических процессоров NVIDIA — появляются альтернативы. Например, UXL Foundation работает над бесплатными альтернативами CUDA, потенциально открывая рынок для большего количества вариантов оборудования. По мере того, как чипы сторонних производителей набирают обороты, более конкурентная среда, вероятно, смягчит ограничения по мощности и диверсифицирует поставки оборудования для искусственного интеллекта.
И не для всех рабочих нагрузок ИИ требуется оборудование высшего уровня. Мы, скорее всего, увидим контейнеризацию рабочей нагрузки, когда сложные задачи выполняются усовершенствованными микросхемами, а более простые задачи выполняются на базовых процессорах. Такой подход оптимизирует ресурсы и производительность, балансируя традиционную и новую архитектуру для различных приложений ИИ.
Еще одна область внимания — периферийные вычисления, где обработка данных происходит ближе к источнику, что снижает задержку и повышает безопасность. Такие приложения, как беспилотные транспортные средства и промышленная автоматизация, извлекают выгоду из моделей принятия решений в реальном времени. Такие компании, как Nvidia и Qualcomm, а также такие стартапы, как SiMa.ai, создают специализированные чипы для периферийных вычислений, максимизируя эффективность обработки данных вблизи точки их генерации.
Энергопотребление и ограничения памяти также являются критическими проблемами при проектировании чипов. Память с высокой пропускной способностью (HBM) и вычисления в памяти — это новые решения, помогающие устранить узкие места в памяти, которые могут снизить производительность ИИ. Такие лидеры, как Samsung и SK Hynix, расширяют границы инноваций в области памяти, чтобы открыть новые уровни производительности и эффективности.
Новые вычислительные парадигмы также не за горами. Например, чип TrueNorth от IBM имитирует импульсную природу нейронов и их связей, обрабатывая массивный параллелизм и разреженные данные с низким энергопотреблением. Такие нейроморфные чипы могут позволить интеллектуальным устройствам решать такие задачи, как распознавание образов, сенсорная обработка и принятие решений в реальном времени.
По мере того как ускорители становятся более мощными, их физические пакеты также расширяются. Пакет графических процессоров Nvidia H100 и Cerebras Wafer-Scale Engine являются примерами крупных и сложных конструкций, оптимизированных для расширенных потребностей в охлаждении и электропитании. Новые подходы, такие как проектирование микросхем и 3D-стекирование, еще больше решают проблему замедления, обусловленную законом Мура, позволяя нескольким кристаллам меньшего размера работать в унисон и повышая эффективность кремния.
Будущее вычислений указывает на модульные системы, объединяющие центральные и графические процессоры, ускорители искусственного интеллекта и специализированные чипы. Стратегия Intel по интеграции ядер ЦП и графического процессора в одном пакете иллюстрирует этот сдвиг, объединяя разнообразные вычислительные возможности для различных рабочих нагрузок ИИ. Этот модульный подход способствует гибкости и эффективности, гарантируя, что предприятия и страны, инвестирующие в эти технологии, останутся на переднем крае инноваций.
Тем временем Китай, пострадавший от ограничений правительства США, которые не позволяют ему приобретать передовые чипы и оборудование для их производства из-за границы, занят работой над новыми архитектурами и вычислительными парадигмами, чтобы компенсировать свою старую технологию чипов.
Инновации в разработке чипов — это больше, чем техническое достижение; это стержень прогресса во всех отраслях и регионах. Гонка за устранением узких мест в аппаратном обеспечении подчеркивает стратегическую важность передовых кремниевых технологий.
Понимая возможности этих достижений, лидеры могут оптимизировать операции, защитить цепочки поставок и стимулировать инновации. В более широком масштабе страны, инвестирующие в производство чипов и исследования, позиционируют себя на стыке технологической и экономической мощи, обеспечивая свое место в глобальной экономике искусственного интеллекта.