Компания отметила начальный раунд, заявив, что у нее есть технология, которая позволит устранить некоторые из самых серьезных препятствий на пути к повышению производительности ИИ, не в последнюю очередь предоставив разработчикам моделей больше возможностей для проектирования, а также сократив расходы в процессе.
Серийные предприниматели из Кембриджа Стэн Боланд и Герман Хаузер являются бизнес-ангелами наряду с Амаром Шахом — соучредителем Wayve, который был создан в Кембриджском университете.
Соруководителями раунда стали Kindred Capital, NATO Innovation Fund, который дает возможность основателям DeepTech решать проблемы в области обороны, безопасности и устойчивости, и OSE (Oxford Science Enterprises) при участии Cocoa и Inovia Capital. Благодаря этому посевному вливанию Fractile теперь привлекла $17,5 млн (£14 млн) общего финансирования.
Fractile утверждает, что при текущем режиме модели ИИ очень дороги в эксплуатации, их производительность ограничена, а их потенциальные будущие возможности ограничены. Создателям моделей ИИ сложно обеспечить значимую дифференциацию, утверждает компания.
Fractile со штаб-квартирой в Лондоне заявляет, что применяет радикально иной подход к проектированию чипов для вывода ИИ. Ключевым аспектом этого являются вычисления в памяти, которые устраняют необходимость переноса параметров модели в процессорные чипы и обратно.
Компания утверждает, что ее чипы смогут запускать самые современные модели ИИ по крайней мере в 100 раз быстрее и в 10 раз дешевле, используя новые схемы для выполнения 99,99% операций, необходимых для запуска вывода модели. Эта стратегия также обеспечит значительную экономию энергии.
Компания Fractile, основанная в 2022 году доктором наук в области искусственного интеллекта Уолтером Гудвином, уже собрала команду мирового класса, в которую вошли ведущие специалисты из NVIDIA, Arm и Imagination.
Инвестиции будут направлены на расширение команды Fractile в области разработки микросхем, программного обеспечения и искусственного интеллекта, налаживание партнерских отношений и ускорение разработки первых продуктов компании.
Представитель компании сообщил: «У компании, пытающейся создать лучшее оборудование для вывода ИИ, есть два пути. Первый — специализация: сосредоточение на очень специфических рабочих нагрузках и создание чипов, которые идеально подходят для этих специфических требований.
«Поскольку архитектура моделей в мире ИИ быстро развивается, а проектирование, проверка, изготовление и тестирование чипов занимает значительное время, компании, придерживающиеся этого подхода, сталкиваются с проблемой стрельбы по движущейся цели, точное направление которой неизвестно.
«Второй путь — это фундаментальное изменение способа выполнения самих вычислительных операций, создание совершенно других чипов из этих новых строительных блоков и создание на их основе масштабируемых систем. Это подход Fractile, который откроет прорывную производительность в ряде моделей ИИ как настоящих, так и будущих».
Доктор Гудвин, занимающий пост генерального директора, добавил: «В сегодняшней гонке за ИИ ограничения существующего оборудования, которое почти все поставляется одной компанией, представляют собой самое большое препятствие для повышения производительности, снижения затрат и более широкого внедрения.
«Подход Fractile усиливает вывод, обеспечивая поразительные улучшения с точки зрения скорости и стоимости. Это больше, чем просто ускорение — изменение точки производительности для вывода позволяет нам исследовать совершенно новые способы использования современных ведущих моделей ИИ для решения самых сложных проблем в мире.
«Мы очень рады получить финансирование от инвесторов с богатым опытом в сфере искусственного интеллекта и производства микросхем, продолжить наращивать нашу команду мирового класса и развивать наши технологические разработки и партнерства».
Стэн Боланд сказал: «Нет сомнений, что в Fractile Уолтер строит одну из будущих суперзвездных компаний мира. Он блестящий практик ИИ, но он также внимательно слушает рынок, чтобы быть уверенным в создании действительно убедительных продуктов, которые другие эксперты захотят использовать в масштабе.
«Чтобы достичь этого, он уже начинает формировать одну из лучших в мире команд экспертов по полупроводникам, программному обеспечению и инструментам с послужным списком безупречного исполнения. Я не сомневаюсь, что Fractile станет самым надежным партнером для крупных поставщиков моделей ИИ в ближайшее время».
По данным Business Weekly, тестовые чипы будут загружены на шаттл к концу года.
Боланд сказал: «Fractile не фокусируется на обучении. Именно в обучении есть огромная блокировка CUDA* со стороны NVIDIA, которую Graphcore так и не преодолел — плюс недостаточная пропускная способность памяти и невозможность масштабирования по мере увеличения моделей».
«Напротив, система Fractile очень масштабируема и ориентирована на вывод. Это процесс (на примере Large Language Model), где модель уже построена, обучение выполнено и веса обучения известны, работа заключается в том, чтобы взять входные токены, взять веса, выполнить некоторые математические расчеты и выдать выходные токены.
«В выводе преобладают матрично-векторные умножения (примерно 99,999% операций), и графические процессоры с ними справляются ужасно, поскольку для каждого токена на чип необходимо загрузить огромное количество весов, чтобы выполнить довольно тривиальные математические действия, а затем результат записать обратно в память.
«Вот почему вычисления в памяти (IMC) — это выход. Graphcore также был архитектурой IMC, как и около 20 других стартапов в этой области (хотя в случае Graphcore это было затруднено из-за отсутствия масштабируемости), поэтому само по себе неудивительно, что Fractile принимает этот подход.
«Но Уолтер также делает кое-что очень интересное параллельно с этим, чем я не могу поделиться прямо сейчас, но это ключ к тому, чтобы он получил 100-кратное преимущество в производительности, стоимости и мощности.
«Как только модели и веса известны, сравнительно просто переложить задачу вывода на другие процессоры; эффективной блокировки CUDA нет. Fractile предстоит пройти долгий путь, но за ним определенно стоит понаблюдать».
* CUDA — это программный уровень, который обеспечивает прямой доступ к набору виртуальных инструкций графического процессора и параллельным вычислительным элементам для выполнения вычислительных ядер.