В качестве альтернативы распространенным методам генеративного искусственного интеллекта исследовательская группа, возглавляемая Хендриком Дитцем из Мюнхенского технического университета и Сергеем Овчинниковым из Массачусетского технологического института в Бостоне, использовала оптимизацию расслабленной последовательности для снова дизайн белка, который обеспечивает эффективную и надежную конвергенцию к оптимальным структурам на основе итеративная эволюция последовательностей с использованием «галлюцинации» на основе градиентного спуска без необходимости какой-либо формы переобучения.
Градиентный спуск Это распространенный метод оптимизации модели. В пошаговом процессе его можно использовать для выявления отклонений от желаемой целевой функции и корректировки параметров до достижения оптимального результата. При проектировании белков градиентный спуск можно использовать для сравнения структуры новых белков, предсказанных AlphaFold2, с желаемой структурой белка. Это позволяет ученым дополнительно оптимизировать аминокислотную цепь и полученную структуру, которая во многом определяет стабильность и функцию белка и зависит от тонких энергетических взаимодействий.
По словам первого автора Кристофера Франка, «мы экспериментально произвели и охарактеризовали более 100 белков» до 1000 аминокислот, которые были подтверждены с помощью кристаллографии белков высокого разрешения и карт плотности криоэлектронной микроскопии. «Наш конвейер также можно использовать для разработки синтетических белок-белковых взаимодействий, что подтверждено экспериментально набором белковых гетеродимеров», — пишут исследователи в своей статье.
Процесс проектирования отличается от предыдущих подходов. «Мы разработали процесс создания новых белков так, что изначально игнорировали пределы того, что физически возможно. Обычно в каждой точке аминокислотной цепи предполагается только один из 20 возможных строительных блоков. Вместо этого мы использовали вариант, в котором все возможности практически накладываются друг на друга», — пояснил Фрэнк.
Эту виртуальную суперпозицию невозможно напрямую преобразовать в реально производимый белок. Но это позволяет итеративно оптимизировать белок. «Мы улучшаем расположение аминокислот за несколько итераций, пока новый белок не станет очень близок к желаемой структуре», — говорит Кристофер Франк. Эта оптимизированная структура затем используется для определения аминокислотной последовательности, которая фактически может быть собрана в белок в лаборатории.
«Нам удалось показать, что конструкции, которые мы спроектировали, очень близки к конструкциям, которые реально производятся», — подчеркнул Франк. Создание белков, содержащих до 1000 аминокислот, «приближает нас к размеру антител, и — как и в случае с антителами — мы можем затем интегрировать в такой белок несколько желаемых функций», — заключает руководитель группы Дитц. «Это могут быть, например, мотивы распознавания и подавления патогенов».