Схематическое изображение предсказания последовательности с помощью CARBonAra. Геометрический трансформатор берет образцы пространства последовательности фермента бета-лактамазы TEM-1 (серый), образует комплекс с природным субстратом (голубой) для получения новых хорошо сложенных и активных ферментов. Автор: Александра Банбанасте (EPFL)
Исследователи EPFL разработали новую модель на основе искусственного интеллекта, предназначенную для прогнозирования последовательностей белков из остовных структур, включающих сложные молекулярные среды. Она обещает значительные достижения в области белковой инженерии и приложений в различных областях, включая медицину и биотехнологии.
Разработка белков, которые могут выполнять определенные функции, подразумевает понимание и манипулирование их последовательностями и структурами. Эта задача имеет решающее значение для разработки целевых методов лечения заболеваний и создания ферментов для промышленного применения.
Одной из главных задач в белковой инженерии является проектирование белков de novo, то есть с нуля, чтобы адаптировать их свойства для конкретных задач. Это имеет глубокие последствия для биологии, медицины и материаловедения. Например, сконструированные белки могут воздействовать на болезни с высокой точностью, предлагая конкурентоспособную альтернативу традиционным препаратам на основе малых молекул.
Кроме того, специально разработанные ферменты, которые действуют как естественные катализаторы, могут способствовать редким или несуществующим реакциям в природе. Эта способность особенно ценна в фармацевтической промышленности для синтеза сложных молекул лекарств и в экологических технологиях для более эффективного расщепления загрязняющих веществ или пластика.
Группа ученых под руководством Маттео Даль Пераро из EPFL разработала CARBonAra (Контекстно-зависимое восстановление аминокислот из атомов основной цепи и гетероатомов) — модель на основе искусственного интеллекта, которая может предсказывать последовательности белков, но принимая во внимание ограничения, накладываемые различными молекулярными средами, что является уникальным достижением.
CARBonAra обучается на наборе данных, состоящем примерно из 370 000 субъединиц, с дополнительными 100 000 для проверки и 70 000 для тестирования из Банк данных белков (PDB). Исследование опубликовано в журнале Природа Коммуникации.
CARBonAra строится на архитектуре фреймворка Protein Structure Transformer (PeSTo), также разработанного Люсьеном Краппом в группе Дала Пераро. Он использует геометрические трансформаторы, которые являются моделями глубокого обучения, обрабатывающими пространственные отношения между точками, такими как атомные координаты, для изучения и прогнозирования сложных структур.
CARBonAra может предсказывать аминокислотные последовательности из остовов, структурных каркасов белковых молекул. Однако одной из выдающихся особенностей CARBonAra является его контекстная осведомленность, которая особенно демонстрируется в том, как он улучшает показатели восстановления последовательностей — процент правильных аминокислот, предсказанных в каждой позиции в белковой последовательности по сравнению с известной референтной последовательностью.
CARBonAra значительно улучшила показатели восстановления, когда включила молекулярные «контексты», такие как интерфейсы белков с другими белками, нуклеиновыми кислотами, липидами или ионами. «Это связано с тем, что модель обучается на всех видах молекул и полагается только на атомные координаты, так что она может работать не только с белками», — объясняет Дал Пераро. Эта функция, в свою очередь, повышает предсказательную силу модели и ее применимость в реальных сложных биологических системах.
Модель не работает хорошо только в синтетических тестах, но была экспериментально подтверждена. Исследователи использовали CARBonAra для разработки новых вариантов фермента β-лактамазы TEM-1, который участвует в развитии устойчивости к противомикробным препаратам.
Некоторые из предсказанных последовательностей, отличающиеся примерно на 50% от последовательности дикого типа, были свернуты правильно и сохраняли некоторую каталитическую активность при высоких температурах, когда фермент дикого типа уже неактивен.
Гибкость и точность CARBonAra открывают новые возможности для белковой инженерии. Его способность учитывать сложные молекулярные среды делает его ценным инструментом для проектирования белков со специфическими функциями, улучшая будущие кампании по открытию лекарств. Кроме того, успех CARBonAra в области ферментной инженерии демонстрирует его потенциал для промышленного применения и научных исследований.
Больше информации:
Люсьен Ф. Крапп и др., Контекстно-зависимое геометрическое глубокое обучение для проектирования белковых последовательностей, Природа Коммуникации (2024). DOI: 10.1038/s41467-024-50571-y
Цитата: Новый подход ИИ к проектированию белков (2024, 7 августа) получено 8 августа 2024 г. из
Этот документ защищен авторским правом. За исключением случаев честного использования в целях частного изучения или исследования, никакая часть не может быть воспроизведена без письменного разрешения. Содержание предоставляется только в информационных целях.