AlphaGenome может предсказать эффект мутаций на 11 уровнях регуляции

В журнале Nature опубликовано исследование моде...

pxhere.com

В журнале Nature опубликована статья, посвященная новой модели глубокого обучения AlphaGenome, разработанной компанией DeepMind. Система предназначена для предсказания молекулярного фенотипа на основе последовательности ДНК и решает одну из ключевых задач современной биологии — интерпретацию функциональной роли генетических вариантов.

Модель обучалась на геномных данных человека и мыши и способна оценивать влияние мутаций сразу в 11 биологических модальностях. Среди них — изменения сплайсинга, экспрессии генов, состояния хроматина, регуляторных взаимодействий и структуры ДНК. В отличие от большинства существующих решений AlphaGenome выдает единый, интегрированный прогноз, а не анализирует эффекты только на одном уровне.

По результатам тестирования AlphaGenome превзошла существующие аналоги в 25 из 26 сравнительных экспериментов или, как минимум, не уступила им по точности. Препринт исследования, среди авторов которого нобелевский лауреат Демис Хассабис, был опубликован в июне 2025 года, а теперь работа прошла рецензирование и вышла в одном из ведущих научных журналов мира.

AlphaGenome прогнозирует функциональное влияние вариантов в 5930 участках генома человека и 1128 участках генома мыши. Особое внимание уделено нарушениям сплайсинга — одному из ключевых механизмов, связывающих генетические мутации с заболеваниями. Модель успешно предсказывала эффекты вариантов на уровне сайтов сплайсинга, частоты их использования и отдельных интронов, корректно интерпретируя 6 из 7 категорий клинически значимых вариантов из базы ClinVar. Исключение составили глубокие интронные и синонимичные мутации, где преимущество перед предыдущими моделями не было выявлено.

Также AlphaGenome продемонстрировала высокую точность в прогнозировании изменений экспрессии генов, связанных с некодирующими участками ДНК. Модель анализировала эффекты вариантов через различные регуляторные механизмы, включая eQTL, активность энхансеров и процессы полиаденилирования. Отдельно оценивалась способность предсказывать изменения состояния хроматина — его доступности, чувствительности к ДНКазам и связывания транскрипционных факторов.

Кроме того, AlphaGenome выявляла связи между энхансерами и промоторами, включая взаимодействия на расстояниях более 10 килобаз, опираясь на данные проекта ENCODE–rE2G. Модель также анализировала функциональные эффекты вариантов в 3′ UTR и позволяла идентифицировать причинные мутации, влияющие на уровень экспрессии генов, в рамках единого мультимодального прогноза.

Практическую значимость разработки авторы продемонстрировали на примере онкогенных мутаций гена TAL1, связанного с острым Т-клеточным лейкозом. AlphaGenome предсказала формирование неоэнхансера в области известной мутации, усиление активирующих гистоновых меток и рост экспрессии TAL1, что полностью согласуется с экспериментальными данными. По мнению авторов, именно мультимодальный подход позволил точно воспроизвести механизм, через который клинически значимый вариант способствует развитию заболевания.

В настоящее время AlphaGenome выложена в открытый доступ для некоммерческого использования. Разработчики рассчитывают, что модель станет основой для дальнейших исследований генома и ускорит прогресс в понимании генетических причин заболеваний.