Исследователи из Центра искусственного интеллекта НИУ ВШЭ разработали ИИ-модель, которая открывает новые возможности для диагностики и лечения тяжелых заболеваний, включая рак мозга и нейродегенеративные нарушения. Ученые применили искусственный интеллект для изучения G-квадруплексов — структур, которые оказывают значительное влияние на работу наших клеток и развитие различных органов и тканей. Статья с результатами исследования опубликована в журнале Scientific Reports.
ДНК похожа на длинную цепь символов, состоящую из четырех букв: A, C, G и T. При этом, помимо самой последовательности букв, большую роль играет то, как скручена нить ДНК: некоторые участки генетического кода становятся открытыми, то есть доступными для считывания клеткой и последующего воспроизведения, а некоторые — закрытыми. Один из видов «упаковки» — особая форма, называемая G-квадруплексом. Ее можно представить как небольшой узелок, формирующийся там, где много букв G (гуанин). Ученые предполагали, что каждый вид клеток обладает своим уникальным набором таких узелков, определяющих предназначение клетки. Например, ДНК нервных клеток головного мозга отличается своими особыми узлами от ДНК клеток печени. Именно эти различия влияют на развитие и функционирование разных типов клеток. Однако изучение таких процессов в лабораториях было дорогостоящим и не всегда давало точные результаты.
Исследователи Центра ИИ НИУ ВШЭ разработали ИИ-модель DeepGQ, которая при помощи глубокого обучения создает индивидуальные карты G-квадруплексов для каждой ткани. Модель способна анализировать цепочку ДНК сразу в двух направлениях, как бы читая ее и слева направо, и справа налево. Это помогает программе точно распознавать всю картину особенностей исследуемого участка ДНК.
Артем Башкатов, младший научный сотрудник Центра биомедицинских исследований и технологий Института ИИ и цифровых наук, рассказывает: «Наша гипотеза заключалась в том, что особенности окружения клеток, а не только сама структура ДНК определяют развитие клеток каждого типа ткани. Чтобы проверить эту идею, вместо одной универсальной модели мы создали специализированные модели DeepGQ для разных видов тканей. Например, одна модель была обучена только на клетках мозга (“DeepGQ-Нейроны”), другая — на печеночных клетках (“DeepGQ-Печень”) и так далее для 14 видов тканей. Это позволило каждой модели выявить закономерности развития для конкретного типа ткани».
Благодаря DeepGQ ученые получили доступ к инструменту для высокоточного предсказания G-квадруплексов. Вместо дорогостоящих исследований любая лаборатория, изучающая, например, рак печени или болезнь Альцгеймера, может взять данные из образцов пациентов и, используя DeepGQ, получить точную карту наиболее вероятных целей для проверки.
«По сути, DeepGQ — это Google Maps для G-квадруплексов, которая на плоскую карту ДНК наносит достопримечательности (GQs) и дорожную обстановку (DHS, гистоны), уникальную для каждого города (ткани), — считает Мария Попцова, директор Центра биомедицинских исследований и технологий Института ИИ и цифровых наук. — Многие тяжелые заболевания, от рака до нейродегенерации, являются болезнями потери идентичности ткани. Либо клетки забывают, кем они должны быть, либо их программа специализации ломается. G-квадруплексы могут стать новыми мишенями при лечении таких болезней. Если раковая клетка поддерживается во включенном состоянии благодаря определенному GQ-узлу, можно создать лекарство, которое этот узел развяжет или стабилизирует до поломки, убивая раковую клетку. В будущем это может привести к созданию модели “DeepGQ-Пациент”: взяв биопсию опухоли и ее данные, можно будет создать персональную карту активных GQs и подобрать строго индивидуальное лечение».