CHKZ16 950+1,8%CNY Бирж.10,94-0,37%IMOEX2 732,41-0,02%RTSI1 150,64+0,94%RGBI119,48-0,34%RGBITR778,57-0,25%

Будущее кардиогенетики — с искусственным интеллектом

Исследователи Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ (Институт ИИиЦН) создали программу, которая способна анализировать участки генома человека, ранее недоступные для точной интерпретации при генетическом тестировании. Программа адаптирует большие генеративные модели (ГенИИ) под задачи кардиогенетики, чтобы предсказывать, как мутация влияет на работу конкретного гена.

Геном человека можно сравнить с огромной библиотекой. Раньше ученые умели читать только небольшую часть книг — те, в которых записаны инструкции по созданию белков (это около 2% всей ДНК). Именно там обычно искали мутации, ответственные за наследственные болезни сердца. Для таких вариантов существуют отработанные международные критерии, позволяющие оценить их опасность и выявить мутации, ведущие к развитию заболеваний. Но что делать с остальными 98%? Долгое время считалось, что это просто «пустые страницы» или «генетический мусор». Однако оказалось, что эти участки вовсе не бесполезны: они действуют как выключатели и регуляторы громкости, управляя тем, как активно работают гены. Если в таких участках происходит поломка, это может серьезно повлиять на работу сердца, сосудов и крови.

Проблема заключалась в том, что раньше ученые не могли точно определить, какие из этих «невидимых» мутаций действительно опасны, а какие безвредны. Поэтому многие случаи сердечных заболеваний оставались необъяснимыми именно из-за невозможности проанализировать некодирующие варианты (то есть те, которые не несут прямых инструкций по сборке белков). Ученые Института ИИиЦН ФКН НИУ ВШЭ представили программное решение, которое впервые позволяет массово и точно анализировать эти «молчащие» участки применительно к здоровью сердца. Программа использует самые современные технологии — генеративные модели (те же, что лежат в основе популярных нейросетей), чтобы предсказывать последствия мутаций в регуляторных участках ДНК и оценивать их влияние на здоровье сердца.

«В основе программы лежат две мощные ИИ-модели, которые можно сравнить с экспертами, прочитавшими миллионы генетических инструкций. Они умеют сравнивать два варианта ДНК: здоровый (эталонный) и тот, где произошла мутация. Затем программа оценивает, изменилась ли после этой мутации “громкость” работы генов, то есть стали они активнее или, наоборот, притихли. Мы сконцентрировались на анализе тканей сердца и сосудов, но можно анализировать любые ткани».

Для повышения точности программа использует коллективный разум: сразу несколько моделей изучают мутацию с разных сторон, а затем объединяют свои выводы с помощью методов искусственного интеллекта. В результате программа выдает простую и понятную оценку — число от 0 до 1. Чем ближе цифра к единице, тем выше вероятность, что обнаруженная мутация опасна и может повлиять на развитие болезней сердца.

Чтобы убедиться, что программе можно доверять, ученые провели строгую проверку. Для этого использовались данные британского проекта UK Biobank — огромной базы генетической информации. Для теста отобрали более 11 тысяч мутаций из тех самых «регуляторных» участков ДНК, которые раньше было сложно анализировать. Среди них были как варианты, уже точно связанные с заболеваниями, так и заведомо безвредные. Чтобы эксперимент был честным, каждую подозрительную мутацию сравнивали с девятью безопасными, подобранными по максимальному количеству совпадений: месту в геноме, типу участка, соседству с генами и другим параметрам. Программа успешно справилась с задачей: она безошибочно отличила опасные мутации от безвредных, доказав свою надежность и готовность к практическому использованию.

Программа создана для практического использования разными специалистами, сотрудники медицинских лабораторий и кардиологических центров, которые смогут точнее интерпретировать результаты полногеномного секвенирования и искать генетические причины заболеваний у пациентов (она уже внедряется в работу генетических лабораторий). Как отмечают разработчики, для работы с программой не нужно быть программистом: она создана так, чтобы ею могли пользоваться генетики, биоинформатики и медицинские исследователи в своей повседневной практике.

В фундаментальных исследованиях программа может помочь понять молекулярные механизмы развития болезней сердца и изучать, как регуляторные участки ДНК влияют на патологии. В Центре биомедицинских исследований и технологий НИУ ВШЭ благодаря программе ученые уже сделали важное открытие: оказалось, что определенные варианты гена BMPR2, влияющие на его активность, предопределяют то, как пациент будет реагировать на лечение. Сейчас исследователи продолжают работу: они ищут некодирующие участки ДНК, влияющие на работу генов, связанных с риском внезапной сердечной смерти.

Модель генеративного искусственного интеллекта «Предсказание эффекта некодирующих вариантов на основе адаптации ГенИИ моделей к домену кардиогенетика» разработана в рамках программы Центра искусственного интеллекта НИУ ВШЭ по гранту, предоставленному Минэкономразвития России.

Другие пресс-релизы