От теории к практике

Как используют ИИ-помощников в современной науке
iStock

Искусственный интеллект (ИИ) и помощники на его основе уже сейчас проводят исследования, экономят ученым время на обработку огромных массивов данных и помогают педагогам обучать студентов. Как это работает, «Ведомости&» разбирались на основе практических кейсов.

Научные организации и вузы все чаще используют ИИ-решения для выполнения исследований и разработок. Так, по оценкам НИУ ВШЭ, в 2025 г. к технологии обращается уже около трети ученых в мире.

Исследователи полагают, что распространение ИИ во многом зависит от уровня развития необходимой цифровой инфраструктуры. Как показал опрос 719 научных организаций и вузов, проведенный ИСИЭЗ НИУ ВШЭ, несмотря на наличие значительного числа как зарубежных, так и российских ИИ-решений, их доступность для научных организаций остается недостаточной. Опрошенные руководители научных организаций и вузов оценили обеспеченность такими системами иностранной разработки на 2,71 балла из 5 возможных; отечественной – еще ниже: на 2,60 балла. Отдельно в вузах дела обстоят немного лучше: до 2,98 и 2,90 балла соответственно.

Чтобы решить эту проблему, бигтехи участвуют в создании специализированных образовательных программ, помогают в проведении социально значимых исследований. По словам Анны Лемякиной, директора по национальным стратегическим проектам Yandex Cloud, в таком взаимодействии платформа выступает как технологический партнер, предоставляя для научных проектов полный спектр сервисов: от хранения и обработки больших объемов данных до обучения и развертывания моделей. «Мы оцениваем объем данных, сложность задачи, команды и подбираем совместно с вузом или исследовательским центром ту конфигурацию и архитектурное решение, которое наиболее оптимальным способом выполнит конкретную задачу», – рассказывает она.

Несмотря на то что роль ИИ-инструментов в исследованиях становится все более заметной, в целом оценить эффективность внедрения ИИ в науку пока сложно. «В естественнонаучных областях цикл исследования занимает 2–5 лет. Проекты, стартовавшие с глубоким включением ИИ, только проходят свои этапы, и их результаты еще впереди», – отмечает Александр Белов, руководитель департамента прикладной математики МИЭМ ВШЭ.

Количество имеет значение

Большие языковые модели (LLM) помогают ученым обрабатывать и структурировать огромные объемы информации, генерировать новые идеи и гипотезы, строить прогнозы и повышать качество получаемых результатов. Главное – иметь верифицированные данные для исследования. «К нам поступает очень много интересных задач от ученых и исследователей, но при отсутствии данных или истории наблюдений ничего не получится», – рассказывает Лемякина и приводит в пример проблему обмеления Каспия, для изучения которой до сих пор не хватает проверенных данных, а значит, без датасета невозможно создать ИИ-решение.

Знакомьтесь, виртуальный пациент

Для обучения медиков могут появиться виртуальные пациенты. Журнал The Lancet цитирует исследование, в котором говорится, что созданные с помощью ИИ пациенты могут моделировать различные клинические сценарии, а также предоставлять мгновенную обратную связь, позволяя студентам практиковаться в сборе анамнеза, постановке диагноза и общении в безопасной среде.
Существующие виртуальные пациенты на основе чат-ботов ограничены в возможностях из-за отсутствия визуальных, звуковых и физических сигналов. Однако достижения в области генеративного ИИ, такие как Sora* от OpenAI, могут устранить эти ограничения за счет создания реалистичных видеороликов высокой четкости для обучения.

Источник: The Lancet*

Но есть и успешные кейсы. К примеру, астрофизики и аналитики данных SNAD совместно с Yandex Cloud* проанализировали 100 млн кривых блеска красных карликов – небольших и холодных звезд, схожих с Солнцем. Каталог вспышек поможет точнее предсказывать магнитные бури и их влияние на электронику и системы связи.

Еще один пример – из биологии. В 2021–2024 гг. команда биологического факультета СПбГУ по итогам полевых работ накопила данные, которые позволили оценить динамику популяции рыбы колюшки, которая играет важную роль в экосистеме и служит объектом питания других животных. «Для таких работ нужно анализировать огромные объемы видеозаписей, делать это вручную практически невозможно. Процесс нужно было автоматизировать, и мы договорились о сотрудничестве с Центром технологий для общества «Яндекса», – вспоминает Даниил Ташбаев, аспирант биологического факультета СПбГУ. Эксперты бигтеха и студенты проанализировали более 1 млн изображений с подводных камер в Белом море. С помощью выделения конкретных объектов на фотографиях разметили данные, написали и обучили нейросеть. Сейчас модель может обработать целый день съемки, 9000–18 000 кадров, за 3–5 часов (вместо 1000 часов вручную) и предоставить данные в удобном для дальнейшего анализа виде.

От нескольких часов до нескольких минут

По прогнозу Максима Абрамова, руководителя лаборатории прикладного искусственного интеллекта СПб ФИЦ РАН, в 2026 г. начнется ускоренная автоматизация НИОКР: скорость исследований и написания кода увеличится на 50%. «ИИ не просто ускоряет работу – он расширяет границы научного поиска, превращая исследователя в дирижера сложной вычислительной экосистемы», – говорит эксперт.

Но уже сейчас использование новых технологий позволяет ученым экономить время. Так, в результате совместной работы Центра технологий для общества «Яндекса» и Южного федерального университета (ЮФУ) время анализа спектров катализаторов с помощью LLM-агента сократилось с нескольких часов до минут, при этом точность исследования сохранилась на прежнем уровне. Междисциплинарный коллектив Международного исследовательского института интеллектуальных материалов ЮФУ обучил его на специально собранных базах данных с помощью авторского фреймворка PyFitIt* на платформе Yandex Cloud. Общение с агентом происходит через Telegram‑бот: ученый загружает документ со спектром (текстовый файл с данными), система подхватывает его и запускает анализ. Результат – заряд атомов, расстояния между ними и координационные числа – готов за несколько минут. Команда планирует распространить и адаптировать агента для использования на крупных российских установках, в том числе на Курчатовском синхротроне (уникальный в России научно-исследовательский центр, использующий синхротронное излучение).

Есть проекты, в которых увеличение скорости обработки данных становится важным для жизни человека. Например, в проекте по автоматизации процесса принятия решений локальными этическими комитетами (ЛЭК) по проведению клинических исследований лекарственных препаратов на людях, отмечает Лемякина. ЛЭК при ФГБУ «НМИЦ онкологии им. Н. Н. Петрова» Минздрава России ежемесячно рассматривает от 20 до 50 таких заявок, состоящих из пакета документов на сотни страниц. Для автоматизации рутинных работ специалисты центра разработали собственный программный прототип и обратились с инициативой в Центр технологий для общества «Яндекса». По итогам проекта проверка комплекта документов на 95% происходит без участия человека: секретарь ЛЭКа загружает сканы документов в веб‑сервис, где нейросети Yandex AI Studio* их анализируют, распределяют по 10 типам, извлекают информацию и автоматически проверяют на соответствие критериям, разработанным экспертами НМИЦ онкологии. После этого экспертам остается только проверить информацию и подтвердить заявку.

«В среднем не только в России, но и в Европе и США процесс согласования заявки занимает от 30 до 60 дней. Нам удалось сократить его в 12 раз, что крайне важно для пациентов, которые ждут новых протоколов лечения, а также вакцин и лекарственных препаратов», – рассказывает Лемякина.

/iStock

Строит гипотезы и предсказывает новое

Важно смотреть на ИИ не только как на инструмент, а как на сопроектировщика научного исследования, уверен Алексей Толстиков, руководитель Школы анализа данных. «Я верю, что в ближайшем будущем человеку нужно стать своего рода дирижером научного исследования. ИИ не обязательно будет создавать новое знание, но уже сейчас становится важным участником оркестра, который подсвечивает направление поиска, помогает осветить слепые зоны и ускоряет переход от идеи к проверяемой гипотезе», – указывает он. Пожалуй, наиболее известный пример «сотрудничества» науки с ИИ – система AlphaFold от DeepMind, которая научилась предсказывать трехмерную структуру белка, исходя из аминокислотной последовательности. «AlphaFold буквально перевернула биологию: она раскрыла устройство более 200 млн белков – почти всех, известных на Земле. Это стало ключом к созданию новых лекарств, ферментов и биоматериалов. Многие называют это событие для биологии таким же важным, как открытие структуры ДНК в ХХ в.», – рассказывает Николай Суетин, заместитель председателя правления по науке и технологиям фонда «Сколково» (группа ВЭБ.РФ).

В примерах российского биомеда есть проект по изучению необычных участков ДНК – левосторонних спиралей (Z‑ДНК), которые могут быть связаны с развитием рака и других болезней. Исследование проводилось при поддержке Российского научного фонда междисциплинарной командой из Института общей физики (ИОФ), Института проблем передачи информации и ВШЭ под руководством научного сотрудника ИОФ РАН Натальи Орловой.

Для проекта команда Yandex Cloud разработала специальные скрипты автоматизации для многочисленных тестов и предоставила исследователям масштабируемую вычислительную инфраструктуру: десятки виртуальных машин для параллельных расчетов и объектное хранилище. В результате исследования ученые составили предсказательный атлас Z‑участков в ДНК и предоставили к нему свободный доступ. Используя эти данные, исследователи и врачи смогут точечно искать мутации и определять участки генома, требующие особого внимания.

А поговорить?

«Процесс ИИ-зации вузов» в России еще находится на стадии становления, отмечает Михаил Ронкин, доцент учебно-научного центра «Искусственный интеллект» Уральского федерального университета (УрФУ). В университете есть образовательная программа, которая готовит «топ ИИ-специалистов», но обучение навыкам написания кода и работы с ИИ-инструментами планируют распространить на всех студентов вуза. Пока же Союз студентов УрФУ запустил чат-бота, который помогает в решении насущных студенческих вопросов: заселение в общежитие, выплата стипендии и доступная материальная поддержка, правила вступления в профсоюз.

Другой чат-бот – на сайте НИУ ВШЭ – выступает в роли рекомендательного сервиса и помогает пользователю подобрать программы онлайн-формата и дополнительного образования на основе разнообразных параметров и личных предпочтений более чем из 750 вариантов. Команда проекта создала ИИ‑бота, используя Yandex AI Studio и Yandex SpeechKit*.

В МФТИ и МГТУ им. Н. Э. Баумана пошли еще дальше и создали на базе ИИ виртуального преподавателя по программированию. Он анализирует уровень знаний студента, выявляет слабые места и составляет индивидуальную образовательную программу, предлагая актуальные по сложности задачи на изучение нового материала либо на закрепление уже изученного. &

* 18+