Математики Вышки считают, что не стоит опасаться потери работы из-за массового использования ИИ, и одновременно предостерегают от некритического восприятия работ и проектов, подготовленных с его применением. При этом ИИ может быть полезным инструментом в исследованиях, создавая модели и обрабатывая большие массивы информации.
Факультет математики НИУ ВШЭ провел научный семинар «Как искусственный интеллект меняет природу математического открытия». На встречу были приглашены действующие математики, студенты, а также старшеклассники и учителя ведущих московских математических школ. Открывая семинар, декан факультета Александра Скрипченко подчеркнула важность обсуждения возможностей и вызовов применения искусственного интеллекта в математике в условиях, когда одни ученые считают, что благодаря ИИ математики, как его авторы, стали самыми востребованными специалистами в мире, а другие опасаются, что искусственный разум оставит без работы и математиков.
Она передала слово лауреату Медали Филдса (одной из наиболее престижных математических наград в мире) Андрею Окунькову, профессору НИУ ВШЭ и Колумбийского университета (США). Он представил доклад «Критика речистого разума» и предложил поразмышлять о процессе математического познания и роли в нем вычислительных машин и слов. «Математика немыслима без точности и честности. Я не специалист и даже не очень активный пользователь ИИ и больших языковых моделей, но мне есть что сказать по их поводу», — отметил профессор.
Андрей Окуньков напомнил о работе философа Иммануила Канта «Критика чистого разума», в которой говорится, что математика дает самый блестящий пример чистого разума, удачно расширяющегося самопроизвольно пространства. Это игра слов, чем часто и занимаются большие языковые модели (LLM). Ученый также напомнил, что Кант одновременно интересовался и естественными науками, даже написал трактат о Солнечной системе, в котором утверждал, что все ее планеты населены и по мере удаления от Солнца моральный уровень их жителей повышается.
Сейчас подобные размышления вряд ли возможны, поскольку современная наука говорит на языке математики. Впервые эту мысль высказал великий итальянский ученый Галилео Галилей: «Книга природы написана на языке математики, а ее буквы — это круги, треугольники и другие геометрические формы». Однако каждая новая глава этой книги требует новой математики, представляющей не следствие, а, напротив, основу предшествующей.
Понятия и вкладываемые в них термины расширяются. Математика не созерцает априорные вещи, самое важное в математике — кристаллизация новых структур, понятий и явлений. Достаточно задуматься о развитии смысла слова «пространство» за последние 150 лет. По современным представлениям, наше пространство динамически меняется, осциллирует классически и квантово. Однако есть что-то и более значительное, чем пространство.
Обсуждая искусственный интеллект с научной точки зрения, по мнению Андрея Окунькова, следует осознавать, что нейросети в голове и в машине близки по строению и действию. Человеческое и машинное познание математики не остановить, в этом нет ничего травматичного. Люди опасались, что математику вытеснят вычислительные машины, но численные и символические методы, напротив, придали математикам сил и уверенности. «Я сам пользовался ими всю жизнь и настоятельно всем советую не забывать старых точных и приближенных к классической математике алгоритмов», — рекомендовал аудитории ученый.
По его мнению, некоторые большие языковые модели напоминают аспирантов: часто они приятно удивляют, но иногда просто поверхностно повторяют разные умные слова, не погружаясь глубоко в смысл обсуждаемого. Поэтому надо детально анализировать работу, выполненную с применением ИИ.
Например, работая с числами Каждана — Луштига, сфере математики, явно прогрессирующей благодаря машинному обучению, докладчик попросил ChatGPT и другие модели напечатать таблицу этих чисел, но ошибки начались уже на самом элементарном этапе, с которым люди справились бы без проблем.
Андрей Окуньков обратил внимание, что некоторые студенты перестали самостоятельно учиться, выбрав стратегию применения ИИ. Возможно, кто-то от такой стратегии выиграет, но многих она приведет в тупик. В математике важно отделить правильный ответ от неправильного, и критическое мышление играет центральную роль в ситуации, когда результаты языковых моделей зачастую ненадежны. «Пока ИИ не окончил аспирантуру, и не стоит забывать, что обычное чутье играло и играет в математике важную роль», — полагает Андрей Окуньков.
Человеческий мозг способен точно распознать, что речь идет о структурно похожих явлениях, на что не всегда способен ИИ. Даже в эпоху стремительного развития ИИ остается очень ценным иметь друзей-коллег, способных неожиданно заметить аналогии между конструкциями из совсем разных областей математики. «Было бы чудесно ИИметь такие подсказки под рукой», — пошутил ученый.
Математики приучены, что многие догадки не подтверждаются, а когда они попадают близко к цели, многое приходится додумывать. Большинство математиков склонны и способны критически анализировать всякого рода смелые предположения. «Один ИИ может наварить гораздо больше каши, чем все ученые могут переварить», — посетовал профессор Окуньков. В такой ситуации, резюмировал он, математическая интуиция и критическое мышление остаются ключевыми ингредиентами успешного исследования — с использованием ИИ или без него, и важность качественного математического образования нельзя переоценить.
Вторая часть семинара была посвящена презентации реальных результатов применения ИИ в фундаментальной математике, представленных молодыми сотрудниками Научно-учебной лаборатории сложных сетей, гиперграфов и их приложений НИУ ВШЭ. Магистрант факультета математики НИУ ВШЭ Сергей Усанов представил доклад «Новый инструмент науки: как использовать ИИ в математике», подготовленный под руководством Федора Павутницкого (СПбГУ) и профессора факультета математики НИУ ВШЭ Василия Горбунова.
Он рассказал о применении машинного обучения в теории узлов. Узлы — замкнутые кривые в пространстве, инварианты — функции, позволяющие распознать эквивалентные узлы, которые визуально могут выглядеть очень по-разному. Исследователь также подробно рассказал о хордовых диаграммах и редукции ряда связанных с теорией узлов задач к графам, а затем познакомил слушателей с основными идеями машинного обучения.
Машинное обучение работает с объектом, его нужно обучить, например, прогнозировать цену квартиры, исходя из набора признаков. Идеальная функция может быть очень разной, поскольку в реальности объекты дискретны. Модель — это семейство функций, которое важно калибровать и приблизить к реальности, однако, если прогноз верен на 100%, это означает недостаток модели.
Для работы модели необходимо выбрать большое число объектов, таргет (целевую переменную) и искать функцию. В случае теории узлов это количество ребер в графе пересечений. Функция — многочлен с определенным числом хорд, который можно рассчитать рекурсивно, потратив много времени, или можно попытаться выразить графы численно, рассчитать количество подграфов.
С помощью МО удалось разработать формулу, дававшую достаточно точный прогноз и позволившую вычислить закономерность с применением линейной регрессии. Это подтвердилось при проведении эксперимента.
«ИИ может быть очень полезным, чтобы заметить нужную вам зависимость, но это сложно, иногда трудно найти модель, или не всегда удается отобразить объекты численно», — подытожил Сергей Усанов.
Магистрант факультета математики Артем Малько выступил с докладом «Большие языковые модели — новый инструмент науки», подготовленным под руководством Федора Павутницкого. Этот доклад содержал подробный обзор существующих и применяющихся в математике в настоящий момент моделей.
Артем напомнил, что создатели LLM придерживаются разных подходов — от открытого естественного языка до полностью формальных доказательств и узкоспециализированных моделей, в которых гибкость обменивается на надежность и управляемость.
Они разработали архитектуру трансформера, такие модели напоминают ChatGPT, просты в применении, но их сложно проверить, и они недостаточно эффективны в решении узкой задачи.
Другие модели предполагают машинную проверку доказательств формального синтаксиса, более высокие гарантии корректности и воспроизводимость ценой при увеличении накладных расходов на формализацию, а также более высокий порог входа.
В недавно вышедшей в журнале Nature статье авторы представили архитектуру обучения с учителем, предлагающую новые варианты машинного обучения, причем была обнаружена связь между алгебраическим и гиперболическим компонентами.
При подготовке статьи о классификации узлов они обучили модель с применением трансформера, прогнозирующую тип узла, где узлы кодируются как слова в группах, а алгебраические данные используются в глубинных моделях.
На длинных словах в группах точность лучших моделей авторов превысила 95%. Они также применили обучение с подкреплением для доказательства гипотезы Эндрюса — Кертиса, но это оказалось затруднительным из-за большого пространства действий, разреженного вознаграждения и гигантского числа кодов.
«Не стоит рассчитывать, что искусственный интеллект отберет у нас работу, но можно использовать его в областях математики, которые вы недостаточно знаете. Это также метод для обработки больших объемов информации», — подытожил Артем Малько.