Вячеслав Цыганов: «Сейчас из каждого набора данных можно делать новый бизнес»

Заместитель председателя правления Т-банка – о возможностях искусственного интеллекта и трансформации IT-ландшафта в России
Заместитель председателя правления Т-банка Вячеслав Цыганов
Заместитель председателя правления Т-банка Вячеслав Цыганов /Алексей Орлов / Ведомости

За последние три года искусственный интеллект радикально трансформировал IT-ландшафт бизнеса, превратив данные в стратегический актив. Компании начали активно внедрять искусственный интеллект (ИИ) для автоматизации процессов, персонализации клиентского опыта и прогнозирования спроса. Разработка собственных решений, использование больших языковых моделей, запуск дата-центров и создание платформ с открытым кодом – все это стало ответом на глобальные вызовы и уход иностранных вендоров из России. Заместитель председателя правления Т-банка и руководитель департамента информационных технологий Вячеслав Цыганов рассказал, как большие данные изменили бизнес и подход к персонализации продуктов, почему программное обеспечение с открытым кодом – это глобальный тренд и зачем компании строят собственные ЦОДы.

– Сейчас все банки внедряют в свои сервисы решения на базе искусственного интеллекта: помощники, советники. Какие вызовы стоят перед компаниями, использующими такие решения, с точки зрения безопасности и масштабируемости на горизонте двух–трех лет? 

– Т-банк идет по этому пути начиная с 2019 г. Мы первыми приняли стратегию, которую назвали AI-Банкинг и даже зарегистрировали товарный знак AI-Bank. Мы верим, что эти технологии будут фундаментально менять разные бизнесы. И финтех, естественно, не исключение. 

Мы в 2024 г. запустили свою экосистему из шести персональных ассистентов на базе ИИ – «Вселенную ассистентов». И видим, что собственные данные сильно повышают качество ответов. Например, мы сравнивали ответы нашего финансового ассистента и ChatGPT в инвестиционной сфере. Точность и полнота ответов по российским ценным бумагам оказалась в два–три раза лучше за счет дообучения на собственных дата-сетах.

В долгосрочной перспективе, конечно, на развитие ИИ-решений будет влиять и улучшение качества больших языковых моделей, на базе которых работают универсальные чат-боты, и дообучение на своих дата-сетах для каждого конкретного бизнеса.

– А с точки зрения безопасности может ли бизнес использовать сторонние большие языковые модели? 

– При использовании таких решений на объектах критической информационной инфраструктуры нельзя применять технологии напрямую – требуются особые подходы. Некоторые из них уже проверены в других сферах. Например, «песочницы»: технологии тестируются не на данных реальных людей, а на сгенерированных массивах данных. Другой подход оставляет финальное решение за человеком. Такие методы повышают безопасность.

В тех областях, где есть однозначный правильный ответ, развитие генеративного ИИ идет быстрее. Однако до появления полностью автономных систем, которым можно доверять на 100%, еще далеко. При этом ИИ уже используется для повышения безопасности, в том числе для выявления неочевидных уязвимостей.

– Почему, на ваш взгляд, банки, в том числе Т-банк, сегодня становятся разработчиками собственных IT-решений, а не используют чужие?

– Мне кажется, это следствие уникальной ситуации, сложившейся в России. В других странах все не совсем так. У нас все банки стали финтехами, технологическими компаниями. А все технологические компании сейчас стали экосистемами или строят экосистемы. Это происходит по нескольким причинам. 

Дело в том, что в России очень сильно развита цифровая экономика. Сейчас многие компании создают цифровые продукты. И, кстати, государственные сервисы не исключение. 

Цифровой продукт – это в первую очередь процесс создания программного обеспечения. Поэтому компании начали качать эту мышцу. Такая работа легла на благодатную почву, потому что государство ее поддерживало, и первопроходцы показали, что это действительно дает конкурентное преимущество.

Рынок IT изменился за последние годы. Сегодня нет решений, где не было бы открытого кода. Он повсюду. В вашем телефоне, даже в проприетарных (принадлежащих разработчику. – «Ведомости. Инновации и технологии») решениях, которые продают вендоры, его тоже много, чуть ли не 70–80% (например, библиотеки). Это позволило взять какие-то наработки и на их базе что-то дальше делать.

– Получается, что собственное решение может быть и выгоднее, и дешевле, и быстрее?

– Быстрее – да. Контролируемее – да. Не всегда дешевле, потому что ты должен инвестировать в экспертизу. Но в целом это, конечно, долгосрочное конкурентное преимущество.

«Многие компании такой резкий рост нагрузки не переживают»

– У вас есть платформа Sage, которую вы продаете как ИТ-решение. То есть банк становится в некотором смысле уже IT-интегратором. Вы планируете развиваться в этом направлении? Какие еще IT-продукты собираетесь выводить на рынок?

– Действительно, мы утвердили для себя такую стратегию. С одной стороны, мы занимаемся внутренним скаутингом, то есть смотрим, какие решения, которые мы делали для своего бизнеса, могут быть интересны как отдельные решения на рынке. 

С Sage была ровно такая же история, это один из продуктов, который сильно поменял компанию внутри. Потому что это решение появилось как ответ на работу с надежностью и доступностью сервисов. Мы увеличили доступность за счет этого продукта в разы.

– А что вы имеете в виду под доступностью?

– Доступность – это бесперебойная работа высоконагруженных сервисов, она имеет интегральные метрики, в том числе оценку корректности процессов и систем. Мы ее улучшили в разы, в то время как нагрузка на сервисы выросла десятикратно. Это очень большой рост. Многие компании такой резкий рост нагрузки не переживают либо переживают плохо, со множеством инцидентов. 

Нам показалось это направление интересным. Мы предлагаем этот продукт рынку, и на него есть спрос. Это лишь одно из решений в нашей экосистеме. Есть и другие – более или менее зрелые продукты. Например, решение для управления инцидентами FineDog, которое хорошо дополняет Sage. Мы показывали его на ЦИПРе (форум в Нижнем Новгороде, прошедший в июне. – «Ведомости. Инновации и технологии»), оно получило хорошие отзывы. 

Есть инструмент для обнаружения аномалий – Analyzer. Он помогает автоматически, без дополнительной настройки выявлять отклонения от стандартного поведения в системе. В основе – технологии ИИ.

Среди новых решений – платформа Spirit для разработки. Мы представляли ее в рамках Индустриального центра компетенций. Это зрелый IT-продукт, который мы начинаем активно выводить на рынок.

Еще один пример – Safeliner, ассистент с ИИ, который анализирует исходный код, находит в нем ошибки и предлагает готовые исправления. Это экономит время и ускоряет выпуск новых функций.

– Вы видите спрос со стороны бизнеса на ваши продукты? 

– Это зависит от сегмента. Запрос от крупных компаний выше, потому что мы им интересны с точки зрения масштаба. Очень сложно найти какое-то технологическое решение, которое уже проверено на десятках миллионов пользователей, миллиардах транзакций и так далее. Поэтому такой интерес возникает, и мы на него и откликаемся. Но все-таки не хотим быть интегратором. Мы хотим быть вендором, фокусироваться на интеллектуальном продукте. И мы открыты для партнерств с интеграторами: они лучше знают конкретного клиента.

«ИИ-ассистенты играют на стороне клиента»

– Какую роль большие данные играют для банковского и для финансового бизнеса?

– Если бы вы задали мне этот вопрос 10 лет назад, я бы, наверное, пофантазировал. А сейчас данные в бизнесе настолько базовая вещь, что воспринимаются как Excel. В нашем случае анализ больших данных позволяет создавать сервисы на их основе. Например, дообучать наши большие языковые модели под специализированных ассистентов или гиперперсонализировать рекомендательные системы. 

В эту историю мы верим и хотим туда идти. В декабре прошлого года мы обновили мобильное приложение Т-банка. Все продукты и сервисы в приложении теперь собраны вокруг жизненных ситуаций: дом, автомобиль, шопинг, путешествия. При этом каждая сфера за счет рекомендательных систем сверхперсонализирована под каждого клиента отдельно и под его контекст.

То есть если у вас нет машины, в сфере «Авто» будет один набор продуктов и сервисов, если есть – другой. В рамках одной сферы вы можете закрыть все свои потребности – например, в «Авто» выполнить действия, связанные с вашей машиной, от оплаты за топливо до страховок и напоминаний о ТО. И в зависимости от машины там будут разные сервисы. Это один из примеров использования больших данных. 

Безусловно, они применяются для повышения внутренней эффективности компании. Если есть много данных и много клиентов, то когда мы на базе этих данных создаем модели, улучшаем и автоматизируем процессы, улучшается их экономика.

– Бизнес уже пришел к гиперперсонализации или еще нет?

– Вызовите такси в дождь, и вы увидите, как изменились тарифы. Модель учитывает большую загрузку. Даже на маркетплейсе для многих пользователей будут разные цены на один и тот же товар. Они будут отличаться, потому что это динамическое ценообразование, которое подстраивается под профиль конкретного человека.

– Хочется, чтобы искусственный интеллект обеспечивал всем одинаковые возможности…

– Одна из задач наших ИИ-ассистентов заключается в том, чтобы, например, за вас найти лучшее предложение. То есть ИИ-ассистенты не только экономят время, но действительно играют на стороне клиента, а не на стороне компании. Например, тревел-ассистент анализирует в интернете в том числе предложения, которых нет в контуре нашего приложения. 

– Как вы считаете, что наиболее перспективно для крупного бизнеса в хранении и обработке больших данных – облака, создание собственных дата-центров или какая-то иная модель?

– Все зависит от конкретной компании. Если она считает, что данные – основной актив, который позволяет в долгосрочной перспективе извлекать из него какую-то ценность и строить новые бизнесы, конечно, данные нужно хранить близко, то есть в собственной инфраструктуре, и в это надо инвестировать. 

У нас за последние 5–7 лет произошло кардинальное изменение в ландшафте инфраструктуры. Семь лет назад данные занимали 20% ландшафта, остальное – операционные сервисы, в частности эквайринг. Сейчас все ровно наоборот. Компания выросла многократно, при этом доля операционных сервисов сокращается, а данных – растет. Почему это важно? Сейчас из каждого набора данных можно делать новый бизнес, новые предложения для клиентов. 

Поэтому любыми данными, даже техническими отчетами о работе системы, мы дорожим, потому что это какой-то слепок поведения клиента или поведения системы. В совокупности они могут стать основой для будущего продукта. 

Есть еще и законодательные рамки, банковская тайна, закон о защите персональных данных. Все это тоже накладывает ограничения на возможности хранения данных в чужой инфраструктуре. 

У нас гибридная структура – есть своя большая инфраструктура и облачные провайдеры. Мы решили не идти в облака с данными по двум причинам: во-первых, мы считаем, что данные – наш самый ценный актив. А во-вторых, такое решение, как правило, невозвратное: если данные размещать в облаках, то их потом сложно оттуда забрать, так как их объем слишком большой. Мы решили, что в части данных останемся на своей инфраструктуре.

«Это была наша стратегия конкуренции с российскими игроками»

– Т-банк представил свою дообученную модель на базе Qwen. Это серия больших языковых моделей, разработанных китайской компанией Alibaba Cloud, которые открыты для доработки для других участников рынка. Почему вы делаете свою модель, а не используете существующие решения? И как вы ее используете сегодня?

– Наша стратегия – иметь полный цикл обучения в сочетании с наиболее эффективными способами переиспользования открытых моделей. Мы умеем и строить модели с нуля, и переиспользовать открытые модели. Результат получается лучше, чем при построении моделей с нуля, а ресурсов, которых всем не хватает, тратится в 10 раз меньше. 

Это была наша стратегия конкуренции с существующими российскими игроками – в первую очередь «Сбером» и «Яндексом», которые начали делать свои модели раньше нас. Мы решили не конкурировать напрямую и не повторять ту же стратегию. Чтобы создавать собственную инфраструктуру, нужны как минимум три ресурса: очень большие инвестиции, физическая инфраструктура и время. Это рискованные вложения с неясным возвратом. Поэтому мы сделали ставку на открытые большие языковые модели.

Мы начали эксперименты с их глубоким дообучением – это была новая область. Многие идеи, разработанные в нашем исследовательском центре T-Bank AI Research, стали уникальными для рынка. Например, метод дообучения на основе модифицированной оптимизации Trust Region улучшил качество ответов до 15% по сравнению с традиционными подходами. Результаты были представлены на конференции ICLR (International Conference on Learning Representations. – «Ведомости. Инновации и технологии»).

Модели и исследования мы выложили в открытый доступ. Наша цель – не зарабатывать на самих моделях, а создавать прикладные сервисы на их основе. Наши модели популярны в русскоязычном сегменте Hugging Face (платформа, где разработчики и компании выкладывают предобученные модели ИИ. – «Ведомости. Инновации и технологии»). Это помогает привлекать сильных специалистов и ускоряет развитие продуктов.

Стратегия оправдала себя с точки зрения эффективности затрат: адаптировать модель под конкретные задачи теперь дешевле и быстрее, а вложения уже частично окупились.

– А внутри компании как вы ее используете?

– У нас сейчас 80% сотрудников пользуются так или иначе ИИ-решениями, в том числе и этой моделью. И мы хотим уже в следующем году довести эту цифру до 100%, чтобы каждый сотрудник ежедневно использовал сервисы или помощников, которые работают на основе наших больших языковых моделей, автоматизировал и делегировал им рутинные задачи. 

Сейчас мы активно развиваем копайлот-решения (ассистенты на базе ИИ. – «Ведомости. Инновации и технологии») для сотрудников и видим, что они востребованы. Например, ИИ-ассистент Nestor был выпущен в конце 2023 г. для сотрудников Т-банка. Каждый день его используют более 60% разработчиков компании. То есть мы помогаем им писать код, исправлять какие-то ошибки. Есть сценарии переписывания кода со старых языков программирования на новые, это тоже делается с помощью этих ассистентов. И можно приводить много таких примеров: есть сервис, который помогает дизайнерам создавать креативы, есть сервисы, автоматизирующие типовые запросы в поддержке, и так далее.

«Инфраструктура каждый год удваивается»

– В 2024 г. сообщалось, что группа «Т-Технологии» создаст собственную сеть дата-центров. Что уже сделано?

– Сейчас закончено проектирование и завершается тендер по выбору генерального подрядчика. Строительство будет идти на двух площадках: в Доброграде Владимирской области – там мы договорились, что тепло, вырабатываемое ЦОДом, будет использовано для отопления города. И вторая – в экономической зоне Серпухов. Строительство каждого из дата-центров будет состоять из трех очередей. Мы уже начали подготовительные земельные работы на этих площадках, подъездные пути готовы. С 1 августа начнется активная стройка. Мы получили условия технологического присоединения от Россетей, мощность подстанций по проекту – по 50 МВт на каждый ЦОД. Первую очередь мы планируем запустить в I квартале 2027 г.

– Вы параллельно в двух регионах ведете строительство?

– Да. Третий смотрим на всякий случай.

– Насколько сейчас вырос спрос на мощности ЦОДов?

– Cколько существует Т-банк, инфраструктура его каждый год удваивается. Вот сегодня она в два раза больше, чем в прошлом году. А в прошлом году в два раза больше было, чем в позапрошлом. Такой рост требует пропорционального увеличения мощностей ЦОДа.

Отчасти мы решили свою инфраструктуру развивать, потому что на рынке не оказалось уже игроков, которые профессионально занимаются ЦОДами и могли бы предоставить необходимые нам мощности быстро. Оператору ЦОДов тоже пришлось бы строить новые мощности под нас. Мы же можем спроектировать ЦОД для себя намного эффективнее, дешевле и быстрее, без оглядки на потребности других заказчиков. Вообще, наша задача – научиться строить ЦОД за шесть–девять месяцев.