ИИ требует все больше: как облачные сервисы помогают бизнесу справляться с дефицитом мощностей
Ожидается, что рынок аренды ML-платформ будет расти на десятки процентов ежегодноРост интереса к генеративному искусственному интеллекту и большим языковым моделям (LLM) привел к взрывному спросу на высокопроизводительные вычисления, отмечают эксперты. Все больше компаний переходят к модели потребления графических процессоров и платформ машинного обучения в формате облачного сервиса. Так, глобальный рынок Machine Learning as a Service (машинное обучение как услуга; MLaaS) в 2024 г. оценивался в $9,6 млрд и, по прогнозу аналитиков Research and markets, будет расти в среднем на 25,88% в год, превысив $84,1 млрд к 2033-му. Параллельно развивается сегмент Graphics Processing Unit as a Service (графический процессор как услуга; GPUaaS), драйвером которого стал дефицит графических ускорителей: по данным Grand View Research, рынок GPUaaS к 2030 г. вырастет до $12,26 млрд с $3,8 млрд в 2024-м.
Российский рынок повторяет глобальный тренд. По словам ведущего научного сотрудника Президентской академии Петра Отоцкого, отечественная ИИ-индустрия тоже испытывает дефицит вычислительных мощностей. По данным исследования «К2Тех», в 34% компаний говорят о нехватке готовых инфраструктурных решений для развертывания ИИ.
Почему бизнес уходит в облако
Дефицит мощностей – «решаемая задача», особенно с распространением модели «ИИ как сервис», отметила вице-президент «Опоры России», председатель комитета организации по информационным технологиям Елена Волотовская. На российском рынке присутствуют локальные облачные провайдеры, предлагающие услуги доступа к GPU- и MLOps-платформам, включая K2 Cloud, Cloud.ru (бывший SberCloud), Yandex Cloud, VK Cloud Solution.
Основными сдерживающими факторами внедрения ИИ остаются кадровый дефицит и высокий порог входа, полагают эксперты. «Не хватает специалистов, которые умеют переводить бизнес-задачи на язык технологий и наоборот», – говорит Волотовская. Почти половина организаций в России испытывают трудности с наймом профильных ИИ-специалистов, уточнил член генерального совета «Деловой России», генеральный директор компании «Крайон» Вадим Юн, сославшись на исследование НИУ ВШЭ.
В таких условиях модель потребления ИИ как сервис (AI/MLaaS) становится ключевым драйвером демократизации технологий, полагают эксперты. «Это именно тот подход, который снимает основные барьеры: не нужно строить свою инфраструктуру и нанимать дорогих узких специалистов», – считает Волотовская. Модель позволяет компаниям начинать с малого: подписаться на один конкретный сервис для анализа отзывов или прогнозирования спроса и масштабироваться по мере необходимости. Такая модель наиболее востребована для малого и среднего бизнеса, когда крупные компании чаще делают выбор в пользу собственных разработок, добавил партнер и руководитель группы по работе с телекоммуникационными, медиа и технологическими компаниями ДРТ Григорий Дубровский.
Действительно, для компаний, не готовых к крупным капитальным затратам, модель MLaaS выглядит наиболее предпочтительно, согласен директор технологической практики «ТеДо» Арсений Груздев. «Критически важным условием при этом является обеспечение информационной безопасности», – подчеркнул он. Эксперт назвал перспективной схему, при которой данные хранятся у заказчика, а вычисления производятся в облаке провайдера. Подобный подход уже успешно работает, например в госсекторе (ассистент МАКС в «ГосУслугах»).
Сервисная модель как ответ на вызовы
Российские вендоры уже отвечают на вызовы рынка. Так, ML-платформу «К2 НейроТех» интегрировали в экосистему «K2 Облако». Теперь пользователи могут получить доступ к инструментам для автоматизации управления жизненным циклом ML-моделей на базе высокопроизводительной платформы с GPU из облака без капитальных затрат в собственную инфраструктуру, пояснил представитель разработчика. «Основное препятствие для компаний на пути внедрения и развития собственных ИИ-проектов – высокий порог входа», – отметил директор K2 Cloud Сергей Зинкевич.
Решение включает предустановленные среды разработки, платформу для управления кодом и инструменты для подготовки данных, обучения, валидации и мониторинга моделей, уточнили в компании. «Благодаря предустановленным и настроенным MLOps-инструментам начать работу с машинным обучением можно буквально за 20 минут», – подчеркнул руководитель подразделения «К2 НейроТех» Святослав Смирнов.
Также K2 Cloud предлагает и услугу GPUaaS, позволяющую арендовать графические процессоры (H100, L40s, t4 и др.) по модели оплаты по факту потребления (PAYG) или с коммитрованными контрактами со скидкой, уточнили в компании. Там пояснили, что это может решать проблему быстрого морального старения оборудования. Средний срок жизни ИТ-платформ сегодня составляет пять лет, а в контексте GPU и скорости их развития – это год-два максимум, уточнил Зинкевич. Аренда же позволяет использовать современные карты без необходимости их закупки и обслуживания.
Ландшафт рынка: от инфраструктуры до платформ
Другие крупные игроки рынка также развивают свои ML-экосистемы. Так, Cloud.ru предлагает сервис ML Space, предназначенный для совместной разработки моделей, воспроизводимых экспериментов, деплоя и мониторинга, с доступом к GPU-кластерам своего AI-облака. Кроме того, у компании есть платформа Evolution AI Factory, где собраны фундаментальные модели, инструменты и готовые сценарии, отметил генеральный директор Cloud.ru Евгений Колбин.
Yandex Cloud также развивает направление ML-сервисов. «Облачная инфраструктура позволяет получить доступ к готовым генеративным моделям, опенсорсным решениям и инструментам ML-разработки в единой среде. Это снижает порог входа, упрощает тестирование и внедрение ИИ», – отмечает руководитель продуктового ML-направления Yandex Cloud Артур Самигуллин. В компании добавили, что среди наиболее популярных сценариев использования генеративных моделей на платформе – написание кода, автоматизация поддержки, поиск информации по базам знаний, подведение итогов встреч. С помощью речевых технологий бизнес автоматизирует контакт-центры: компании создают голосовых ассистентов для коммуникации с клиентом, а также анализируют диалоги с помощью ИИ, чтобы выявить инсайты и ключевые причины обращения в поддержку, добавил представитель платформы.
Чтобы оценить динамику спроса на GPUaaS и MLaaS в России, руководитель лаборатории ИИ Школы управления «Сколково» Александр Диденко предложил взглянуть на финансовые отчетности облачных провайдеров. «В открытом доступе можно найти цифры по Yandex Cloud и Selectel. Обе компании показывают существенный рост: порядка 30–50%», – заметил он. Постепенно растет спрос и на «автономный» MLOps (технология автоматического создания моделей машинного обучения), так как он значительно упрощает задачи по обучению и внедрению моделей, добавил руководитель проектов развития AI компании Directum Илья Петухов.
48% компаний используют ИИ в IT, 47% – в разработке, 47% – в маркетинге, отметил директор департамента профессиональных сервисов «Базис» Денис Романов, сославшись на исследование AI Index 2025. Наибольший потенциал для внедрения ML-платформ – в дизайне и разработке сайтов, юридических консультациях, внедрении анализа переписки и телефонных разговоров с клиентами, расшифровке медицинских исследований, полагает IT-директор Института AIRI Константин Катанов. «Все это так или иначе связано с анализом и генерацией текстов и изображений, которым соответствует тренд на развитие мультимодальных моделей», – пояснил эксперт.
Сценарии использования и отрасли
Наиболее востребованные сценарии использования MLaaS – быстрые эксперименты (Proof-of-Concept, PoC), дообучение (fine-tuning) моделей под конкретные задачи, периодическое обучение с масштабированием ресурсов и продуктивный инференс, говорят эксперты. По словам аспиранта департамента прикладной математики НИУ ВШЭ Дениса Веденского, среди отраслей лидерами являются финансовый сектор и ритейл. «В финансах ИИ уже стал стандартом для скоринга и антифрода, и там потенциал только растет. В ритейле ключ – персонализация и прогнозирование спроса», – отметил он. Волотовская добавила к перечисленному автоматизацию документооборота, проверку контрагентов и скоринг заявок.
Промышленность проявляет интерес, но отстает из-за сложности интеграции. «В промышленности и энергетике интерес все больше смещается в сторону предиктивной аналитики: там экономия ресурсов и снижение рисков от аварий действительно ощутимы», – говорит Веденский.
Риски и управленческие практики
Несмотря на преимущества, модель облачных ML-сервисов несет в себе и риски. «Зависимость от одного поставщика, вопросы безопасности данных и стоимость. Вендор-лок-ин может сильно связать руки, особенно если бизнес растет и требования меняются», – предупреждает Веденский. Другие проблемы – обеспокоенность компаний безопасностью передачи данных в облако и необходимость соблюдения регуляторных требований, таких как закон «О персональных данных». Впрочем, проблема с рисками по соблюдению ФЗ-152 закрывается наличием (соответствующего сертификата о соответствии закону у провайдера, добавил Зинкевич. Он посоветовал внимательно подходить к выбору провайдера и проверять сертификаты.
Для управления затратами и рисками эксперты рекомендуют внедрять практики FinOps: они объединяют финансовые, технические и бизнес-команды для повышения эффективности cloud-расходов. «FinOps становится критически важной практикой. Нужно постоянно мониторить потребление ресурсов, оптимизировать запросы, использовать различные тарифные планы, чтобы избежать неконтролируемых затрат», – советует Волотовская.
Прогнозы: рост автоматизации и вертикальных решений
Эксперты сходятся во мнении, что спрос на MLaaS в России продолжит увеличиваться. «Спрос на GPUaaS/MLaaS в России будет расти, особенно на решения, соответствующие требованиям по локализации данных», – прогнозирует ведущий эксперт Центра искусственного интеллекта «СКБ Контур» Дмитрий Иванков. Ключевые тренды – автоматизация всех стадий жизненного цикла ML-моделей, появление платформ, внедряемых по модели частного облака для госсектора и корпоративных клиентов, добавил заместитель генерального директора Astra Cloud Константин Анисимов.
Будущее рынка связывают с автоматизацией MLOps и появлением отраслевых решений. «Инструменты будут настолько упрощены, что использовать их смогут не только технические специалисты, но и обычные бизнес-аналитики. Будут развиваться отраслевые решения», – считает продакт-менеджер компании «Нанософт» Ольга Кутузова.
«Автономный» MLOps, где пайплайны обучения и внедрения моделей максимально автоматизированы, становится необходимостью. «Спрос на автономный MLOps будет расти. Причины: модели становятся сложнее, а циклы обновлений – короче; нехватка кадров», – заключает Романов.
Таким образом, облачные ML-платформы и сервисы аренды GPU становятся критически важной «прослойкой», которая позволяет бизнесу любого масштаба преодолеть технологические и кадровые барьеры на пути внедрения искусственного интеллекта, фокусируясь на решении прикладных задач, а не на построении инфраструктуры, заключил Зинкевич.