ИИ уткнулся в мощности

Как облачные провайдеры решают главную проблему рынка
Freepik
Freepik

Компании проявляют все больший интерес к технологиям искусственного интеллекта (ИИ или AI). Это неудивительно: он позволяет им автоматизировать задачи, обрабатывать большие объемы данных, находить скрытые закономерности и на основе этого принимать решения.

Дорогой ресурс

Однако чем активнее организации наращивают свои возможности в области ИИ, тем больше вычислительных ресурсов требуется, показывает анализ консалтинговой компании Deloitte.

Это меняет требования к IT-инфраструктуре: центры обработки данных (ЦОД) для задач искусственного интеллекта требуют сочетания высокой вычислительной мощности, пропускной способности сети, а также мер по оптимизации энергопотребления, отмечал производитель программного обеспечения Cisco.

Международное энергетическое агентство приводит наглядный пример: типичный специализированный дата-центр для ИИ-вычислений потребляет столько же электроэнергии, сколько 100 000 домохозяйств, а находящиеся в стадии строительства крупнейшие ЦОД, спроектированные под возрастающие потребности в мощностях для ИИ-задач, будут потреблять в 20 раз больше.

Отдельной задачей становится масштабируемость инфраструктуры, то есть создание IT-среды, которая будет расти вместе с проектом. По мере роста ИИ-проектов увеличиваются объемы обрабатываемых данных, усложняются модели, возрастают вычислительные нагрузки – при этом IT-инфраструктура должна сохранять стабильность и эффективность.

Проведенный техгигантом IBM опрос более 1200 топ-менеджеров по всему миру показал: только 8% респондентов считают, что их текущая инфраструктура отвечает всем потребностям ИИ-вычислений.

Растущие потребности в мощностях приводят к дефициту ресурсов: спрос на графические процессоры (GPU), необходимые для запуска AI-проектов, существенно опережает предложение, писал разработчик IT-решений TrinWare. GPU служат своего рода «мозгом» для систем ИИ, обеспечивая вычислительную мощность, необходимую для обработки огромных массивов данных.

Растущая интеграция технологий ИИ в бизнес-процессы, обусловленная этим потребность в расширении инфраструктурных возможностей влияют и на стоимость строительства дата-центров. Инвестиции в «стандартный» ЦОД измеряются несколькими миллионами долларов, а небольшой дата-центр для нужд ИИ обойдется минимум в $10 млн, приводит цифры EziBlank, производитель оснащения для них. Среди самых дорогих объектов инжиниринговая компания GBC называет крупнейший в мире по площади ЦОД China Telecom в Китае (инвестиции около $3 млрд) и специализированный центр обработки данных Агентства национальной безопасности в США ($1,5 млрд). Его отличает повышенный уровень защиты и секретности.

Россия – в общемировом тренде. Аналитики Совкомбанка ожидают, что совокупные затраты на расширение и поддержание дата-центров в нашей стране к 2030 г. достигнут 6,7 трлн руб., около четверти из них придется именно на ЦОДы для вычислительных задач AI-проектов.

Аренда как решение

Российский рынок больших данных и искусственного интеллекта в 2024 г. вырос на 33%, до 433 млрд руб., подсчитала Ассоциация больших данных. При оценке учитывался спрос на услуги, программное обеспечение, а также IT-инфраструктуру.

Спрос на мощности растет экспоненциально: в ближайшие два-три года он увеличится в три–шесть раз, рассказал генеральный директор разработчика информационных технологий «Диджитал Маркетс» Илья Назаров изданию «Ведомости. Инновации и технологии». Он объясняет: компании переходят от пилотных проектов к интеграции ИИ в продукты, что потребует сотни тысяч современных GPU.

Все это говорит о дальнейшем фундаментальном росте рынка, считает Александр Тугов, директор AI-вертикали Selectel, провайдера сервисов IT-инфраструктуры. Именно поэтому компания до 2031 г. планирует направить 10 млрд руб. к уже вложенным 3,5 млрд руб. в закупку специализированного оборудования для работы с AI, развитие собственных дата-центров и R&D – то есть исследования и разработки, говорит он.

ИТ-инфраструктура – это не только аппаратное и программное обеспечение, но и процесс управления ею, то есть возможность ее масштабировать, обеспечивая бесперебойную работу ИТ-сервисов бизнеса с соблюдением всех требований безопасности.

Сейчас есть три основных варианта организации ИТ-инфраструктуры: облачный (аренда вычислительных мощностей и сервисов у стороннего провайдера), локальный (размещение инфраструктуры в собственных серверных или дата-центрах) и гибридный (сочетающий оба варианта).

Готовые облачные платформы и аренда оборудования – это долгосрочная модель для 70–80% задач бизнеса, говорит Назаров. Исследование IDC показывает: во втором квартале 2025 г. расходы организаций на инфраструктуру для развертывания ИИ-моделей выросли на 166% год к году, до $82 млрд. Причем более 84% этих расходов пришлось на инфраструктуру, развернутую в облаке и общих средах.

Аренда мощностей выгодна для бизнеса по двум ключевым параметрам – это финансовая эффективность за счет растянутых во времени затрат (OPEX) и скорость развертывания, отмечает представитель IT-холдинга Fplus. «В облаке можно быстро начать работать, тогда как организация даже собственной серверной занимает недели, а строительство дата-центра – минимум полгода», – пояснил он.

Для бизнеса ключевая ценность уже готовой инфраструктуры для ИИ – снижение порога входа в новые технологии, согласен Назаров. Теперь компании любого масштаба могут запускать AI-проекты без многомиллионных инвестиций в собственную IT-инфраструктуру и содержание редких специалистов, отметил он.

Еще одно преимущество – гибкость в использовании ресурсов: возможность оперативно масштабировать мощности под изменяющуюся нагрузку, арендовать их на короткий срок, например для проведения экспериментов, считают опрошенные журналистами эксперты.

«Аренда облачных платформ – единственная массовая альтернатива для экспериментов, R&D и MLOps», – говорит директор Центра развития цифровых технологий фонда «Сколково» (группа ВЭБ.РФ) Александр Фетисов. Под последним термином понимают инструменты и процессы для управления полным жизненным циклом моделей машинного обучения.

В России специализированную инфраструктуру для внедрения технологий ИИ в бизнес-процессы предлагают крупнейшие российские облачные провайдеры, такие как Yandex Cloud, Selectel, Cloud.ruи VK Cloud. Эти компании предлагают как вычислительные мощности с GPU, так и преднастроенные решения для различных ИИ-задач – от обучения, тестирования и масштабирования ML-моделей до работы с большими языковыми моделями (LLM), системами генерации речи и другими AI-инструментами.

Такие сервисы позволяют бизнесу быстро запускать проекты в сфере ИИ без сложной разработки с нуля, экономить на оборудовании, снижать технологические риски и масштабировать ресурсы по мере необходимости, рассказывают работникам приложения «Ведомости. Инновации и технологии» опрошенные эксперты.

Кроме того, компании, которым важно сохранить контроль над физической инфраструктурой и соответствовать повышенным требованиям к безопасности, могут арендовать инфраструктуру по модели HaaS (Hardware as a Service). Это значит, что провайдер передает клиенту оборудование в аренду для размещения на площадке заказчика и полностью отвечает за его обслуживание и обновление, рассказывает Тугов.

По словам эксперта, такой подход особенно востребован у промышленных предприятий, финтех-компаний, крупных ритейлеров и структур, работающих с чувствительной корпоративной информацией. Им HaaS позволяет получить доступ к современному оборудованию без капитальных затрат, при этом сохранив полный контроль над своей ИТ-средой.

Услуги профессиональных провайдеров актуальны для компаний различных отраслей и масштаба при решении широкого спектра задач, связанных с внедрением и использованием ИИ.

Например, IT-разработчик RobotMIA развернул голосовые AI-роботы для обработки звонков клиентов на облачных GPU-мощностях. Решение позволило ему масштабировать проект без многомиллионных капитальных затрат на оборудование и обеспечило отказоустойчивость сервиса, то есть его непрерывную работу без сбоев и простоя.

Это только один из примеров использования ИИ для решения задач бизнеса. Ритейлерам эта технология помогает прогнозировать спрос, персонализировать предложения для клиентов и управлять ценообразованием, писал разработчик ПO – компания SAP. Это достигается в том числе за счет обучения нейросетей. Компания EasyMerch, разрабатывающая AI-решения для мерчандайзинга, использует для этого выделенные серверы с GPU, сообщал Selectel.

Разработчик первого российского серийного электромобиля «Атом» использует вычислительную инфраструктуру Selectel для разработки IT-сервисов автомобиля, в частности системы помощи водителю (ADAS) и дата-платформы, рассказывает инженер по машинному обучению и операционной поддержке программного обеспечения в «Атоме» Владислав Ладенков. Аренда мощностей позволила с первого же дня запускать ML-эксперименты и разворачивать модели машинного обучения (то есть размещать их в рабочей среде для тестирования и эксплуатации). У компании есть возможность хранить большие объемы данных, легко масштабировать и бесперебойно эксплуатировать собственное ПО, а за счет применения мощных GPU-серверов разных конфигураций «Атом» получает более качественные ML-модели, говорит Ладенков.

«Использование готовой облачной инфраструктуры для AI освобождает компании от необходимости нанимать узкопрофильных специалистов и инвестировать в собственное оборудование. Это позволяет быстрее выводить продукты на рынок и сосредоточиться на росте бизнеса, а не на инфраструктурных задачах», – резюмирует представитель Selectel.