Альфа-Банк первым на рынке запустил GPUaaS (GPU-as-a-Service) в multi-cloud режиме с поддержкой GPUDirect и применением сетевой сегментации для высокоскоростных сетей Infiniband в среде Kubernetes на базе собственных инженерных решений. Платформа была реализована за три месяца и объединила собственные и облачные вычислительные ресурсы банка в единую управляемую систему. GPUaaS стал технологическим фундаментом для GenAI-сервисов всего банка и обеспечивает высокий уровень ИТ-сопровождения и развития инфраструктуры.
Решение отвечает на стремительное развитие генеративного ИИ, который становится ключевым драйвером развития рынка и бизнеса. Рост количества ИИ-агентов и интеллектуальных сервисов требует всё больших вычислительных ресурсов и более гибкого управления ими. Запуск платформы позволил перейти от точечных внедрений к централизованной модели использования ИИ-инфраструктуры. Теперь бизнес-подразделения получают доступ к генеративному ИИ как к сервису — без необходимости закупать оборудование под каждый отдельный проект.
На базе GPUaaS уже работают корпоративная ГенИИ-платформа AlfaGen, сервис Alfa AI, инвестиционные ИИ-агенты, агенты клиентской поддержки, а также ИИ-агенты для повышения эффективности разработки, включая автотестирование и проверку кода. Платформа построена на собственных разработках банка и Open Source-решениях. Это обеспечивает технологическую независимость, высокую производительность при работе с большими языковыми моделями и позволяет гибко масштабировать ИИ-сервисы для разных команд и бизнес-задач.
Подобные инфраструктурные решения с использованием микросервисов и высокоскоростных сетей Infiniband, технологии передачи данных между вычислительными узлами с минимальной задержкой, ранее не были представлены на российском рынке. Платформа была создана с нуля на основе собственных разработок и Open Source-технологий.