Как российский бизнес внедряет искусственный интеллект

Собственные фундаментальные ИИ-модели развивают лишь некоторые компании

Алексей Орлов / Ведомости

Две трети крупных российских компаний уже внедрили генеративный искусственный интеллект (ИИ) минимум в одну функцию бизнеса, говорилось в отчете «Искусственный интеллект в России – 2025». Но из-за высоких затрат на обучение лишь некоторые из них развивают собственные фундаментальные модели, отмечает партнер «Яков и партнеры», глава практики ИИ и высоких технологий Максим Болотских. Крупные технологические компании могут предоставлять доступ к своим моделям через облачные платформы, при этом многие отраслевые игроки формируют собственные ИИ-компетенции, основываясь на открытых и коммерческих моделях, продолжает он (подробнее см. инфографику).

Собственная модель: масштаб требует контроля

Базовые модели, прошедшие самостоятельный этап предварительного обучения на больших объемах данных, есть, как правило, лишь у крупного бизнеса. В России обученных с нуля моделей насчитывается три-четыре, говорит Григорий Дюкарев, менеджер по развитию бизнеса Landev AI, разработанной группой «Ланит» платформы для создания ИИ-сервисов.

Обучение современных ИИ-моделей – это многоэтапный процесс, говорит представитель «Яндекса», разработавшего несколько базовых моделей. Сначала ИИ проходит базовое обучение на больших данных, после чего модель дообучают при помощи экспертов, механизмов обратной связи и специальных процедур выравнивания поведения моделей. «После запуска они регулярно совершенствуются, что позволяет повышать качество ответов, расширять функциональность и поддерживать актуальность знаний», – рассказывает он.

Дюкарев оценивает: обучение одной передовой модели стоит десятки, если не сотни миллионов долларов, такие ресурсы есть лишь у ограниченного числа компаний – банков, страховых компаний и фондов. Их к разработке собственных моделей кроме всего прочего подталкивает и необходимость защиты конфиденциальной информации о клиентах, добавляет руководитель отдела прототипов и исследований компании «Онланта» (входит в группу «Ланит») Петр Рыляков.

Рынок фундаментальных моделей уже давно не ограничивается только текстовыми нейросетями. Мировые разработчики параллельно создают мультимодальные системы, способные работать с текстом, изображениями, аудио и видео.

Крупные технологические компании нередко предоставляют свои модели – платно или бесплатно – сторонним игрокам или обычным пользователям. У компании OpenAI есть модель GPT-5.5, которая умеет не только отвечать на вопросы, но и планировать сложные действия. У Anthropic – нейросеть для генерации текста, изображений, презентаций, написания кода и т. д. Claude Opus 4.7, у Google – Gemini 3.1 Pro, разработанная для глубокого анализа данных.

В России собственные фундаментальные модели генеративного ИИ разрабатывают два игрока (см. инфографику). Крупнейший из них, согласно данным исследовательской компании Aiport, «Яндекс», который создал несколько поколений моделей YandexGPT, YandexART и YandexVLM, а также новое семейство нейросетей Alice AI, куда входят текстовая Alice AI LLM, визуально-языковая Alice AI VLM, диффузионная (для создания изображений) Alice AI ART и поисковая Alice AI Search. Сейчас «Яндекс», говорит его представитель, работает над созданием омнимодели, объединяющей разные типы данных в единую архитектуру. Свои решения предлагает и «Сбер»: текстовый GigaChat и для генерации изображений – Kandinsky. Компания адаптировала GigaChat для нужд бизнеса, эту версию используют операторы контактного центра Сбербанка, сообщал он. GigaChat, в частности, помогает сотрудникам анализировать обращения клиентов и искать материалы в базе знаний, что позволило повысить производительность на 7%.

Чужая модель: если в приоритете скорость

Большинство компаний, используя готовые модели, довольно быстро, за один-четыре месяца, запускают генеративный ИИ, сообщалось в статье MсKinsey «Быстрое внедрение Gen AI». При необходимости доработок, кастомизации и реализации на базе стороннего решения собственного этот срок превышает пять месяцев.

Сбор и подготовка данных, поиск источников, агрегирование, очистка, маркировка данных занимают от 60 до 80% всего срока реализации проекта, писали аналитики цифрового агентства XsOne Consultants в стратегическом руководстве по срокам разработки ИИ-моделей. Этот факт плюс дороговизна разработки моделей подталкивает бизнес к использованию готовых решений.

По оценкам участников рынка, именно адаптация существующих моделей сегодня стала основным каналом внедрения генеративного ИИ в корпоративном секторе. Большинство компаний не создают собственные фундаментальные модели, а дообучают или настраивают уже существующие решения под внутренние данные, отраслевую терминологию и конкретные бизнес-процессы – от клиентской поддержки и документооборота до комплаенса и аналитики. Такой подход позволяет существенно сократить сроки запуска проектов и снизить инвестиции по сравнению с разработкой собственной модели с нуля, считает Александр Горный, сооснователь ShareAI и momeditation.app.

«Чаще всего обучение или дообучение моделей необходимо там, где специфика решаемых задач сильно отличается от задач общего назначения и разработки, на которые сейчас делается основной упор мировыми ИИ-вендорами», – рассказал ML-директор Positive Technologies Андрей Кузнецов.

К областям, в которых нужен индивидуальный подход в работе с ИИ, руководитель департамента больших данных СДЭК Дмитрий Ширшаков относит медицину, высокотехнологичное производство, логистику. «Здесь требуется глубокое погружение в отраслевую специфику, терминологию и бизнес-процессы. В этих случаях компании строят полностью собственные решения. Это оправданно, когда точность, безопасность и закрытость данных выходят на первый план или если интеграция с внутренними системами строго регламентирована», – пояснил он.

Универсальные языковые модели не всегда учитывают специфику задач и в кибербезопасности. «В нашей отрасли используются специализированные знания, значительная часть данных недоступна в открытых источниках, а скорость обработки и анализа информации критически важна», – отметил Кузнецов.

Например, «Лаборатория Касперского» сообщала, что для ИИ-ассистента KIRA, ориентированного на бизнес, они выбрали модель GigaChat 2.0. KIRA может создать краткое описание события, зафиксированного антивирусом, оценить степень риска и помочь выстроить приоритеты по угрозам. При серьезных инцидентах счет идет на минуты, даже постепенное улучшение качества анализа напрямую влияет на скорость реагирования и уровень защиты, объяснял технический директор «Лаборатории Касперского» Антон Иванов.

Для бизнеса ИИ становится частью инфраструктуры, и на первый план выходят стоимость, скорость и предсказуемость работы, особенно в задачах, где есть высокий поток однотипных запросов, говорит представитель «Яндекса». Например, модель Alice AI LLM Flash оптимизирована под наиболее массовые бизнес-сценарии, прежде всего работу с текстами и документами, которые формируют около 60% запросов от бизнеса к моделям «Яндекса», резюмирует представитель IT-компании.

Open-source: когда нужна независимость

Порядка 86% внедряющих большие языковые модели компаний, которых опросили «Яков и партнеры», используют open-source решения в связи с достаточно высоким качеством, отсутствием законодательных или санкционных ограничений, а также прямых платежей за их применение, говорит Болотских.

Развитие open-source экосистемы стало одним из главных факторов развития генеративного ИИ. Кроме моделей с открытым исходным кодом бизнес также использует модели с «открытыми весами» (в них публично доступны только финальные параметры обученной модели, но закрыт полный код обучения. – «Ведомости. Инновации и технологии»), говорит руководитель дирекции по разработке и внедрению программного обеспечения IT-компании «Инфосистемы джет» Максим Андрианов.

Использование модели с открытыми весами уже стало стандартом в индустрии, говорит генеральный директор Telecom Daily Денис Кусков. Как правило, к ней прибегают для сокращения затрат перед основными этапами обучения. От дообучения (fine-tuning), самого популярного вида адаптации открытых моделей, инициализация открытыми весами отличается наличием более сложных и вычислительно затратных этапов – базового этапа обучения pre-training и обучения методом проб и ошибок reinforcement learning. При таком подходе открытые веса, которые брались за основу на старте, полностью пересчитываются на основе собственных данных компании, утверждает Кусков.

Использование open-source моделей и моделей с открытыми весами в разы сокращает время выхода решений на рынок, требует существенно меньше вложений и позволяет создать несколько моделей под разные задачи, объясняет Андрианов.

В генеративном ИИ open-source модели и модели с открытыми весами часто выбирают те компании, для которых критичны контроль над данными, развертывание в собственном контуре, независимость от внешних облаков и предсказуемая экономика, рассказывает директор по развитию технологий ИИ компании FabricaONE.AI (ее акционер – ГК «Софтлайн») Николай Тржаскал. «Open source не делает проект бесплатным – инфраструктура, адаптация, сопровождение, безопасность и контроль качества требуют расходов», – отметил он.

Модели с открытым исходным кодом часто предпочитают игроки из сфер онлайн-ритейла, онлайн‑игр, а также телекомоператоры, рассказывает Рыляков. «Для них критичен быстрый вывод продукта на рынок и гибкость в настройке под конкретные бизнес‑сценарии. Все модели развертываются в закрытой инфраструктуре компании, собственных дата‑центрах и облачных кластерах с изолированным доступом, что гарантирует соответствие требованиям информационной безопасности и исключает риск утечки конфиденциальных данных», – рассказал эксперт.

«Т-технологии» на базе open-source модели Qwen 3 32B, разработанной китайской Alibaba, создали свое решение T-Pro 2.0, сообщала компания. Эта модель применяется для разработки чат-ботов, автоматического перевода и анализа текста, создания контента, поддержки в программировании. Разработчики «Т-технологий» научили T-Pro 2.0 выдвигать гипотезы и самостоятельно их отвергать.

Большая языковая модель Avito под названием A-Vibe базируется на открытой модели Qwen3-8B-Base, сообщала компания в своем аккаунте в сообществе Hugging Face, посвященном машинному обучению и ИИ. Разработчики из Avito адаптировали Qwen3-8B-Base под русский язык и домен «Авито». Сервис поставил перед A-Vibe задачу определить, насколько клиент готов к покупке автомобиля, и посоветовать дилерам, как улучшить обслуживание в контактном центре. Предварительно A-Vibe прошла обучение на обработанном массиве данных специализированных терминов и обезличенных записях телефонных диалогов клиентов с менеджерами по продажам машин. Модель уже приносит до 30% готовых к покупке клиентов, отмечалось в пресс-релизе Avito.

Мультимодельная среда

Сегодня конкуренция идет не столько между моделями, сколько между подходами к их использованию, говорит Болотских. «Рынок движется не к доминированию одной технологии, а к гибридной архитектуре, где успех определяется не наличием собственной большой языковой модели, а способностью быстро интегрировать доступные технологии в конкретные бизнес-процессы и продукты», – рассказывает он. Крупные игроки все чаще совмещают несколько ролей одновременно: развивают собственные технологии, адаптируют открытые модели под специализированные задачи и предлагают готовые сервисы для бизнеса.

Для зрелого бизнеса основной вопрос заключается в том, какая архитектура позволит контролировать качество, данные, экономику и ответственность перед клиентами, акционерами и регуляторами, считает Тржаскал.

Еще одним заметным трендом, по мнению Кускова, становится движение рынка к большей открытости и глобализации разработки. Международные и российские технологические компании опираются на наработки друг друга, а конкуренция идет за лучшее их применение. «Все больше компаний будут публиковать свои разработки в открытом доступе для ускорения развития отрасли. Такой подход уже используют и крупные российские игроки: например, «Яндекс» разместил в open-source ряд своих базовых моделей, включая YandexGPT 5 Lite и YandexGPT Instruct, «Сбер» – модели GigaChat Ultra-Preview и GigaChat Lightning», – говорит эксперт.

Российский бизнес в краткосрочной перспективе будет присматриваться к отечественным решениям и open-source моделям, полагает старший юрист Intana Legal Люцина Доу-Гуан-Хун. «Опыт показывает, что иностранные разработчики и операторы сервисов могут ограничивать доступ к своим продуктам, прекращать техническую поддержку, приостанавливать действие лицензий или вводить иные ограничения. Такие обстоятельства создают для российского бизнеса дополнительные юридические и финансовые риски», – объяснила она.

Некоторые иностранные поставщики могут лишь декларировать высокий уровень защиты и конфиденциальности, подчеркивает доктор экономики, профессор, советник ректора Российского государственного социального университета Константин Поздняков. Для компаний на ближайшее время актуальным остается вопрос, где физически и юридически находится инфраструктура, кто имеет доступ к данным, как работает логирование, можно ли провести аудит, ограничить обучение модели на корпоративных данных, быстро отключить сервис или перенести его в закрытый контур, отметил Поздняков.

«В результате российский рынок генеративного ИИ движется к модели технологического разнообразия, где одновременно сосуществуют собственные фундаментальные разработки, коммерческие облачные сервисы и open-source решения», – считает Горный. По его мнению, выбор конкретного подхода все чаще определяется не принадлежностью технологии тому или иному разработчику, а требованиями бизнеса к стоимости, безопасности, скорости внедрения и контролю над данными.