Как бизнес учит ИИ говорить на своем языке

Почему становятся популярны предметно-специфические языковые модели
Freepik
Freepik

Корпоративный искусственный интеллект переживает новый виток эволюции. Бизнес переходит от экспериментов с универсальными большими языковыми моделями (LLM) к использованию предметно-специфических языковых моделей (Domain-Specific Language Models, DSLM). Это уже не «эрудиты-универсалы», а «узкие специалисты», созданные для работы в рамках конкретной индустрии или предметной области. Как показало исследование Высшей школы бизнеса НИУ ВШЭ (ВШБ), DSLM-модели внедрили пока только 8% российских компаний, но перспективы использования технологии изучает каждая вторая опрошенная организация.

От универсальности к точности

Согласно прогнозам аналитической компании Gartner, к 2028 г. более 50% компаний, использующих генеративный ИИ, будут применять DSLM или другие методы адаптации моделей, такие как дообучение (fine-tuning) и объединение больших языковых моделей с внешними базами знаний (RAG).

Главная проблема, которую призваны решить DSLM, – недостаточная точность универсальных моделей при специфических бизнес-запросах, объясняют эксперты. «Универсальные LLM не справляются с задачами, требующими должной экспертизы там, где критична точность терминологии: юридические документы, медицинские заключения, инженерные спецификации, финансовая отчетность», – констатирует руководитель направления по развитию технологий управления данными и машинному обучению компании «Рексофт» Сергей Назаренко. По его словам, универсальный ИИ склонен снижать важность профессиональной терминологии и не всегда корректно обрабатывает редкие форматы документов.

Принципиальное отличие DSLM заключается в использовании дополнительных данных: берется предобученная универсальная модель и дообучается на массиве доменно-специфических данных, продолжил научный руководитель лаборатории исследований эффективных архитектур нейронных сетей ИМШ ВШЭ Андрей Аргаткин. «Наибольший выигрыш получается, когда вы дообучаете модель на таких данных, которые нельзя найти в открытом доступе», – уточнил он.

Показательный пример, который приводит Аргаткин, – медицинская модель Meerkat-8B, дообученная поверх общедоступного ИИ Llama-3 на 441 000 медицинских текстов. «В ней всего восемь млрд параметров (для сравнения: у Chat GPT 5 около девяти трлн параметров. – «Ведомости. Инновации и технологии»), и при этом она демонстрирует лучшие показатели в медицинских бенчмарках, чем неспециализированная модель со 175 млрд параметров», – отмечает эксперт. Это иллюстрирует ключевое преимущество DSLM: им нужно гораздо меньше параметров для достижения лучших результатов в своей узкой области, пояснил он.

Экономика специализации

Прямой экономический эффект от внедрения предметно-специфических языковых моделей – один из главных драйверов тренда. «Переход от универсальной LLM к специализированной DSLM способен увеличить точность ответов на запросы на 5–30%. Это позволяет заметно уменьшить количество рабочих часов, затрачиваемых сотрудниками на проверку и коррекцию результатов модели», – пояснил руководитель компании VS Robotics (группа «Сбер») Максим Колосков.

Директор по ИИ «Группы Астра» Станислав Ежов тоже привел данные по практической эффективности DSLM. «Лидеры рынка демонстрируют ROI (Return On Investment – коэффициент рентабельности инвестиций, который показывает количество прибыли на вложенные средства. – «Ведомости. Инновации и технологии») 100–300% за три года», – сказал эксперт. Он добавил, что DSLM обеспечивают повышение операционной эффективности до 37% и сокращение расходов до 25% за счет автоматизации когнитивных задач. В документообороте и техподдержке время выполнения сокращается до 60%, отметил Ежов. 

Данные как новый стратегический актив

В основе любой успешной DSLM лежат качественные данные, сходятся во мнении эксперты. Как правило, комбинация открытых дата-сетов, внутренних корпоративных данных для дообучения внутренней терминологии, плюс синтетические данные (сгенерированные ИИ) помогают восполнить дефицит примеров в редких сценариях, говорит Назаренко.

Ценность DSLM именно во внутренних архивах, уверен технический директор компании MD Audit (ГК Softline) Юрий Тюрин. «Но главный вызов – чистота и структура данных. Если архив «грязный», модель обучится ошибкам», – подчеркнул он.

Директор центра аналитических продуктов VK Predict Стятюгин рассказал об исследовании компании, в рамках которого 76% респондентов подтвердили, что их ИИ-решения используют внутренние данные организаций. «Наиболее ценным источником для корпоративных ИИ-систем являются внутренние базы знаний, которые проходят тщательную обработку и разметку экспертами», – комментирует эксперт.

От пилотов к масштабированию

Единого мнения о том, на какой стадии находится российский рынок DSLM, нет, но эксперты сходятся в том, что о массовой коммерческой эксплуатации говорить рано. «Сейчас в России корпоративные DSLM находятся преимущественно на стадии пилотных проектов: около 55% задач решается именно так. Примерно 30% идет в направлении масштабирования. Коммерческая эксплуатация пока что составляет примерно 15%», – дал оценку технический директор «АЛМИ Партнер» Станислав Орлов. Стратегический интерес к созданию глубоких DSLM проявляют крупные корпорации, у которых уже создана инфраструктура для ИИ, есть необходимые кадры и потребность в адаптации моделей к конкретной отрасли, уточнил главный разработчик машинного обучения в СКБ «Контур» Азер Шахвердиев.

Заместитель руководителя направления Т1 ИИ (IT-холдинг Т1) Сергей Карпович добавляет, что полноценная коммерческая эксплуатация предметно-специфических языковых моделей в России – скорее, перспектива ближайших года-двух.

При этом картина неоднородна, в России сейчас «огромное количество стартапов с хорошими качественными узкоспециализированными продуктами», добавил директор по инновациям «ДАР» Авенир Воронов. «Так, в сфере кибербезопасности разрабатывают модели для поиска утечек», – привел он пример.

Цена ошибки

Переход на DSLM сопряжен и с рядом сложностей. «Основной риск перехода – это завышенные ожидания по поводу того, что дообученная модель будет понимать специфику на уровне специалиста высокого класса», – предупреждает Воронов.

Аргаткин указывает на другой фундаментальный риск: дорогостоящая DSLM может не оправдать ожиданий и показать результаты хуже, чем постоянно улучшающиеся универсальные LLM. В качестве примера он напомнил историю с BloombergGPT. В 2023 г. Bloomberg потратил, по некоторым оценкам, $1,3 млн на обучение своей специализированной модели для финансовой сферы. Одно из исследований показало, что актуальная на тот момент версия ChatGPT давала ощутимо лучшие результаты на тех же типах задач. «Не стоит начинать амбициозный и дорогостоящий проект, если вы не готовы рисковать», – советует Аргаткин.

Еще один риск – в сложности поддержки предметно-специфических языковых моделей, отметил технический директор Sibedge Николай Иванов. «Если компания выбирает «ансамбль» из множества малых специализированных моделей, это приведет к созданию большого количества версий. Такой путь требует значительных ресурсов и грамотного MLOps (Machine Learning Operations – набор практик для развертывания и использования машинного обучения в компании. – «Ведомости. Инновации и технологии»)», – пояснил он.

Руководитель IT-подразделения агентства «Полилог» Людмила Богатырева обратила внимание на опасность предоставления информации модели: «Для качественного обучения DSLM нужны корпоративные данные, а их предоставление несет в себе риски». В пример она привела неудачную инициативу по созданию в нефтегазовой отрасли общеотраслевой платформы ИИ, которая провалилась из-за нежелания компаний делиться коммерческой тайной.

Будущее: симбиоз, а не замена

Подавляющее большинство экспертов сходятся во мнении, что предметно-специфические языковые модели не заменят универсальные, а будут использоваться в связке с ними. «DSLM и LLM станут работать в тандеме: универсальные модели обеспечат широкий спектр общих функций, а предметно-специфические – критически важную точность и надежность в специфичных бизнес-процессах», – полагает Назаренко.

Карпович продолжил эту мысль: «Современный тренд – это построение систем, в которых базовые LLM используются для генерации и обработки общего контента, а DSLM – для спецификации, фильтрации и уточнения. В итоге DSLM и LLM будут сосуществовать, разделяя роли и взаимно дополняя друг друга».

ML/AI архитектор компании «Софтлайн Решения» Дмитрий Зборошенко добавил, что на практике лучший результат часто дает не полное обучение модели с нуля, а грамотная организация доступа ИИ к знаниям. По его словам, отраслевым стандартом становится контекстное обучение (in-context learning), когда специфическая информация подается модели прямо в запросе, что позволяет добиться высокого качества без гигантских вычислительных затрат на создание DSLM.

Воронов предложил другой сценарий, в котором предметно-специфические языковые модели будут использоваться как «консультанты» для тех же LLM, когда один ИИ сможет обращаться к более обученной модели для решения определенных задач.