«ГигаЧат» начал поддерживать более 30 языков народов России
Обновленный ИИ‑помощник «ГигаЧат» теперь поддерживает более 40 языков, в том числе свыше 30 языков народов России. Среди них татарский, башкирский, чувашский, удмуртский, якутский, бурятский, осетинский, чеченский, коми, крымско‑татарский, кабардино‑черкесский, ингушский и др. Об этом сообщил Сбер.
Отмечается, что для того, чтобы добиться высокого качества понимания и генерации текстов на каждом из языков, для модели подбирали обучающие данные, а также оптимизировали алгоритмы обработки, что позволило повысить эффективность обучения при относительно компактных датасетах. Кроме того, в процесс были вовлечены носители языков. Они размечали данные и оценивали качество ответов модели – проверяли грамматику, стилистику и соответствие живой речи.
Если пользователь обращается к «ГигаЧату» на каком‑либо из языков, помощник дает ответы на том же языке, рассказали в Сбере. Это открывает широкие возможности – от поиска информации и помощи в учебе до подготовки текстов, обращений и взаимодействия с госорганами. Возможность общаться с ИИ на родном языке важна и для старшего поколения, которое получает доступ к цифровым сервисам в привычной языковой среде, и для молодежи, осваивающей цифровую экосистему, говорится в сообщении. Такой подход способствует сохранению культурной и исторической памяти, укрепляет связь между поколениями и закладывает основу для развития сервисов и продуктов на национальных языках.
Старший вице‑президент, руководитель блока «Развитие генеративного ИИ» Сбера Антон Фролов отметил, что «ГигаЧат» в России используют более 270 языков и диалектов, и компания ставит перед собой задачу, чтобы как можно больше жителей могли общаться с нашим ИИ‑помощником на родном языке.
«ГигаЧат» – российская мультимодальная нейросеть от Сбера, способная вести диалог, писать программный код, создавать изображения и анализировать документы. Она работает как чат-бот и используется для автоматизации рутинных задач, написания текстов, создания контента и ответов на вопросы.