«Яндекс» выложил в открытый доступ нейросеть для генерации текстов

Компания «Яндекс» открыла публичный доступ к нейросети YaLM 100B, которая генерирует и обрабатывает тексты на русском и английском языках. На сегодняшний день это самая большая GPT-подобная модель, доступная для пользователей со всего мира, заявили в пресс-службе компании. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Нейросеть содержит 100 млрд параметров. С помощью нее можно выполнять большое количество задач, связанных с обработкой языка и созданием текстов. К примеру, создавать идеи для рекламы, описания товаров и даже писать стихи.

Обучение модели проходило на суперкомпьютерах «Яндекса». В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых ресурсов на английском и русском языках. Сама компания использует нейросеть более чем в 20 проектах. Например, в быстрых ответах в «Поиске», голосовом помощнике «Алисе», для ответов в службе поддержки, рекламных объявлениях и описаниях сайтов в сниппетах.