Интеграция моделей оценки обратной связи в цифровых платформах

Как отмечает ассистент кафедры бизнес-информатики Финансового университета Сергеев Степан Алексеевич, процесс внедрения начинается с этапа Discovery. На этом этапе менеджер продукта проводит количественные и качественные исследования. Количественные исследования проходят при участии аналитики и сфокусированы на анализе поведения пользователей (клики, поисковые запросы, сообщения, отзывы).

Не смотря на большой объем добавленных отзывов и большое количество оценок любой экономической платформы, глубина скролла и изучения отзывов низкая. Также увеличение числа и объёма отзывов не увеличивает время, проведенное на них пользователем, а конверсии в сделках не меняются в зависимости от числа и качества отзывов. Добавление машинной оценки отзывов позволит давать более качественный опыт пользователям в процессе поиска нужных товаров и услуг, а также ускорять этот процесс и увеличивать конверсию в сделку. Менеджер продукта с аналитиками также проводят анализ конкурентов, их решений, наработок. Аналитическая команда производит оцифровку решения через метрики, подбирает целевые метрики продукта, строит дерево метрик продукта.

На основе проведенных исследований и наработок моделей строится трекшн модель. Трекш модель включает в себя как доходную, так и расходную часть решения. В модели необходимо грамотно распределять потребности в ресурсах. Построенная трекшн модель должна пройти инвестиционный комитет и получить зеленый свет на финансирование и разработку. Для того, чтобы решение развивалось в рамках плана, ставятся контрольные точки – через квартал, полгода и год. В рамках этих контрольных точек производится оценка достигнутых показателей, происходит анализ причин отклонений фактических значений целевых метрик.

На данном этапе также важно уточнить участие маркетинга и поддержку решения с его стороны. Для того, чтобы разрабатываемое решение активно функционировало крайне важно поддерживать интерес пользователей в части генерации UGC – контента. В рамках этого маркетинг будет участвовать в этом через развитие знаний и формирование позиционирования решения в продукте: CRM пуши, внутренние коммуникации (шторки, истории), через прямую мотивацию в виде выплаты внутренних бонусов за качественный отзыв. Эти бонусы можно потратить на размещение и продвижение объявлений и/или оплату покупок внутри платформы.

Эксперт кафедры бизнес-информатики Финансового университета, кандидат экономических наук, доцент Зубов Ярослав Олегович отмечает, что при переходе этапа от discovery к delivery дизайнеры готовят макеты элементов интерфейса, который позже будут реализованы frontend-инженером. На основе этих макетов аналитик прорабатывает контракты на аналитические события действий пользователей и формирует техническое задание.

Для полноценной реализации продукта, решающего поставленную бизнес- задачу, потребуется построение комплексной системы на стыке backend-разработки, машинного обучения, frontend-интерфейсов и аналитики данных. В основе решения лежит система, которая принимает отзывы от пользователей, анализирует их с помощью NLP-моделей, классифицирует, фильтрует и визуализирует данные как для конечного пользователя, так и для продавцов и маркетинга.

Параллельно на этапе получения данных UGC – контента должен запускаться пайплайн обработки отзывов. Это может быть реализовано с использованием Apache Airflow или Prefect. Цель пайплайна – обрабатывать текст отзыва с помощью NLP-моделей, реализованных в библиотеках Hugging Face Transformers или spaCy. Среди основных задач:

определение тональности (sentiment analysis);

классификация по тематике («цена», «качество», «доставка»);

фильтрация неестественных отзывов (с помощью моделей обнаружения аномалий или генеративных признаков фейковости на основе BERT или RoBERTa).

После анализа к отзыву добавляются метки: оценка тональности, категории и признак подозрительности.

Результаты работы моделей сохраняются в базу данных сервиса, а оттуда перевозятся в аналитическое хранилище через процесс разложения в шестую нормальную форму и сбора в datamart. В качестве СУБД сервиса рекомендуется использовать PostgreSQL из-за его хорошей работы с JSON-структурами. В дополнении лучше использовать Kafka для стриминговой передачи новых отзывов в пайплайн обработки. Оркестрация процесса оптимально настраивается через Apache Airflow. Полученные данные из DMA визуализируются в инструменте под названием Redash.

Таким образом, в случае качественной интеграции системы оценки обратной связи, компания получает визуальную оценку текущей ситуации со стороны, что позволяет наиболее полно и, главное, вовремя отреагировать с целью дальнейшего успешного развития в рамках платформенной экономики.

Другие пресс-релизы