Как онлайн-школа на 10% сэкономила расходы на управление данными при помощи облачных сервисов
Опыт Skyeng

Выручка российского edtech (образовательные технологии) выросла примерно на 23% в первом квартале 2023 г., а по итогам года общий объем этого рынка вырастет на 15-30%, следует из данных Smart ranking. У Skyeng количество пользователей за год выросло на 12% и достигло более 150 тысяч человек. Вместе с ростом бизнеса увеличивается и количество данных, которые необходимо анализировать, растут требования к скорости их обработки и визуализации, появляются новые метрики для изучения. Чтобы решить эти задачи, компания решила перенести более 7 Тб данных в новое аналитическое хранилище с возможностью углубленной бизнес-аналитики и локализовать его в России.
Задача ‒ расширить возможности аналитики и управления данными
Работа с данными играет значимую роль в большинстве бизнес-процессов Skyeng: от продуктовой и финансовой аналитики до разработки.
«Ранее наша тестовая инфраструктура и аналитическое хранилище данных находились в «Амазоне», компания очень бурно и активно развивалась, росло количество сотрудников и сервисов, ‒ рассказывает руководитель инфраструктуры Skyeng Виталий Окулов. ‒ По мере развития бизнеса мы поняли, что AWS (сервисы облачных вычислений) нам уже не очень подходит: быстро росли расходы на IT, и нас не устраивало, что хранилище географически удалено от сотрудников. Мы начали искать нового провайдера в России, выбор пал на Yandex Cloud как на надежную и стабильную платформу с экосистемой управляемых сервисов.
Первым в Yandex Cloud переехало тестовое окружение. В результате этого перехода компания снизила ежемесячные расходы на инфраструктуру на 44%. С помощью Yandex Cloud языковая школа сопровождает более 300 тестовых площадок с функциональностью так называемых прерываемых виртуалок, которая позволяет перезапускать тесты автоматически, если это требуется. Их использование позволило снизить общий бюджет на облачные сервисы еще на 15%.

После успешной миграции тестовых серверов на платформу начали переносить аналитическое хранилище.
«У Yandex Cloud были и нужные сервисы Skyeng для работы с данными, и возможности гибкого управления ресурсами, и возможности быстро масштабировать систему исходя из нагрузки. Кроме того, сервисы Yandex соответствуют российским федеральным требованиям по защите персональных данных и самым высоким стандартам безопасности».
Решение: облачное хранилище с расширенным BI (решение для визуализации данных) и возможностями использовать искусственный интеллект
Для реализации аналитического хранилища Skyeng выбрала несколько сервисов платформы данных Yandex Cloud. Так, ядром хранилища стал Yandex Managed Service for Greenplum®, для охлаждения данных используется Yandex Object Storage, а Yandex Managed Service for ClickHouse позволяет строить аналитику в близком к реальному времени и визуализировать её в Yandex DataLens.

По словам руководителя дата-офиса Skyeng Андрея Кучеренко, предпосылок для перехода было много. Во-первых, старое хранилище имело ряд ограничений, устранить которые было бы гораздо дороже, чем мигрировать на Opensource-решение (программное обеспечение, распространяемое с открытым исходным кодом). Во-вторых, компания хотела расширить возможности для аналитики в режиме реального времени и решать другие задачи в единой экосистеме облачных сервисов.
Аналитическое хранилище Skyeng на базе сервисов Yandex Cloud служит единым местом для хранения данных из более чем 300 источников, в том числе из внутренних баз данных, внешних источников, а также позволяет собирать данные о взаимодействии сотен тысяч пользователей на сайте и в приложении.
Данные из хранилища затем визуализируют с помощью систем бизнес-аналитики. Инструменты BI помогают бизнесу находить новые возможности на рынке и быстро их реализовывать, отталкиваясь от данных и прогнозных моделей.
«Как и для любой продуктовой компании, для нас важно тестировать с помощью A/B-экспериментов результаты от внедрения фичей и механик пользователей, ‒ говорит Андрей Кучеренко. ‒ Поэтому мы постоянно исследуем влияние этапов пользовательского пути на метрики компании. К примеру, в зависимости от рассчитанного сегмента, полученного на основании ответов квиза, мы понимаем, как лучше взаимодействовать с клиентами, чтобы увеличивать продажи». В среднем, по его словам, за счет проведения экспериментов им удается достичь значимого роста конверсии на 0.5-1 п. п. в зависимости от этапа продаж.
Результат: ускорение аналитики и снижение затрат на анализ данных на 10%

Результаты отмечают все сотрудники, работающие с данными: топ-менеджмент, дата-архитекторы, аналитики. Всего информацией пользуется более 400 сотрудников, и это не только ИТ-специалисты, но и бизнес-пользователи, они используют данные в формате дашбордов.
Во-первых, руководители проекта отметили уменьшение расходов на работу с данными. Общую экономию от миграции аналитического хранилища Skyeng предварительно оценивает в 10% и рассчитывает, что после завершения проекта оптимизация расходов будет еще больше. Во-вторых, для компании была выгодна техническая смена стека, который больше подходит под локальные технические требования. В-третьих, ускорился сбор аналитической и управленческой отчетности. «Если ранее запросы узкой специализации (ad- hoc) аналитики обрабатывали за два дня, то сейчас, за счет доступа к тематическим датасетам, заказчики могут получить выгрузку всего за несколько минут, при том что объём данных в хранилище сейчас в два раза больше, чем в предыдущем решении, и продолжает расти», ‒ комментирует Виталий Окулов, представитель Skyeng.
ОГРН 1187746678580, 119021, г. Москва, ул. Льва Толстого, д. 16, помещ., 528