Как оценить эффективность проектов Big Data

Во многих случаях затраты на проект превышают потенциальную выгоду

Вопрос окупаемости проектов Big Data часто оказывается ключевым. Если у вас всего 500 заказов в месяц, будет ли проект экономически целесообразным?

Чтобы понять, стоит ли овчинка выделки, сначала нужно разобраться, какие задачи решают алгоритмы машинного обучения на основе данных. Они делятся на три типа.

 Инсайты – помогают увидеть то, что мы не видим в больших массивах данных: скачки и, главное, закономерности. Машинный анализ поведения пользователей на сайте интернет-магазина выявит, что какая-либо группа товаров популярна у посетителей определенного пола и возраста, и это может стать открытием для маркетологов. Производители антигистаминных препаратов полагали, что рекламу их продукта нужно адресовать молодежи, заботящейся о своей внешности, а анализ данных соцсетей показал, что на самом деле целевой аудиторией являются мамы детей, страдающих от аллергии.

Типичным примером инсайтов является выявление закономерностей между товарами в потребительской корзине покупателей – так можно обнаружить группы дополняющих друг друга товаров, которые рационально располагать рядом.

 Оптимизация бизнес-процессов. В логистике за счет оптимизации маршрутов или загрузки транспорта можно сократить расходы на 10–20%. Анализ больших данных об аудитории сайтов поможет определить релевантные сегменты аудитории для показа рекламы и эффективно перераспределить рекламные бюджеты. Например, можно с помощью анализа текстов в блогах о красоте и здоровье выявить блоги, наиболее подходящие для рекламы конкретного бренда косметики.

 Рекомендации для принятия решений. Алгоритмы машинного обучения на основе имеющихся данных умеют советовать, какие решения принимать. Нужно проанализировать бизнес-процессы организации, найти те процессы, где требуется помощь сотруднику, принимающему решение (например, при одобрении банком кредита), или клиенту – при покупке в интернет-магазине. Ярким примером могут служить рекомендательные системы различных сервисов типа Amazon, приносящие до 40% выручки от повторных покупок.

Продавец предлагает дополняющие товары: для электроплиты – подходящий набор посуды, для компьютера – мышь и источник бесперебойного питания. Подобную работу можно делать вручную, но придется расширять штат специалистов. Рекомендательная модель, построенная на основе машинного обучения, будет более эффективна.

Если вы еще не накопили больших массивов данных, едва ли будут возможны инсайты, рекомендации и оптимизация процессов. Если в компании работает пять менеджеров по продажам, можно обойтись и без глубокой аналитики. Другое дело, когда в штате 300 и более специалистов, у компании разветвленная сеть продаж и сложная логистика, с большим количеством сотрудников, большой объем клиентов и заказов, широкий ассортимент. Но даже в этом случае затраты на проект Big Data могут превысить потенциальную выгоду – если придется перестраивать IT-инфраструктуру и ключевые бизнес-процессы.

Вот пример: выделенные бренд-зоны внутри магазина (Shop in shop) помогают увеличить средний чек покупателя. Данные по чекам и местоположению магазинов можно обработать, выявить различные инсайты и построить рекомендации, где именно лучше расположить стенды в магазине и с какими товарами. Но без разрешения собственника помещения переоборудовать магазин невозможно, а он не дает разрешения на перестройку. Или при попытке изменить выкладку товаров у вас возникает конфликт с другими поставщиками товаров, недовольными расширением выкладки продукции конкурентов. Все эти вопросы не относятся к проекту Big Data, но их обязательно нужно учитывать.

Автор – генеральный директор компании CleverData (ГК «Ланит»)