Большие данные: Big Data - это философия

Андрей Леушев, вице-президент, заместитель руководителя корпоративного блока Промсвязьбанка
Андрей Леушев/ Ведомости

Раньше я работал в Сбербанке. Там на становление технологии Big Data в корпоративном сегменте в подсегменте малого бизнеса (компании с оборотом до 400 млн руб. в год) у нас ушло примерно 1,5 года. Полгода назад я перешел в Промсвязьбанк. Команду мы собрали через три месяца и сейчас получаем первые результаты.

ОАО «Промсвязьбанк»

Акционеры: Promsvyaz Capital B.V. (88,25%, контролируется на паритетных началах Алексеем и Дмитрием Ананьевыми), ЕБРР (11,75%). Финансовые показатели (МСФО, 2013 г.): активы - 739,1 млрд руб., капитал - 66,2 млрд руб., чистая прибыль - 3,96 млрд руб.

На мой взгляд, Big Data - это не термин, описывающий большой объем информации. Big Data - это скорее философия, которая позволяет эти массивы данных правильно использовать. Очень важным элементом является первичный сбор данных и последующее обогащение информации. Ключевой момент - это анализ данных. Но самый важный этап - это использование данных: именно он определяет общую эффективность системы.

Как собрать информацию? Часто говорят, что есть, мол, старые инструменты обобщения, сбора и интерпретации данных. Моя позиция, что этим старым источникам верить нельзя. Можно опираться только на самые маленькие гранулярные данные. Если вы найдете в них закономерности, вы будете контролировать и управлять системой гораздо лучше. Фиксировать нужно абсолютно все, на что у вас хватает средств. Сейчас компьютерная память недорогая, поэтому, если встает альтернатива, фиксировать что-то или нет, отвечайте всегда «да».

Модель данных - это самый важный элемент в Big Data, ее сердце, ее мозг. Если вы не поймете, что значат конкретные атрибуты, хранящиеся в разных системах, почему они такие, вы будете ошибаться раз за разом.

При этом использование передовых технологий не означает, что вы купите самую современную и дорогую систему. Из широкого выбора программных продуктов вы должны подобрать инструмент, который подойдет именно вам. По аналитическим возможностям системы не очень разнятся. А вот простота настройки и использования и стоимость лицензий в расчете на одного аналитика отличаются радикально.

Как актуализировать информацию? Если вы только подходите к созданию системы анализа больших массивов данных, то ответ: вообще никак. Берите то, что у вас есть, хоть файловый обмен, хоть загрузку Excel-файлов - это абсолютно не важно, потому что 80% результата не потребуют какого-то онлайн-обогащения. Если взять статические данные и разобраться в них, уже можно очень серьезно повысить, например, качество продаж или сократить потери.

По источникам. Используйте любые доступные источники: открытые, публичные, условно открытые (продающиеся за деньги). Если вам вдруг откуда-то достался какой-нибудь диск из каких-нибудь органов незаконным путем, все равно используйте. Для бизнеса любые данные могут быть полезны. Иногда выявляются закономерности, которые не получить логическим путем.

Следующее - рост доли онлайн-обмена. Если вы уже 1-2 года занимаетесь повышением эффективности на базе одних и тех же данных, лучше переходить на онлайн. Это будет проще, выявляющиеся зависимости вы будете вылавливать не месяц в месяц, а день в день.

Приоритизация недостающих сведений. Всегда нужно думать о том, каких сведений не хватает модели. Нужно быть относительно смелым при генерации новых гипотез. Если вам кажется, что какие-то данные обогатят модель, ищите их. Данных много. Партнеров, у которых содержатся полезные данные, на рынке достаточно. То, что важно для банков, содержится и у операторов связи, и у операторов электронного документооборота, и у компаний, которые предлагают типовые решения для банков. Статистику сейчас собирают все. Ищите партнеров.

По поводу того, как анализировать. Естественно, самое главное - это правильная команда. Я опытным путем пришел к тому, что самая главная компетенция в команде - визионерство. То есть это те люди, которым вы доверяете, которые хорошо понимают бизнес и которые способны выдавать гипотезу за гипотезой. Потому что ни одна современная система не может сгенерить худо-бедно эффективную гипотезу.

Нужно сразу брать продвинутые инструменты. Если вы действительно хотите построить аналитическое подразделение, которое занимается Big Data, не нужно строить его на Excel. Дайте людям нормальные инструменты. В том кейсе, который развернут сейчас в Промсвязьбанке, инструмент обошелся в 1,7 млн руб.

Как использовать? Во-первых, вы должны четко понимать, чем живет целевая аудитория. В Промсвязьбанке это 200 клиентских менеджеров, работающих с топовыми клиентами (с нижней границей выручки от 1,5 млрд руб., а в принципе, мы сфокусированы на тех, у кого оборот больше 10 млрд руб.). Клиент-менеджеры - достаточно сложные личности. Их интерес зависит от того, как построена система мотивации. И в нее обязательно нужно вставлять рычаги, которыми вы можете манипулировать с помощью Big Data. После того как вы начинаете вырабатывать рекомендации, у вас должен быть инструмент давления и контроля в отношении субъектов этой деятельности, в моем случае - клиентских менеджеров. Рекомендации должны быть простыми. Человек должен усваивать их независимо от уровня профессиональной подготовки.

Обратная связь. Обязательно разговаривайте как с «ударниками» использования ваших рекомендаций, так и с теми, кто имеет наихудший результат. Обратная связь позволяет откалибровать модель и сделать ее в разы эффективнее. И нужно всегда помнить о том, что ваша единственная цель, ваш единственный KPI в отношении этой деятельности - процент конверсии ваших рекомендаций в живые сделки.