Большие данные – большие вызовы

Технологии цифровых платформ позволяют выяснить о человеке практически все
Максим Стулов и Евгений Разумный / Ведомости

С развитием технологий в корне поменялось общество, оно стало более фрагментированным, образ жизни и модели потребления – индивидуализированными. Преобразовались медиа, и оказалось, что интернет-аудитория в отличие от аудитории «традиционных» СМИ вовсе не анонимна. Поведение человека постоянно анализируется, он описан по множеству параметров и включен в десятки сегментов. Это дает возможность бизнесу, политикам, государству подбирать персональный подход к людям разных вкусов и убеждений, позволяет предлагать пользователю ту информацию, которая скорее окажется ему близка и заинтересует его. Однако последствия этого неоднозначны.

Если смотреть на проблему «со стороны спроса», то стремление пользователя получить больший комфорт входит в конфликт с его желанием сохранить приватность. А оценка ситуации «со стороны предложения» такая: брендам в этих условиях нужно ориентироваться на узкие, формируемые ценностными позициями ниши, а политикам все сложнее говорить с массовыми аудиториями – мало смыслов, которые способны оказать сильное эмоциональное воздействие на большую группу.

Социальным изменениям соответствуют технологические. В маркетинговых и политических коммуникациях все более определяющей является тенденция «ухода в интернет», который дает новые возможности работы со все более сложной и информационно перегруженной аудиторией. Широкие информационные кампании здесь рассыпаются на множество таргетированных. Успешность напрямую зависит от того, насколько хорошо коммуникатор знает аудиторию. Поэтому данные – и алгоритмы их анализа – становятся «новым золотом».

Какие данные об интернет-аудитории доступны и кому

Интернет долгое время выглядел пространством небезопасным, но приватным. Сегодня все иначе. О безопасности пользователя заботятся все: он сам, бизнес, государство. А вот приватность, похоже, навсегда осталась в прошлом. Онлайн мы проявляем себя постоянно – через поисковые запросы, клики по ссылкам, подписки, лайки, сообщения, покупки. Мировой объем пользовательских данных растет по экспоненте.

Цифровой след, который оставляет человек, позволяет многое сказать о его образе жизни, политических и религиозных взглядах, психологических особенностях или сексуальной ориентации. А с помощью технологии look alike можно, имея детализированную информацию, например, о 10 000 человек, найти еще 1 млн на них похожих. Даже если пользователь сам ничего не сообщает о своих ценностях и взглядах и не делится информацией о личной жизни, он статистически надежно может быть помещен в определенный сегмент – политический, потребительский, поведенческий.

Нет, эти данные не используются для персональной слежки. Если мы говорим о бизнесе, как и о любой другой публичной сфере, в деанонимизации нет практического смысла – значение имеют лишь точность выделения сегмента и повышение эффективности коммуникаций. Но надо понимать, отмечает президент компании «Крибрум» Игорь Ашманов, что термин «неперсонализированные данные» – это почти всегда симулякр: «Таких данных сейчас практически не существует. Почти всегда такие данные можно деанонимизировать обратно. Более того, с накоплением big data центр тяжести смещается в сторону вычисления персональных данных, а не их сбора. Получить официально, например, медицинские данные пользователя трудно, и это накладывает серьезную ответственность. Но технологии цифровой платформы позволяют по видео, фото, походке и лицу пользователя, его маршрутам, постам и комментариям, поисковым запросам, посещенным сайтам вычислить наличие у него болезни, беременности, той или иной зависимости, семейных и сексуальных проблем, узнать уровень дохода, политическую и сексуальную ориентацию, наличие детей и т. п. И если вы владеете такой платформой, то зачем вам официально собирать эту информацию и отвечать за нее как оператору персональных данных со всеми вытекающими обременениями? По вычисленным данным вы как платформа ничего не должны ни у кого спрашивать и никакой ответственности не несете».

Как используются данные и к каким последствиям это приводит

Наиболее частое и наглядное использование данных о пользователях – это реклама. В этой области сегментация и таргетирование развиваются давно, повышают отдачу затрат на кампании, хотя технологии до сих пор несовершенны – каждый знаком с ситуацией, когда за ним неделями «ходит» уже купленная сумка. Реклама может «привязываться» не только к проявленному интересу к товару, но также и к группе тех, кому товар может быть потенциально интересен – в связи с их образом жизни и сферой интересов.

В перспективе для бизнеса речь идет в первую очередь о накоплении данных о клиентах, все более глубокой сегментации и повышении точности в отправке предложений. «Один из важных трендов в рекламе – интеллектуализация, использование алгоритмов, которые позволяют выделять десятки тысяч целевых аудиторий и генерировать индивидуализированные послания», – отмечает Олег Полетаев, директор по коммуникациям АНО «Цифровая экономика». Кроме того, отличие рекламы в интернете в том, что рекламодатель может параллельно анализировать реакцию разных аудиторий на сообщения и «отшлифовывать» их, что повышает качество коммуникации. Результат, каким его видит бизнес, – «реклама, которая перестает раздражать, потому что точно попадает в потребности человека и помогает экономить время, показывается только тем и тогда, кому и когда это нужно, и содержит полезную именно этой группе потребителей информацию», отмечает Евгения Искакова, CEO Vox populi.

Но есть и ряд ограничений. Сегментация имеет предел там, где дробление теряет экономический смысл, становится слишком дорогим. Кроме того, когда рекламодатель переходит от крупных сегментов ко все более мелким, усиливается конкуренция за внимание одного человека – он интересен разным рекламодателям в разных своих ролях. Это также приводит к удорожанию.

Возникает и специфический риск. Чем больше реклама привязана к покупателю, чем более явно демонстрирует, что продавец знает о нем, тем точнее и полезнее должно быть предложение. В обратном случае это только усиливает раздражение от «бесполезного информационного шума» и вмешательства в личную жизнь и наносит больший урон бренду.

Сегментация аудитории и таргетирование сообщений используются и в политике, хотя здесь по понятным причинам крайне мало публичных кейсов. Но и те, что есть, – например, Brexit, президентские выборы в США в 2016 г., антииммигрантская кампания «Альтернативы для Германии» (AfD) – показывают, как может меняться политическая коммуникация в сетевом мире. Политик может таргетировать сообщения на своих и чужих сторонников (в том числе потенциальных), корректировать послания для разных групп, расставляя акценты в зависимости от их интересов вплоть до трансляции разных повесток на разные аудитории. Перспектива для политики – это все более детальное дробление электората, более гибкое реагирование на повестку, в том числе локального масштаба, и ситуативно возникающие группы интересов. Конечно, этот сценарий реализуется только в условиях политической конкуренции. При этом политическая коммуникация, данные о политических предпочтениях являются наиболее чувствительными для пользователей. Именно здесь поднимаются основные юридические и этические проблемы относительно использования микротаргетинга и ответственности платформ – операторов данных. Со стороны платформ в последние годы вводится ряд ограничений на таргетирование сообщений политического характера.

Важное направление использования данных о поведении интернет-аудитории – это подбор рекомендаций по релевантности. Механизм релевантности исходит из того, что человек искал и делал прежде, и лежит в основе алгоритмов выдачи поисковых систем, работы интернет-магазинов и контент-платформ.

Для общественной жизни в целом это означает нарастание так называемого эффекта эхо-камер или информационных пузырей – формирование информационных сред, в которых человек в значительной степени изолирован от взглядов и информации, которая не связана с его профилем интересов. Интернет довольно долго представлялся пространством свободы – неуправляемым, дающим доступ к альтернативным картинам мира в оппозиции традиционным СМИ. Сегодня этот идеал в значительной степени разрушен – человек уже понимает, что и здесь его вниманием также управляют, а технологии только усиливают естественные механизмы образования анклавов. Алгоритмы, позволяющие фильтровать информацию, – необходимость в мире, где объем контента возрастает в геометрической прогрессии. Но это приводит к замыканию социальных сред на своей повестке и своих взглядах. И к тому, что человеку становится труднее выразить несогласие или симпатию к альтернативным взглядам.

Последствие для пользователя – это нарастающий конфликт между комфортом нахождения в максимально адаптированной под него среде и ощущением контроля и незащищенности.

По мнению Ашманова, рынку «остро нужны законы о персональных и больших данных и вообще кодекс о цифровых правах граждан, который должен регулировать в первую очередь не сбор данных, который плохо контролируем и теряет актуальность, а запрещенные и разрешенные виды использования этих данных, а также запрещать цифровую дискриминацию на основе персональных и больших данных».

Эксперты выделяют несколько основных проблем в связи с пользовательскими данными. Во-первых, это повышение прозрачности для пользователя того, какие именно данные собираются. Во-вторых, ограничения на деанонимизацию данных, а также уточнение сегмента до размеров, которые указывают на очень небольшую группу людей (например, выделение сегмента из 10 человек). В-третьих, это возможность ограничить операции платформ с данными. Проблему также усматривают в том, что информация, на основе которой происходит приоритизация, т. е. «информационный профиль» пользователя, оказывается ему самому недоступна. Сегодня есть явный разрыв между желанием общества закрыться и ростом его прозрачности для государства и бизнеса, между желанием контролировать свои данные и неумением или неготовностью уделять этому время и внимание.

Автор благодарит за консультации при подготовке статьи Игоря Ашманова («Крибрум»), Алексея Беляева (Mail.ru Group), Олега Грешнева (независимый эксперт по безопасности данных), Владимира Журавлева (Ozon), Евгению Искакову (Vox populi), Олега Полетаева (АНО «Цифровая экономика»)