«Яндекс» запускает систему мониторинга и анализа новостных текстов

Некоторые СМИ недовольны, что система будет делиться статистикой посещаемости их статей
«Яндекс» запускает систему мониторинга СМИ/ А. Гордеев/ Ведомости

«Яндекс» начинает бета-тестирование сервиса мониторинга и анализа информационного поля – «Яндекс.Медианы», говорится в сообщении «Яндекса». Он поможет проследить за тем, что пишут в интернете о людях и компаниях, оценить тональность и значимость публикаций.

В «Медиане» используются технологии «Яндекса»: мировой индекс, лингвистические технологии, объектный ответ, машинный интеллект, сообщает компания. Сервис индексирует публикации на сайтах СМИ и автоматически выделяет интересующие объекты в текстах. Машинный интеллект, обученный на размеченных вручную текстах, определяет характер упоминания объекта в публикации – тональность, роль, наличие в заголовке и присутствие комментария от объекта).

Пока сервис анализирует только данные СМИ, но в будущем в него будут добавлены и другие источники – например, социальные сети, уточнила «Ведомостям» представитель «Яндекса» Татьяна Комарова. Компания планирует зарабатывать на мониторинге новостей, продавая подписку. Ее стоимость будет зависеть от количества упоминаний для отчета. Например, если речь идет о мониторинге компаний, сравнимых по упоминаемости с «Яндексом», стоимость подписки составит 80 000 руб. в месяц», рассказывает Комарова.

«Яндекс» выходит на новый для себя рынок мониторинга СМИ, на котором уже работают такие игроки, как «Медиалогия», «Интегрум», система мониторинга иностранных издания Factiva. «Медиалогия», по собственным данным, анализирует данные 32 000 СМИ, «Интегрум» – более 9000. У «Яндекса» сейчас 6500 источников, это база, взятая из сервиса «Яндекс.Новости», говорит Комарова.

В сообщении «Яндекса» говорится, что для оценки заметности каждого упоминания «Яндекс.Медиана» учитывает не общую посещаемость сайта СМИ, а данные о числе прочтений конкретных публикаций». Для получения этой информации система использует данные сервиса статистики «Яндекс.Метрика» (ее счетчики стоят на сайтах СМИ), браузера «Яндекса», переходы с поиска «Яндекса», объясняет Комарова.

Не все СМИ довольны тем, что данные о чтении конкретных публикаций попадут в руки «третьих лиц». Непонятно, почему «Яндекс» даже не обсудил со СМИ использование их данных в своем новом сервисе, говорит руководитель службы интернет-проектов «Интерфакса» Юрий Погорелый. В «Яндекс.Медиане» при анализе текстов выдается статистика посещаемости конкретных страниц: по сути, речь идет о внутренней статистике СМИ, которую «Яндекс» планирует продавать третьим лицам. Это как если бы Facebook начал продавать рекламодателям данные конкретного пользователя с указанием его имени и фамилии, возмущен Погорелый. Вероятно «Яндекс» использует статистику из своего сервиса «Яндекс.Метрика», чьи счетчики стоят на сайтах большинства СМИ. Но в лицензионном соглашении «Метрики» указано, что «Яндекс» гарантирует, что не будет передавать эти данные третьим лицам. Поэтому мы «Метрику» на своих сайтах уже выключили, кто знает, какие еще наши данные «Яндекс» захочет продать, говорит он.

Нехорошо, если «Яндекс» будет делиться с посторонними лицами внутренней статистикой изданий: на предоставлении таких данных рекламодателям СМИ зарабатывают сами, соглашается сотрудник другого крупного СМИ. Ни одна существующая система таких данных третьим лицам не предоставляет, добавляет Погорелый.

Комарова говорит, что «Яндекс» для анализа посещаемости конкретных текстов действительно использует данные «Яндекс.Метрики». Но вместе с ними система анализирует данные браузера «Яндекса» и переходы пользователей из поиска. А данные «Метрики» используются только в агрегированном виде вместе с другими данными и только для обучения математической модели, которая оценивает нижнюю границу количества прочтений. То есть пользователь «Яндекс.Медианы» видит результаты применения математической модели, а не конкретную статистику из «Яндекс.Метрики», утверждает Комарова.