Будет искать по-взрослому

Отныне поисковая машина «Яндекса» будет фильтровать контент «для взрослых» не только по словам и ссылкам, но и с помощью специальной системы распознавания изображений. Подобные фильтры помогают бороться и с пиратским контентом – правда, не все интернет-компании им доверяют

Yandex N. V.

Интернет-холдинг. Владеет ООО «Яндекс», управляющим крупнейшей в России поисковой системой Yandex.ru. Акционеры: Baring Vostok Capital Partners (19,1%), Tiger Global (16,7%), Аркадий Волож (12,4%), Илья Сегалович (2,6%), 17,8% торгуется на NASDAQ. Капитализация – $11 млрд. Финансовые показатели (US GAAP, 2010 г.): выручка – 12,5 млрд руб., чистая прибыль – 3,8 млрд руб.

«Яндекс» подписался на сервис piFilter, распознающий нежелательный контент в изображениях, рассказал «Ведомостям» источник, близкий к разработчику фильтра – компании WeSee. Представитель «Яндекса» Очир Манджиков это подтвердил. До сих пор «Яндекс» распознавал «взрослый» контент только по текстам и ссылкам, размещенным на странице. По словам Манджикова, новая технология будет использоваться в веб-поиске и поиске по картинкам и поможет точнее классифицировать изображения.

Фильтровать «взрослые» сайты «Яндекс» начал еще в 2009 г. Если в запросе пользователя явно не выражен интерес к порнографии, то такие сайты не появляются на страницах с результатами поиска. А piFilter позволит еще лучше отфильтровывать страницы с эротическими или порнографическими материалами, когда текста и ссылок для их распознавания недостаточно, надеется Манджиков.

Параметры соглашения «Яндекс» и WeSee не раскрывают. Один из создателей Ru-Tube и основатель Inventos Олег Волобуев оценивает затраты «Яндекса» на использование фильтра в «несколько миллионов долларов». У Inventos тоже есть технология автоматического распознавания порно, но не на изображениях, а в видеороликах, рассказывает он. Заодно она умеет распознавать и пиратские ролики. Inventos уже предлагала «Яндексу» лицензировать эту технологию, говорит близкий к участникам переговоров источник. Ознакомительная встреча была, но переговоров нет, сказал Манджиков.

«Яндекс» первым из крупных российских проектов предпринял реальный шаг по защите детей от порнографии и внедрил фильтрацию «взрослого» контента, основанную на распознавании изображений, говорит Волобуев. Он надеется, что другие крупные порталы рано или поздно внедрят аналогичные решения. Представитель крупнейшей социальной сети рунета «В контакте» Владислав Цыплухин вчера отказался комментировать эту тему, но пообещал, что компания скоро сделает «крупное объявление».

Решить проблему нежелательного контента пока не может ни один существующий на рынке автоматизированный фильтр, уверен представитель Mail.ru Group (контролирует Mail.ru, «Одноклассников», Headhunter.ru, ICQ и др.). Основная проблема, по его словам, – высокий процент погрешности при распознавании изображения, который невозможно снизить без участия человека. Именно поэтому проекты Mail.ru Group делают ставку на модерацию контента силами пользователей, в которой потенциально могут принимать участие до 75 млн человек, говорит представитель группы. Ежедневно, по его словам, пользователи-модераторы проверяют в среднем 2,5 млн изображений. «Яндекс» уже протестировал систему piFilter и эксперименты показали, что она хорошо распознает изображения «для взрослых», возражает Манджиков.

Представитель второго крупнейшего поисковика рунета – Google отказался от комментариев.