От редакции: Статистика пользователей

Андрей Махонин/ Ведомости

В рейтинге стоимости жизни сайта Numbeo Москва вместо привычного места вверху списка оказалась в середине (232-е место из 446). Впереди Москвы не только Цюрих (1-е место), Нью-Йорк, Лондон и Париж, но также Рим, Берлин, Мадрид, Афины и Тель-Авив. Рейтинг Numbeo учитывает уровень потребительских цен, стоимость аренды жилья, продовольствия, ресторанов и покупательную способность. Помимо данных по стоимости жизни сайт предоставляет статистику по ценам на недвижимость, уровню развития транспортной сети, здравоохранения, преступности, загрязнению окружающей среды и качеству жизни. Здесь, по данным сайта, Россия внизу списка, она пропускает вперед Казахстан, Болгарию, Колумбию и Пакистан, но обходит Китай, Украину, Монголию и Венесуэлу.

Но интереснее самих данных рейтинга методика сбора материала. Numbeo создал сербский программист Младен Адамович, в прошлом работавший в Google и SunGard. Особенность методологии - открытость и проверяемость данных, а главное, это данные, которые вводят сами пользователи. По словам Адамовича, идея пришла ему в голову накануне кризиса; создавая свой сервис, он хотел дать людям в руки инструмент борьбы с искусственным завышением цен на рынке недвижимости.

Каждый посетитель сайта может ввести данные по стоимости различных товаров и услуг в своем городе. Другие источники данных - обрабатываемые с помощью созданных авторами проекта алгоритмов данные вебсайтов супермаркетов, транспортных компаний, госучреждений (курсы валют корректируются несколько раз в день в соответствии с данными Европейского центробанка), специализированных исследований и публикаций в прессе.

Данные тем точнее, чем больше пользователей вовлечено в проект. На 1 июня в распоряжении Numbeo были данные по 1 322 501 ценовой категории в 4461 городе мира, введенные 152 947 пользователями. Другой похожий проект - Expatisan.com не намного отстает от своего конкурента: более 918 000 ценников в 1776 городах от 248 000 пользователей.

Следующий шаг такого рода статистики - ассоциация подобных сервисов с крупными социальными сетями и поисковыми системами. Может показаться, что возможность использовать данные миллионов человек вместо тысяч, которыми оперируют сегодня социологические службы, станет прорывом, после чего традиционные рейтинги уйдут в прошлое. Это не совсем так.

Такого рода рейтинги нуждаются не столько в большом количестве данных, сколько в их качественном отборе и анализе - не случайно в Numbeo подчеркивают, что их данные обрабатываются вручную. Кроме того, социальные сети только создают инструменты для автоматического отсева фейковых аккаунтов - согласно годовому отчету Facebook в 2013 г. их число снизилось с 8,7 до 7,2%. Пока такие инструменты не созданы, сайты вроде Numbeo и Expatisan не более чем собрание большого количества прозрачных данных.