Пространственные данные: Надо открываться

Я буду говорить об открытых данных. Открытые данные (при правильном определении) де-факто декларируют то, что они являются бесплатными для некоммерческого и коммерческого использования, они свободны в распространении и любой желающий может их потом продавать - как сами данные, так и продукты на их основе. Существенное значение имеет раскрытие этой информации в первую очередь государством. Именно в этой сфере лежат все ключевые примеры по экономическому эффекту от раскрытия информации. Есть пример Дании - помимо раскрытия непосредственно спутниковых снимков они раскрыли адресный реестр, и у них есть экономические оценки по эффекту от раскрытия этого реестра. США: там на уровне штатов, на уровне отдельных городов раскрываются геоданные с детализацией до кварталов по городам, с детализацией до избирательных округов по их административному делению и структуре.

НП «Информационная культура»

Некоммерческое партнерство. Учредители (данные ЕГРЮЛ): Екатерина Аксенова, Василий Буров, Борис Долгин, Иван Бегтин. Создано в 2012 г. для развития и популяризации концепций открытого государства и открытых данных.

Вопрос докладчику

Екатерина Шапочка, директор, руководитель подразделения оказания услуг государственным и общественным организациям PricewaterhouseCoopers Russia: Как государство тогда может контролировать качество данных, особенно собранных посредством геокраудсорсинга? Иван Бегтин: Краудсорсинг можно использовать тоже по-разному. Когда данные собраны от людей, есть определенные риски, но я приведу такой пример. Есть такой проект: «Росправосудие». Я его очень люблю, общаюсь с его создателями. Они объединили кучу данных - разных судебных решений. Помимо вещей, которые интересны юристам, там есть то, что интересует меня как человека, который занимается IT-технологиями. Количество ссылок на «Википедию» в судебных решениях зашкаливает. И эксперты, когда проводят оценку тех или иных решений, ссылаются на «Википедию». Но де-факто «Википедия» - неофициальная какая-то точка зрения и т. д. Есть государственные проекты, госучреждения, которые используют ОSМ как «подложку» уже сейчас, я такие решения видел. Они все будут продолжать это делать, потому что коммерческий и общественный сектор гораздо более гибок, у них нет государственных ограничений ни по финансированию, ни по всему остальному. Поэтому с краудсорсингом надо бы для начала начать работать, начать присутствовать там. Вплоть до того, что нанимать людей, которые занимаются всем этим, в штат и работать с ними, а также использовать краудсорсинг вообще в государственных целях <...> А сейчас у нас госорганы относятся к этому примерно так: «Мы эти данные не предоставим, потому что они плохие, и поэтому мы не дадим их в машиночитаемом виде, чтобы вы могли их проверить». Наоборот, их надо дать в машиночитаемом виде, чтобы их люди могли исправить <...> Вот в Великобритании история открытых данных проходила примерно так: четыре года активисты снимали данные с веб-сайтов, забивали на «крауд копирайт». И когда уже, так сказать, властям надоело с ними бороться, они разработали открытые лицензии и сделали портал открытых данных. У нас повторяется ровно та же самая история.

От раскрытия геоданных есть прямой экономический эффект и есть много косвенных. Прямой - это в первую очередь рост капитализации компаний на основе собственного использования геоданных: конкретные продукты, их доля на рынке - есть определенные методики оценки. Это довольно-таки большие объемы. Но совершенно огромный, трудноизмеримый и тем не менее действительно невероятный косвенный эффект. Колоссальное количество коммерческих и общественных проектов создается именно за счет того, что в них присутствуют открытые данные как раз по геоинформации и их можно использовать.

В России сложнее. Почему не ведется обучение чиновников, которые должны за это отвечать? Ни в профильных ведомствах, ни в Росреестре. Найти карты избирательных округов - это какая-то фантастика. Я никогда не видел их нанесенными на геокарты... А как красиво, когда, например, в Германии или Британии идут выборы: там просто можно раскрасить карты разным образом - кто где выиграл, процент депутатов от разных партий и т. д.

Мы сейчас, например, стали собирать информацию по муниципалитетам, для того чтобы нам ее накладывать на карту. Нам нужны продукты, которые позволяли ли бы эту информацию на картах наглядно показать. Есть различные flash-решения, HTML5-решения - множество свободных продуктов. Они [муниципалитеты] все используют что? Они все используют существующий без их участия [краудсорсинговый] ОSМ (OpenStreetMap).

Но все равно придется данные открывать. И даже если очень не хочется, есть две причины. Первое: эти данные создаются на деньги налогоплательщиков. Вторая причина в том, что, если их не открыть, через некоторое время критическая масса краудсорсинговых данных станет такой, что встанет вопрос: а зачем вообще вы существуете? Когда, например, Москва запускала свой атлас, публичная риторика звучала примерно так: «Зачем, когда есть «Яндекс-карты», Google-карты. Это деньги, потраченные впустую». (Специалисты могут меня поправить: на самом деле, может быть, это и нужно и там [в «Яндексе», в Google] есть определенные искажения.) Другой разговор, когда вы данные создаете, а потом раскрываете и говорите: «Вот это более качественные данные».

В завершение скажу, что открытые данные как идеология - это уже состоявшийся тренд в мире, это становится трендом в России. То есть порталы открытых данных появляются уже не только на федеральном уровне, на уровне министерств и на уровне субъектов - они появляются на уровне городов. Есть отдел по открытым данным в Южно-Сахалинске, в Краснодаре, есть наработки в нескольких других городах. Я общаюсь с их руководством - они говорят, что готовы в первую очередь раскрывать данные, имеющие геопривязку. Но эти данные все еще публикуются в форматах, не сильно пригодных для быстрого наложения на карты. Все равно придется их систематизировать в конце концов <...>

Если будет информация хотя бы по городам-миллионникам или хотя бы по городам с населением от 500 000 - это уже будет серьезное достижение. Но, безусловно, открытые данные должны быть на всех уровнях.

Мы сейчас ведем общественный портал, где собираем открытые данные. В том числе мы там инвентаризируем все системы в субъектах. То есть у них там, например, не описывают все свои сервисы IP, а мы их находим. Если видим, что висит какой-нибудь веб-сервис неописанный - мы его описываем: ага, тут есть кусок публично доступных данных. Но, с другой стороны, официально юридически открытыми данными это не является, открытой лицензией. И коммерческое использование их может быть ограничено. Поэтому я думаю, что в рамках в том числе и Совета по открытым данным будем проводить системную работу: чтобы геоданных было много и они были бы со свободными лицензиями. Я, конечно, надеюсь, что хоть какие-то данные Росреестра будут под открытыми лицензиями. Нам их очень не хватает.