Как навести порядок в больших данных

И не допустить, чтобы озера данных превращались в болота

Недавно KPMG провела исследование, как крупнейшие мировые компании воспринимают технологии. Результаты оказались интересными: 67% руководителей признались, что последние три года игнорировали некоторые выводы, полученные на основе компьютерных моделей, потому что эти выводы противоречили их интуиции или опыту. Получается, что умом руководители компаний понимают ценность технологий, но сердцем боятся использовать полученные результаты.

Одно из ключевых препятствий – недоверие к данным, собранным в компании. Ведь руководитель не может полностью доверять выводам, сделанным на основе информации, в которой он не уверен. В проектах мы нередко сталкиваемся с тем, что компании более тщательно относятся к инвентаризации офисной мебели, чем к управлению информационными активами. Компаниям во всех отраслях не хватает метаданных о данных, т. е. сведений о том, какие полезные факты бизнеса содержатся в этих данных, каково качество данных, где они хранятся, как можно их использовать, какими открытыми данными их можно дополнить, чтобы повысить их ценность, как их объединить.

По оценкам Gartner, к 2022 г. 90% корпораций будут называть большие данные важнейшим активом предприятия. Мы сформулировали несколько основных принципов, которые помогут организациям привести этот важнейший актив в порядок.

1. Избавьтесь от неточных данных. На предприятии может стоять самое современное оборудование, данные с которого каждые 5 минут поступают в дорогостоящее информационное хранилище (озеро). Но для построения модели не хватает записей, которые сотрудники раз в неделю вносят в бумажный журнал учета. Это еще не самое страшное, потому что введенные вручную данные часто оказываются неточными или даже вовсе недостоверными. Возможное решение – там, где нельзя поставить датчик или автоматизировать процесс, нужно избавиться от человеческого фактора. Например, сотрудник делает фотографию данных на мобильном устройстве, а потом алгоритм анализирует эту фотографию и добавляет в базу.

Вы видите часть этого материала
Подпишитесь, чтобы дочитать статью