В России утвержден первый национальный стандарт в области больших данных
Разработчики анонсируют появление еще восьми ГОСТов в сфере big dataРосстандарт утвердил терминологические нормативы, которым должны следовать участники рынка больших данных, следует из приказа ведомства, с которым ознакомились «Ведомости». Такой стандарт вводится впервые, следует из его описания.
ГОСТ «Информационные технологии. Большие данные. Обзор и словарь» идентичен международному стандарту Information technology – Big data – Overview and vocabulary, подчеркивают его разработчики из Национального центра цифровой экономики МГУ и Института развития информационного общества. Разработка стандарта осуществлена в рамках бюджетной программы государственной поддержки центра компетенций «Национальной технологической инициативы» (НТИ) по технологиям хранения и анализа больших данных МГУ, отмечает представитель АНО «Платформа НТИ».
«Термины, установленные настоящим стандартом, обязательны для применения во всех видах документации и литературы по данной научно-технической отрасли, входящих в сферу работ по стандартизации и (или) использующих результаты этих работ», – отмечено в описании стандарта.
В ГОСТе приведены переводы англоязычных терминов, относящихся к большим данным, на русский язык и расшифровка их значений. Например, «аналитика данных» (data analytics) – это «составное понятие, охватывающее получение, сбор, проверку и обработку данных, включая их количественную оценку, визуализацию и интерпретацию». А, к примеру, «вариативность данных» (data variability) – «изменения в скорости передачи, формате или структуре, семантике или качестве массива данных». Ниже приводятся ключевые характеристики больших данных (объем, скорость обработки, разнообразие и вариативность) с объяснением их значения.
«Принятие первого национального стандарта задает вектор совместных действий власти, бизнеса, научно-образовательного сообщества по развитию экономики данных в России, – отмечает председатель совета директоров Института развития информационного общества Юрий Хохлов. – Мы ставим перед собой задачу сократить отставание в стандартизации больших данных». Первыми в IT-отрасли вводятся терминологические стандарты, а затем к ним добавляются все остальные, объясняет он.
Международный опыт
Первый интернациональный стандарт в сфере big data «Большие данные – Требования на основе облачных вычислений и их возможности» Международный союз электросвязи утвердил в 2015 г. В 2018 г. Международная организация по стандартизации (ISO) утвердила стандарты эталонной архитектуры больших данных, сценариев использования big data, а также направления дальнейшей стандартизации больших данных. В 2020 г. ISO опубликовала стандарты безопасности при использовании персональных данных в big data – проектах и начала работу над серией стандартов о качестве больших данных для аналитики и машинного обучения.
По словам Хохлова, предстоит принять еще восемь национальных стандартов в сфере больших данных, касающихся их эталонной архитектуры, безопасности, методов анализа, сценариев использования и др.: «Часть из них уже разработана, прошла общественное обсуждение, часть будет разрабатываться одновременно с международными стандартами».
По состоянию на конец 2019 г. Boston Consulting Group оценивала объем российского рынка больших данных в 45 млрд руб. с темпом прироста 12% в течение последних пяти лет. Согласно подсчетам Ассоциации больших данных, объем рынка больших данных в России составляет 10–30 млрд руб. При этом, по усредненным прогнозам российских и иностранных экспертов, к 2024 г. ожидается рост этого показателя до 300 млрд руб.
Терминологический стандарт действительно необходим, считает председатель технического комитета «Кибер-физические системы» при Росстандарте Никита Уткин: «Он должен позволить участникам рынка больших данных общаться на одном языке – терминологическое единообразие нужно, например, для составления закупочной документации, технических заданий и техдокументации».
«На этот терминологический аппарат можно будет опираться при создании регуляторных документов», – отмечает руководитель направления Big Data КРОК Кристина Проскурнина.
Представитель Mail.ru Group считает, что стандартизация терминов – полезное дело, так как она уменьшает недопонимание между участниками рынка: «Если предложенная терминология поможет в структурировании общения на заданную тему, это неплохо. Особенно для тех компаний, которые только начинают работать с большими данными».
В мире уже существует несколько международных стандартов для больших данных, определяющих понятия и термины, говорит директор Института исследований интернета Карен Казарян: «Поэтому действия Росстандарта вполне логичны. Но для бизнеса этот стандарт ничего не меняет, это, по сути, лишь словарь терминов, с которыми участники рынка больших данных и так прекрасно знакомы».
Скорее это словарь для чиновников, зачастую довольно смутно представляющих, что такое big data, – компаниям он поможет разве что при госзакупках, резюмировал Казарян.
Хотелось бы, чтобы в разработку стандартов больших данных бизнес был вовлечен глубже, заключает Уткин.