Минцифры определит стандарт персональных данных для искусственного интеллекта

При этом обезличивать их должно государство, считают в ведомстве
Евгений Разумный / Ведомости

Минцифры обсуждает с IT-отраслью унификацию методов обезличивания персональных данных (ПД) и работы с ними для субъектов критической информационной инфраструктуры (КИИ), чтобы впоследствии эти данные можно было использовать для обучения алгоритмов искусственного интеллекта. К таким субъектам относятся, например, госорганы, операторы связи и т. д. Об этом заявил замглавы Минцифры Александр Шойтов на круглом столе конференции OS DAY 23 июня.

«У нас есть задача разработать методы унификации для искусственного интеллекта. <...> Это отправная точка, именно в критических применениях (для субъектов КИИ. – «Ведомости»). Где критических применений не будет, эта унификация, наверное, не будет обязательной», – сообщил Шойтов. По его словам, требования по унификации и стандартизации государству должны предложить сами разработчики.

Минцифры ведет отдельную работу над методологией в области обезличивания данных, применяемых для обучения ИИ, подтвердил представитель ведомства. Сейчас в Госдуму внесен проект федерального закона, в котором предусматривается нормативное регулирование одного из подходов к обезличиванию данных, добавил он. Этот подход предполагает, что обезличиванием будет заниматься государство.

«Отдельное внимание в документе уделено процедуре обезличивания, методикам, средствам. Чтобы никаким образом невозможно было установить исходные данные и нанести ущерб конкретному гражданину», – сообщил представитель Минцифры.

Доступ к обезличенным ПД позволяет создавать новые технологии, обучать нейросети, но остается риск их «восстановления» и идентификации их владельцев, объяснял замруководителя Роскомнадзора Милош Вагнер, выступая в начале июня на конференции «Цифровая индустрия промышленной России» (ЦИПР-2023). Проблема, по его словам, заключается в том, что сейчас оборот обезличенных данных регулируется законом «О персональных данных» и, соответственно, должна соблюдаться конфиденциальность этих сведений.

Представитель Роскомнадзора переадресовал вопросы в Минцифры и добавил, что «любая обработка ПД российских граждан, в том числе с использованием ИИ, должна соответствовать требованиям законодательства в области защиты прав субъектов персональных данных».

667 Млн

записей с персональными данными утекло в России в 2022 г. по данным Infowatch

Регулировать сбор данных для обучения моделей ИИ действительно необходимо, считает директор по продуктам Just AI Глеб Обломский. Сейчас никто не контролирует, какие именно данные компании используют для обучения моделей, объясняет эксперт. Унификация данных для ИИ включает процесс предобработки, объединения и стандартизации потоков сырых данных для совместимости, облегчения анализа и использования их ИИ. Поэтому ведомству предстоит также определить требования к финальному формату чистых данных, добавляет Обломский.

Помимо того, должны быть унифицированы базовые требования к работе моделей, хранению и поиску данных, рассуждает партнер «Лиги цифровой экономики» Михаил Бараблин. «Сейчас каждый пример применения ИИ – почти уникальное, штучное решение. Унификация удешевит и ускорит внедрение новых подходов», – говорит он. По его прогнозам, на эту работу уйдет не менее трех лет. В первую очередь унификация должна коснуться открытых данных ведомств и процессов межведомственного взаимодействия, полагает Бараблин.

При разработке и применении ИИ обеспечение безопасности должно выполняться в соответствии с требованиями и стандартами в конкретной индустрии, считает ведущий эксперт департамента развития бизнеса компании Softline Денис Маколин. В то же время важно соблюдать баланс между необходимыми степенью защиты данных и уровнем доступности для исследователей и разработчиков. Обязательная всеобщая унификация и стандартизация может помешать развитию ИИ-отрасли, уверен заместитель директора Центра технологий ИИ «Сколтеха» Максим Кузнецов. Это объясняется не только тем, что каждый бизнес имеет свои уникальные потребности и цели, но и тем, что подход, которым руководствуется ИИ, должен быть столь же уникален и приспособлен под эти нужды, считает эксперт. Вместо обязательной унификации и стандартизации, на наш взгляд, лучше развивать научное сообщество, стимулировать связи разработчиков с бизнесом, заключил он.