МВД привлечет нейросети к поиску правонарушителей

Ведомство хочет заказать разработку систем «Клон» и «Конъюнктура» на базе ИИ
Современный робокоп может оказаться нейросетью, умеющей предсказывать чрезвычайные ситуации / Дмитрий Лебедев / Коммерсантъ

Министерство внутренних дел планирует внедрить искусственный интеллект (ИИ) в правоохранительную деятельность. В 2024 г. ведомство собирается провести научно-исследовательскую работу (НИР) и подготовить датасеты для обучения и тестирования нейросетевых моделей, а в 2025 г. разработать две системы на базе ИИ «Клон» и «Конъюнктура». «Клон» позволит выявлять факты подделки видеоизображений в интересах правоохранительной деятельности, «Конъюнктура» должна прогнозировать негативные события и чрезвычайные ситуации и моделировать сценарии реагирования на них.

Такие мероприятия включены в план по внедрению технологий ИИ в деятельность органов внутренних дел РФ на 2023–2025 гг. План утвержден заместителем министра внутренних дел Виталием Шуликой. «Ведомости» ознакомились с документом, его подлинность подтвердил сотрудник крупного IT-интегратора, работающего с госзаказами. «Ведомости» направили запрос в МВД.

Для реализации этих планов в подведомственных МВД Главном информационно-аналитическом центре (ГИАЦ) и НПО «Специальная техника и связь МВД России» (НПО СТиС) в 2024 г. будут созданы специальные подразделения, указано в документе. Также департамент информтехнологий, связи и защиты информации МВД, ГИАЦ И НПО СТиС должны будут до конца 2024 г. создать лабораторию анализа данных (песочницу) для моделирования и управления данными.

Представитель Минцифры отказался комментировать планы МВД. «Ведомости» направили запрос в Минэкономразвития (отвечает за федеральный проект «Искусственный интеллект» нацпрограммы «Цифровая экономика»).

Это не первая попытка МВД внедрить системы с ИИ. Осенью 2020 г. РБК со ссылкой на презентацию ведомства сообщал, что МВД может разработать систему, которая позволит составлять фотороботы серийных убийц на основе обнаруженной ДНК. А в 2021 г. «Коммерсантъ» писал, что тендер на проведение подготовительной НИР «Анатомия» выиграло АО «Центр генетики и репродуктивной медицины «Генетико». Информации о результатах НИР в публичном доступе нет. Но в плане МВД по внедрению ИИ говорится, что «инструменты ИИ изучены и внедрены в рамках решения отдельных задач: НИР «Зеркало (Верблюд)», НИР «Серия», НИР «Анатомия 1», НИР «Дозор», интеллектуальной модели прогнозирования преступлений «Виктория» и подсистемы «Опознание (биометрическая идентификация)» программно-технического комплекса «ИБД-Ф».

Подобных «Клону» и «Конъюнктуре» готовых продуктов сейчас на российском рынке нет, говорит заместитель директора Центра компетенций НТИ «Технологии доверенного взаимодействия» на базе ТУСУРа Руслан Пермяков.

Полные их аналоги отсутствуют по причине достаточно узкой специфики решаемых задач, согласна коммерческий директор РДТЕХ Светлана Иванова. Подрядчиком может быть любая компания, но такая разработка предполагает доступ к гостайне, поэтому для этого нужна специальная лицензия, подчеркивает Пермяков.

За рубежом продукты, подобные «Клону» и «Конъюнктуре», уже существуют и используются для анализа и прогнозирования, отмечает директор центра разработки Artezio (входит в группу «Ланит») Дмитрий Паршин. Например, «Клон» напоминает сервис Deepfake Detection Challenge, разработанный Facebook, Microsoft и Amazon для обнаружения подделок видеоизображений с помощью ИИ. «Конъюнктура» схожа с сервисом IBM Watson Openscale, который предназначен для мониторинга и управления ИИ-моделями. Близкие по своим задачам системы создаются не только лидерами рынка, но и НКО, отмечает технический директор HFLabs Никита Назаров, приводя в пример заявление ученых ДГТУ (Ростов-на-Дону) о создании подобного решения, сделанное в октябре 2023 г.

Говорить о создании финального и универсального продукта пока рано, так как технологии deepfake совершенствуются, а разработчики противодействия им находятся в роли догоняющих, продолжает Назаров. Решение для прогнозирования негативных и чрезвычайных ситуаций сделать сложнее, поскольку нужно понимать конкретные сценарии его применения и в зависимости от этого формировать набор данных, отмечает эксперт. Среди примеров схожих решений он назвал Palantir Gotham и Palantir Foundry, которые выступают как системы поддержки принятия решений с ИИ-функциями. 

Создание песочниц, которые представляют собой специализированные среды для безопасного и эффективного обучения нейросетевых моделей на больших объемах данных, – вполне ожидаемый шаг ведомства, считает Паршин. Сейчас есть как публичные, так и частные песочницы данных. Например, GitHub и Kaggle предлагают обширные коллекции, которые можно применить для обучения нейросетей. Вероятнее всего, в случае с МВД могут быть использованы как собственные, так и открытые данные, допустил Паршин. Сюда могут относиться текстовые, графические, видео-, аудио-, географические, биометрические и другие типы данных, предполагает эксперт. 

Под песочницей обычно подразумевают изолированную среду для безопасного использования программ, а также проведения различных экспериментов, напоминает Назаров. ​​Как правило, песочницы формируются под конкретную задачу, а после этого становится понятно, какое количество данных нужно для обучения моделей.

Действующая песочница уже есть у Ассоциации больших данных (АБД). Сейчас в песочнице АБД обрабатываются наборы отраслевых датасетов и данные из открытых источников, уточнил представитель ассоциации, отказавшись раскрыть объемы и цели использования информации. Кроме этого, ассоциация планирует апробировать использование песочницы для работы с обезличенными данными в рамках экспериментального правового режима «Доверенный посредник в сфере данных», добавил он.

Минцифры в 2022 г. анонсировало создание системы «Госдата.хаб» для агрегирования обезличенных данных органов власти и бизнеса и обучения на них разнообразных алгоритмов, продолжил Назаров. Кроме того, в интернете масса открытых наборов данных для обучения моделей ИИ – FakeAVCeleb, FaceForensics++ и др., перечисляет он. В основном датасеты формируются на основе видео с YouTube, отметил эксперт.

Ключевой момент при создании датасетов заключается не только в сборе данных с нуля, но и в возможности переиспользовать данные и других ведомств, собранные под иные задачи, подчеркивает эксперт рынка НТИ «Нейронет», директор по развитию компании EKF Татьяна Мосендз. Это связано с тем, что колоссальный потенциал для решения задач как раз открывается в случае применения коллективного создания датасетов и алгоритмов их обработки, указывает она.

О публичных песочницах известно мало, существуют только частные проекты, предоставляющие датасеты на возмездной основе, говорит Пермяков. Вероятнее всего, песочница МВД будет доступна только для проектов в интересах ведомства, полагает он. Кроме того, данные для обучения можно собирать из открытых источников и с камер, входящих в систему умного города, допустил эксперт.