VK запустит модель ИИ для обучения на независимых дата-сетах
Такой принцип позволит выполнять требования законодательства, в том числе в сфере персональных данныхVK тестирует собственное решение для обучения искусственного интеллекта (ИИ), которое может одновременно тренироваться на данных из разных баз без их фактического обмена и риска утечки персональных данных. Этот принцип называется вертикальным федеративным обучением (VML). О разработке решения рассказал руководитель группы Data Science в подразделении VK Predict Артем Агафонов во время конференции VK JT 6 марта.
Сейчас компании для обучения аналитической модели вынуждены делиться собственными данными друг с другом, с разработчиками сервиса и владельцем инфраструктуры, занимающимся их обработкой, говорит Агафонов. Безопасность этих данных гарантируется лишь доверием между участниками процесса обучения, уточняет он. Также существует вариант, при котором компании сами обучают собственную модель, затем на предсказаниях обучают meta-модель, которая объединяет проанализированные данные, продолжает Агафонов. «Но в данном случае модели не видят всех данных сразу, а также требуется передача самих данных, что уже само по себе небезопасно», – пояснил он.