Машинное обучение — это класс вычислительных методов, предназначенных для построения моделей, обучающихся на данных для выполнения конкретных задач, без использования вручную заданных правил или эвристик. Оптимизируя производительность на больших наборах данных, эти модели способны выявлять сложные закономерности и взаимосвязи, тем самым поддерживая как предсказательные, так и описательные возможности.
В результате машинное обучение достигло значительных успехов в различных областях, включая обработку естественного языка, компьютерное зрение, финансовое моделирование и автономные системы и др. С постоянным расширением доступности данных и вычислительной мощности машинное обучение стало краеугольным камнем как в академических исследованиях, так и в промышленной практике.
В то же время кибербезопасность претерпела глубокие изменения. Современные информационные системы теперь тесно взаимосвязаны, неоднородны и всё больше определяются программным обеспечением, что обусловлено широким распространением умных устройств, облачных вычислительных платформ и архитектур на периферии. Эта эволюция значительно расширила поверхность кибератаки, подвергая цифровую инфраструктуру более сложным, скрытным и масштабным угрозам.
Традиционные механизмы безопасности, такие как межсетевые экраны на основе правил, системы обнаружения вторжений вручную и сканеры вредоносного ПО на основе подписей, оказываются недостаточными для решения этих возникающих проблем. Их зависимость от статических правил и известных паттернов угроз ограничивает их способность обнаруживать новые кибератаки. В результате возникает острая потребность в интеллектуальных, адаптивных и основанных на данных подходах к безопасности, способных учиться на динамических условиях и проактивно реагировать на меняющиеся угрозы.
Машинное обучение предлагает мощные инструменты для решения новых проблем кибербезопасности. Позволяя системам учиться на прошлом поведении, обрабатывать большие объёмы данных и своевременно принимать решения, методы машинного обучения демонстрируют значительный потенциал в различных областях приложений безопасности. К ним относятся обнаружение вторжений, классификация вредоносного ПО, обнаружение аномалий, анализ сетевого трафика, обнаружение уязвимостей и моделирование поведения. Например, системы обнаружения вторжений на основе машинного обучения могут различать безобидный и вредоносный трафик, выявляя закономерности в сетевых потоках. Аналогично, классификаторы вредоносного ПО могут обнаруживать вредные исполняемые файлы, анализируя либо статические особенности кода, либо динамические действия во время выполнения. В отличие от традиционных методов на основе правил, модели машинного обучения способны адаптироваться к новым угрозам и часто поддерживают высокую точность в различных наборах данных и операционных средах.
Растущее внедрение машинного обучения в кибербезопасности дополнительно подпитывается экспоненциальным увеличением объема и сложности данных. Современные цифровые системы, включая корпоративные серверы, мобильные устройства и встроенные IoT-платформы, непрерывно генерируют крупные потоки крупноразмерных и часто немаркированных данных. Извлечение значимых данных из этих данных в реальном времени требует масштабируемых, шумостойких и адаптивных алгоритмов, способных работать с нестационарными распределениями с низкой задержкой. Модели глубокого обучения, такие как сверточные нейронные сети, рекуррентные архитектуры и трансформаторы, продемонстрировали высокую производительность в этих условиях.
Однако слияние машинного обучения и кибербезопасности также несёт значительные риски. Несмотря на свои возможности, модели машинного обучения по своей природе уязвимы к различным формам враждебной манипуляции. Злоумышленники могут создавать враждебные примеры, которые тонко нарушают входные данные, вводя классификаторы в заблуждение, отравляя обучающие данные для снижения производительности моделей. Эти уязвимости создают новые векторы атак, которые нацелены на сам алгоритм обучения, а не на системы, которые он предназначен защищать. Более того, противники всё чаще используют машинное обучение для повышения эффективности, скрытности и масштабируемости своих атак, создавая динамику двойного назначения, при которой и злоумышленники, и защитники опираются на схожие технологии.
Быстрая эволюция киберугроз и растущая гонка вооружений между оборонительным и наступательным применением машинного обучения подчеркивают острую необходимость всестороннего понимания того, как эти технологии применяются, оцениваются и защищены. По мере того, как хакеры развивают более сложные и адаптивные методы, защитники от киберугроз должны постоянно совершенствовать свои инструменты и стратегии, чтобы не отставать. Машинное обучение стало одновременно мощным фактором создания систем защиты следующего поколения и новой целью для кибератаки. Эта двойная роль создаёт сложные задачи, включая обеспечение надёжности, интерпретируемости и надёжности механизмов безопасности, основанных на машинном обучении. Для студентов, исследователей и практиков в области кибербезопасности уже недостаточно просто применять алгоритмы машинного обучения. Они также должны предвидеть враждебное поведение, выявлять скрытые режимы отказа и проектировать системы, которые могут безопасно работать в динамической, напряжённой среде.
Примеры использования машинного обучения в системах кибербезопасности отображены в представленной ниже таблице.

Профессором кафедры «Безопасность жизнедеятельности» Финансового университета, д.т.н. Шахраманьяном М.А. разрабатываются предложения по использованию машинного обучения для защиты от киберугроз в системах предупреждения и ликвидации чрезвычайных ситуаций.
Таким образом исходя из вышеизложенного можно констатировать, что одним из наиболее перспективных направлений развития систем кибербезопасности является использование в них машинного обучения, но при этом необходимо учитывать и возникающие при этом риски, связанные в том числе и с тем, что модели машинного обучения уязвимы к различным формам враждебной манипуляции.