Право на контент: СМИ просят законодателей урегулировать сбор данных нейросетями

Медиарынок настаивает на договорной модели вознаграждения за обучающие данные для ИИ

Freepik

Правовой вакуум в регулировании сбора данных нейросетями становится серьезной угрозой для экономики традиционных средств массовой информации. Разработчики искусственного интеллекта используют эксклюзивные и открытые материалы редакций для обучения моделей и генерации ответов, однако механизмы защиты авторских прав и компенсации трафика в законодательстве пока отсутствуют. Об этом рассказали участники сессии «Традиционные и новые СМИ: правовые инструменты и гарантии совместного развития» в рамках XIV Петербургского международного юридического форума. Представители медиаиндустрии, IT-сектора и Минцифры России констатировали: текущая версия законопроекта об искусственном интеллекте (ИИ) не устраняет дисбаланс между создателями контента и технологическими платформами. Подробнее об этом – в материале «Ведомостей».

Обращение к первоисточникам

Директор департамента развития массовых коммуникаций и международного сотрудничества Минцифры России Екатерина Ларина обозначила принципиальную рамку: министерство не разделяет СМИ на «традиционные» и «новые». По ее словам, средства массовой информации – это прежде всего юридический статус, закрепленный в законе 1991 года и предполагающий как особые права, так и особую ответственность. Проблема текущего момента, подчеркнула Ларина, заключается в том, что любой пользователь интернета сегодня фактически работает на массовую аудиторию, не осознавая последствий. Долгое время ситуацию усугубляла анонимность, которая нередко приводила к пренебрежению юридическими нормами. Для решения проблемы регулятор предлагает деанонимизацию: правила, принятые для офлайн-среды, должны в полной мере действовать и в онлайне.

Однако если в части ответственности за распространение информации шаги по совершенствованию регулирования уже наметились, то вопрос защиты интеллектуальных прав самих СМИ остается открытым. На это обратила внимание руководитель юридической службы делового издания «Ведомости» Танзиля Гурдина.

Она выделила два ключевых аспекта. Первый касается использования платного контента. По данным редакции, разработчики нейросетей собирают эксклюзивные материалы через платные подписки и применяют их в коммерческих продуктах. Такая практика, подчеркнула Гурдина, вступает в прямое противоречие с нормами Гражданского кодекса РФ и правилами подписки, опубликованными на сайте издания. Второй аспект связан с генерацией ответов на основе открытых данных. Пользователь получает готовую информацию в интерфейсе нейросети и не переходит на сайт-первоисточник.

Отдельно Гурдина отметила, что разработчики обязательно должны ориентировать ИИ-модели на использование гиперссылок. По ее словам, в каждом случае генерации ответа должна присутствовать прямая ссылка на источник – это дает пользователю возможность в один клик проверить достоверность информации и одновременно сохраняет аудиторию издания.

Что касается законопроекта о регулировании ИИ, то, как сообщила Гурдина, издание активно участвовало в его обсуждении, однако в последней версии документа не были решены поставленные медиарынком вопросы. Позиция «Ведомостей» заключается в следующем: за обучение нейросетей на высококачественных материалах, которые редакции создавали годами, должно выплачиваться вознаграждение по договору. «Регулирование нужно нам, чтобы сохранить культурную идентичность и профессиональную журналистику. Мы понимаем, что закрываться от технологий нельзя, но нужен продуманный механизм, который защитит и создателей, и общество, и сами технологии», – резюмировала она, добавив, что ИИ должен оставаться инструментом в руках профессионального журналиста, а не заменять его.

/Freepik

Эксперимент с коллаборацией и статистика ошибок

Исполнительный директор медиагруппы «Россия сегодня» Ольга Анисимова дополнила позицию медиарынка. Она сослалась на масштабное исследование Европейского союза вещателей, в ходе которого крупнейшие языковые модели – ChatGPT, Gemini, Perplexity и комбинированные системы – тестировались на понимание новостной фактуры. Аналитики изучили свыше 3000 ответов ИИ-моделей на вопросы, связанные с новостями, на 14 языках. В 45% случаев тексты содержали «по меньшей мере одну значительную проблему» – от неточных формулировок до прямых фактических ошибок.

Отдельную проблему, по словам Анисимовой, составляет подача: некорректная информация транслируется моделями в очень уверенной, аргументированной и стилистически безупречной форме. При этом часть ссылок, которые указывают агенты, выдумана. «Обычный человек, который задает вопрос такому агенту, он, честно говоря, поверит и скажет: прекрасно, замечательно, и пойдет дальше», – заметила она.

Спикер также привела личный пример. При подготовке к форуму она попыталась получить от нескольких языковых моделей информацию о регуляторной политике Китая в сфере взаимодействия СМИ и разработчиков ИИ. Модели выдавали ссылки на статьи и проекты законов, однако найти конкретный действующий нормативный акт с их помощью не удалось. Корректные данные удалось получить только через прямой запрос коллегам из агентства «Синьхуа». «Только старым дедовским способом я получила точную, конкретную, корректную информацию», – рассказала Анисимова.

При этом, как подчеркнула эксперт, аудитория, потребляющая новостной контент через системы ИИ, постепенно растет. Молодое поколение привыкает к интерфейсу языковых моделей, и по мере взросления доля таких пользователей будет увеличиваться. Это означает, что распространение новостной информации постепенно смещается к агентам, и медиарынку необходимо адаптироваться к этому сдвигу уже сейчас.

Ключевой аргумент в пользу сотрудничества, а не конфронтации СМИ и IT-сектора Анисимова проиллюстрировала результатами совместного эксперимента медиагруппы «Россия сегодня» и одной из крупнейших технологических компаний страны. Тестировались три конфигурации новостного агента: первая опиралась на разрозненные RSS-ленты разных изданий, вторая – исключительно на «открытый веб», третья получила доступ к структурированному, ежечасно обновляемому архиву информагентства. Лучшие результаты показала именно третья модель. «Коллаборация, которая у нас получилась, продемонстрировала лучшие показатели. Нужно двигаться именно к системной работе, где мы можем помочь разработчикам, и наоборот», – заключила эксперт.

Природа ошибок и границы ответственности

Директор по развитию технологий искусственного интеллекта «Яндекса» Александр Крайнов начал с терминологического уточнения. По его словам, ИИ – это зонтичный термин, объединяющий принципиально разные технологии: от прогноза погоды и видеоаналитики до больших языковых моделей и дипфейков. Регулировать их единообразно невозможно. Что касается языковых моделей, то их природу, по мнению Крайнова, полезно описывать через метафору библиотеки. «Это некое обобщение того, что написано в интернете. Когда мы говорим большой языковой модели: скажи, что ты думаешь про то-то, – ее ответ нужно трактовать так: в целом в интернете, если обобщить, про это думают как-то так. Никакого собственного мнения, никакого собственного намерения там нет», – объяснил он.

Из этого следует, что модель неизбежно содержит ошибки – в той мере, в какой их содержит сам интернет. Проблема ложных ссылок, по словам Крайнова, связана не с устройством нейросети, а со способом ее использования. «Каждый раз, когда звучит фраза «мне модель выдала несуществующую ссылку», это означает одно – неправильное, непрофессиональное использование. При нормальной формулировке запроса я готов три часа сидеть, вводить сложные запросы, и будут правильные ссылки», – отметил он. При этом он признал, что полностью исключить ошибки невозможно, и предложил сравнивать результаты работы ИИ не с абстрактным идеалом, а с реальной деятельностью человека. Если человек ошибается в 10% случаев, а модель в 5%, то отказ от модели приведет не к повышению качества, а к росту числа ошибок.

/Freepik

Отдельно Крайнов остановился на проблеме ответственности разработчика. По его мнению, невозможно требовать объяснять каждое решение от модели, насчитывающей сотни миллиардов параметров. Это объясняется тем, что человеческий мозг не обладает достаточной вычислительной мощностью, чтобы осознать взаимодействие такого числа факторов. Однако это не означает отказа от ответственности – по его словам, она должна наступать не за сам факт ошибки, а за несоблюдение регламентов.

Текущий этап регулирования Крайнов оценил сдержанно позитивно, сравнив его с асфальтированием протоптанных дорожек. «Сейчас дорожки протоптаны, но их не заасфальтировали. Текущий закон аккуратно посыпает гравием, песочком и ставит таблички «Ходить вот сюда». Никаких заборов нет, и это допускает возможность того, что появится еще какая-нибудь новая дорожка», – рассказал он. Главное достижение, по его мнению, в том, что ИИ перестал демонизироваться и восприниматься как «Терминатор», а регулирование превратилось в предметный разговор людей, понимающих тему.

Европейский опыт, этика и вопрос о маркировке контента

Международный контекст обсуждения обозначил эксперт Международной ассоциации по фактчекингу (GFCN) и внешний академический эксперт Консультативного комитета Совета ООН по правам человека Александр Геррейро. По его оценке, европейский опыт регулирования ИИ демонстрирует риски избыточной «зарегулированности». Принятый в Евросоюзе AI Act (Акт об искусственном интеллекте) оказался документом, практическое применение которого затруднено: после его вступления в силу были выпущены рекомендации по запрещенным действиям, отраженным в статье 5, объемом, превышающим сам текст закона. «Это, по сути, отрицание существования всей системы, поскольку система должна быть понятна и прозрачна для всех», – отметил Геррейро. Среди базовых принципов, которые эксперт считает обязательными для любого регулирования, он выделил четыре: обязательный человеческий контроль на финальной стадии, безопасность IT-платформ, прозрачность состава участников разработки и ответственность разработчика за продукт на всех этапах его жизненного цикла.

Тему человеческого контроля и профессиональных стандартов продолжила заместитель заведующего кафедрой интеллектуальных прав МГЮА им. О. Е. Кутафина Елена Гринь. Она отметила, что в судебной практике уже формируются подходы к охране результатов, созданных с использованием ИИ. В частности, российские суды начали признавать, что промпт, сформулированный человеком с творческим вкладом, может порождать охраноспособное произведение. Одновременно появляются и негативные кейсы: например, был зафиксирован случай привлечения к ответственности юристов, которые с помощью ИИ подготовили исковые документы со ссылками на несуществующую судебную практику. Суд прямо указал на недопустимость такого подхода и необходимость предупреждать о факте использования ИИ.

Доцент кафедры криминалистики, директор Научно-образовательного центра МГУ им. М. В. Ломоносова «Право и СМИ» Евгения Крюкова предложила разграничить использование ИИ журналистом-профессионалом и обычным пользователем. В первом случае, по ее мнению, должна наступать полноценная ответственность за атрибуцию, подписание и итоговую достоверность контента, созданного при помощи нейросети. Во втором – действовать режим информирования, при котором читателя или зрителя предупреждают о применении технологий ИИ, оставляя критическую оценку за аудиторией.

Крюкова также высказалась за введение изменений в редакционные стандарты и кодексы этики, которые дали бы журналистам и блогерам практические ориентиры по работе с агентами и цифровыми аватарами. Отдельно она обратила внимание на необходимость контроля за небольшими языковыми моделями: в отличие от крупных игроков вроде «Яндекса», чьи подходы к качеству данных прозрачны, малые нейросети зачастую разрабатываются и наполняются контентом без какой-либо верификации источников.