Тихое изменение в поиске, которое сделало данные дороже

В истории цифровых технологий наиболее значимыми оказываются не те изменения, которые сопровождаются громкими анонсами, а те, что происходят без деклараций и публичных дискуссий. Именно к таким событиям относится фактическое исчезновение из практики поисковой выдачи параметра num=100, позволявшего получать расширенный массив поисковых результатов в пределах одного запроса.

С формальной точки зрения речь идёт о частной технической детали интерфейса. Однако в более широком аналитическом горизонте данное изменение затрагивает сразу несколько фундаментальных процессов: экономику веб-данных, режимы доступа к знанию, инфраструктуру машинного обучения и принципы распределения информационной власти в цифровом пространстве.

Иными словами, был изменён не просто пользовательский параметр - была скорректирована логика масштабного доступа к информации.

Современная поисковая система давно перестала быть нейтральным навигационным инструментом. Она функционирует как инфраструктурный слой, через который осуществляется циркуляция знаний, капиталов, идеологий и технологических решений. Поиск не просто отражает интернет - он активно формирует его структуру.

Параметр num=100 занимал в этой системе особое положение. Он позволял пользователю или автоматизированному агенту выходить за границы первой страницы выдачи, где традиционно концентрируются наиболее коммерчески и медиатизировано успешные ресурсы. Таким образом, технически обеспечивался доступ к так называемому «длинному хвосту» интернета - массиву редко посещаемых, нишевых, специализированных и зачастую высокоэкспертных источников.

Именно этот слой интернета во многом выполнял эпистемологическую функцию предотвращения «когнитивной монополии» первых позиций.

Отмена расширенной выдачи не означает формального исчезновения глубинных страниц. Они по-прежнему индексируются, однако экономическая стоимость доступа к ним принципиально возросла. Если ранее один запрос открывал массив из ста документов, то теперь доступ к эквивалентному объёму данных требует кратного увеличения числа обращений к поисковой системе.

Экономическое следствие этого изменения очевидно: цена извлечения данных резко возрастает. То, что ранее достигалось единичным запросом, теперь требует кратного увеличения числа обращений к поисковой системе, а следовательно - больших вычислительных и сетевых затрат. Одновременно с этим усиливается риск блокировок автоматизированных систем, поскольку возросшая частота запросов делает их поведение более заметным для механизмов антибот-фильтрации. В совокупности эти факторы приводят к повышению порога входа для аналитических, академических и стартап-проектов, для которых экономическая модель сбора данных ранее оставалась устойчивой именно за счёт масштабируемой дешевизны доступа.

В результате происходит институционализация асимметрии: крупные технологические игроки сохраняют возможность масштабного доступа за счёт контрактов, частных индексов и вычислительных мощностей, тогда как малые исследовательские структуры оказываются в заведомо менее конкурентоспособном положении.

Эмпирические исследования пользовательского поведения на протяжении последних двух десятилетий демонстрируют устойчивый эффект так называемого «позиционного внимания»: подавляющее большинство пользователей не выходит за пределы первой страницы выдачи. В этом контексте ранжирование выступает не просто механизмом сортировки, а инструментом перераспределения социальной видимости.

Удаление num=100 усиливает данный эффект структурно. Поскольку глубинный слой становится менее доступным не только для пользователей, но и для аналитических инструментов, наблюдается дальнейшая концентрация трафика, знаний и экономических потоков в пределах узкого круга доминирующих источников.

Таким образом, речь идёт о процессе цифровой централизации, в котором поисковая инфраструктура выполняет функцию мягкого регулирования рынка внимания.

Отдельного рассмотрения требует влияние этого изменения на сферу искусственного интеллекта, прежде всего на обучение больших языковых моделей. Современные LLM формируют своё представление о мире преимущественно на основе интернет-корпусов, собираемых автоматизированными агентами.

Параметр num=100 долгое время фактически открывал доступ к тем слоям интернета, которые обычно скрыты за первыми страницами поисковой выдачи. Благодаря ему можно было быстро добраться до форумных обсуждений, узкоспециализированных технических тем, регионального пользовательского опыта и профессиональных дискуссий, которые редко попадают в поле зрения массовых медиа. Тем самым поиск переставал сводиться к ограниченному набору популярных ресурсов и позволял наблюдать интернет в более широком и разнообразном виде, таким, каким он существует за пределами основных цифровых маршрутов.

По мнению ассистента кафедры искусственного интеллекта Финансового университета Алёны Чупреевой, «ограничение этого канала приводит к систематическому смещению обучающих выборок в сторону высокоранжируемого, коммерчески оптимизированного и медиатизированного контента. Это приводит к явлению когнитивной стандартизации, при котором модели лучше соответствуют доминирующему контенту, но демонстрируют сниженные способности к обработке и пониманию специализированных или нишевых областей знаний.

В результате описанных изменений возникает новая форма цифрового неравенства - не столько в доступе к сети как таковой, сколько в доступе к глубине знания. Интернет перестаёт быть равномерным информационным пространством и приобретает выраженную стратифицированную структуру, где «верхний» слой характеризуется высокой доступностью, доминирующим ранжированием и коммерческим контролем, тогда как «нижний» слой остаётся труднодоступным, фрагментированным и экономически затратным для извлечения. Данный сдвиг приобретает особую значимость для академических исследований, независимой аналитики, цифровой гуманитаристики и инициатив, связанных с открытыми данными».

В совокупности удаление num=100 можно рассматривать как элемент более широкой трансформации поисковой модели: от инфраструктуры доступа к инфраструктуре контроля. Поисковая система всё в большей степени выполняет функцию экономического регулятора, перераспределяя потоки трафика, внимания и капитала.

Речь идёт не о цензуре в прямом смысле, а о структурном управлении вероятностями видимости. В этом смысле поиск становится не зеркалом интернета, а его архитектором.

Мы вступаем в эпоху, где доступ к глубине будет всё чаще определяться не только техническими навыками, но и экономическими возможностями. Интернет остаётся формально открытым — но функционально становится всё более иерархичным.

Другие пресс-релизы