Современные гуманитарные и социальные науки переживают методологическую революцию. Еще недавно социологи и культурологи опирались преимущественно на интервью, опросы и небольшие выборки анкет. Сегодня же в их распоряжении оказываются огромные массивы цифровых следов человеческой деятельности – от постов в социальных сетях до записей умных устройств. В эпоху больших данных и искусственного интеллекта (ИИ) гуманитарии переходят от работы с ограниченными данными к анализу больших объемов информации, что позволяет выявлять новые тенденции и закономерности.
Традиционные методы социологических исследований – например, опросы и глубинные интервью – долгое время оставались основой сбора информации о мнении и поведении людей. Однако такие методы имеют ограничения по масштабу и репрезентативности. Новые технологии меняют подход: теперь исследователи могут анализировать цифровые «следы» миллионов людей. Американский ученый Алекс Пентланд назвал этот подход «социологией XXI века», отмечая, что цифровые данные «дают нам шанс рассматривать общество во всей его сложности, через миллионы сетей личных обменов». По сути, возникла новая научная парадигма, которая стала ответом на кризис классической эмпирической социологии: прежние методы опросов постепенно уступают место интеллектуальному анализу данных и геоинформационным методам.
Большие данные представляют собой естественно возникающие массивы информации, порождаемые самими социальными процессами. В каждом лайке, комментарии или поисковом запросе заключены сведения о предпочтениях, связях и настроениях людей. Анализируя их, можно получить более объективную картину общественных процессов, чем при работе с ограниченным числом респондентов. К примеру, вместо сотни анкет теперь доступны данные сотен тысяч пользователей, что дает статистически более надежные результаты. Кроме того, автоматизированный сбор и обработка данных позволяют экономить время исследователей: то, на что раньше уходили месяцы полевых исследований, сейчас может быть обработано алгоритмами за считанные часы.
Одно из ключевых направлений новой социологии данных – анализ и моделирование социальных сетей в широком смысле. Речь идет не только об онлайн-платформах вроде ВКонтакте, но и о любых структурах связей между людьми. С помощью методов социально-сетевого анализа и машинного обучения исследователи строят графы, где узлы – это люди или организации, а связи отражают взаимодействия (общение, дружба, обмен информацией). Машинное обучение помогает выявлять скрытые сообщества, лидеров мнений и центры влияния в таких сетях. Например, алгоритмы могут проанализировать миллионы взаимодействий в зарубежных социальных сетях или ВКонтакте и обнаружить группы пользователей, объединенных общими интересами или идеологией, что было бы крайне трудоемко для традиционных методов.
Анализ контента, распространяемого в социальных сетях, дает возможность изучать общественное мнение и культуру в реальном времени. Алгоритмы обработки естественного языка способны определять тональность (положительную или негативную) сотен тысяч сообщений, выявляя настроения больших групп людей. Это трансформирует классическую качественную социологию: вместо отдельных фокус-групп исследователь получает практически непрерывный мониторинг общественных настроений. Так, академические и коммерческие проекты все чаще используют сбор данных из социальных медиа для «оперативной социологии», отслеживая, как меняется реакция общества на события день ото дня.
Если традиционная социология обычно описывала текущее или прошедшее состояние общества, то с помощью машинного обучения исследователи делают шаг к прогнозированию будущего. Анализ больших данных дает инструменты для выявления ранних сигналов изменений. Еще в 2010-х годах на Западе начался бум идей о том, как использовать цифровой контент для прогнозов. Например, аналитики предлагали отслеживать вспышки гриппа по частоте соответствующих поисковых запросов, а больницы – анализировать социальные сети для предсказания эпидемий. В некоторых случаях анализ контента соцсетей позволял предугадывать стихийные бедствия и их последствия.
Машинное обучение в прогнозной аналитике применяется и в общественно-политической сфере. Специальные алгоритмы могут по активности пользователей предугадать результаты выборов или референдумов, а также выявить назревающие протестные настроения. Известно, что большие данные берут на вооружение даже политтехнологи – например, для влияния на электоральные предпочтения избирателей. В бизнесе и экономике схожие модели помогают прогнозировать тренды потребительского спроса и финансовые риски, анализируя поведение клиентов. Таким образом, границы между социологическим исследованием и прикладным анализом рынка стираются: и там, и там работают с одними и теми же массивами данных о человеческой активности.
По мнению Алексея Николаевича Чернякова, кандидата философских наук, доцента кафедры информационных технологий Факультета информационных технологий и анализа больших данных Финансового университета при Правительстве Российской Федерации, интеграция машинного обучения в гуманитарные исследования открывает принципиально новые горизонты. Большие данные позволяют ученым обнаруживать скрытые закономерности в культуре и обществе, проверять социальные теории на материале огромных выборок и моделировать сложные процессы – от распространения информации до формирования сообществ. Одновременно возрастает роль междисциплинарности: чтобы использовать потенциал новых методов, гуманитариям приходится осваивать инструменты data science, а аналитикам данных – вникать в контекст социальных наук.
Это делает социологию более прогностической, а значит, способной оперативнее реагировать на вызовы времени и предлагать более обоснованные решения для бизнеса, государства и общества в целом.