Большое будущее больших данных

Как будут развиваться решения на базе технологий искусственного интеллекта

Мировой рынок программного обеспечения на основе технологий искусственного интеллекта (ИИ), по оценке IDC, будет расти в среднем на 31,4% в год и к 2027 г. превысит $251 млрд. А с учетом сегмента робототехники, устройств интернета вещей и др. эта цифра составит свыше $400 млрд, оценивают эксперты Markets and Markets. С ростом капиталоемкости этого направления значение технологий искусственного интеллекта во всех отраслях будет увеличиваться.

Впервые о тренде на ИИ в экспертной среде активно заговорили лет пять-шесть назад. Тогда же было отмечено, что развитие искусственного интеллекта будет сконцентрировано вокруг нескольких сильных базисных моделей, как, например, BERT от Google и серии GPT-n от OpenAI, то есть нейросетей, которые обучаются независимым от задач способом на необработанных данных.

Очевидно, что инвестиции в развитие этих моделей будут настолько существенны, что позволить их себе смогут только крупные корпорации и даже очень небольшой периметр стран. И сейчас, когда немногим более года назад на рынок вышли первые глубокие языковые модели, этот прогноз себя оправдал.

По оценке аналитиков Air Street Capital, на обучение одной большой языковой модели в 2024 г. будет тратиться более $1 млрд, и эта цифра будет только расти. Это будет происходить, в частности, из-за того, что дальнейшее развитие этих моделей будет идти в сторону более сложных модальностей: уже не только текста, но и изображений, а также видео и аудио. А это, в свою очередь, потребует увеличения вычислительных мощностей.

Соответственно, развитие технологий искусственного интеллекта будет оставаться в руках крупных компаний и корпораций. Тогда как еще 15‒20 лет назад мяч был на стороне отдельных энтузиастов, которые могли буквально у себя на домашнем компьютере или ноутбуке изобрести новые алгоритмы машинного обучения, такие как Boosting.

Однако это не значит, что более мелким, небольшим игрокам не будет места на рынке. Скорее наоборот, я думаю, что количество ниш увеличится. В частности, из-за того, что необходимо будет исследовать те глубокие модели, которые делают и будут делать крупные корпорации либо поставщики open-source. Будут востребованы люди, которые пишут запросы к языковым моделям, пытаются с ними найти общий язык для того, чтобы решить конкретную бизнес-задачу. 

Кроме того, очевидным трендом станет и развитие персональных ассистентов: их навыки будут совершенствоваться, и, как следствие, будет расширяться число сфер их применения. А значит, они составят обширное поле для деятельности всевозможных стартапов.

Еще одним трендом, мне кажется, станут непосредственно сами данные. На рынке сейчас ни для кого не секрет, что данные ‒ это не просто нефть, которую хочется продавать, это такой ценный продукт, из него хочется сделать уже переработанное сырье, которое станет еще дороже. Все компании стараются развивать сервисы на их основе, а не отдавать их в «сыром» виде.

При этом каждый следующий этап развития ИИ требует больших объемов данных для обучения моделей. И на мой взгляд, будущее развитие искусственного интеллекта ‒ в новых технологиях по обмену данными. Как, например, комплекс по безопасному обмену данными «Криптоанклав» от ВТБ. Или распределенные вычисления, которые позволят, не раскрывая всего периметра данных для конкретных целей, полностью безопасно объединять эти данные для построения больших сильных моделей.

Третий, помимо железа и данных, компонент ИИ ‒ это люди. Это направление ничуть не менее значимое, и, мне кажется, в нем появится очень много ярких трендов. Один из самых интересных ‒ «цифровая гуманитаристика». Известно, что при обучении на большом корпусе диалогов с пользователями модель OpenAI потеряла сложные когнитивные навыки, такие как суммаризация научных статей. Это означает, что обучение модели станет не только техническим упражнением, но цифро-гуманитарным: разметка и подготовка данных может превратиться из низкоквалифицированного труда в задачу для лучших умов человечества по выводу ИИ на новый уровень осознанности.