В начале 50-х годов прошлого века в Америке царил технологический оптимизм. Публика ещё не привыкла к слову «компьютер», чаще называя новые машины «электронными мозгами». Машины работали с перфокартами, на которых записывались тексты и команды, а вычисления занимали часы и даже дни. Истоки этой идеи уходят к российскому учёному Петру Петровичу Смирнову-Троянскому (1894–1950), который в 1930-х годах предложил концепцию механической переводной машины, способной работать с языковой парой русский - английский. Когда 7 января 1954 года IBM вместе с Джорджтаунским университетом продемонстрировали автоматический перевод с русского на английский, многим показалось, что человечество стоит на пороге новой эры. Казалось, ещё немного, и можно будет вставить в машину том Достоевского и через секунду получить безупречный перевод.
Прошло более семидесяти лет. Сегодня любой школьник может достать смартфон, навести камеру на иностранный текст и увидеть мгновенный перевод. Но путь к этому результату оказался куда более извилистым, чем предсказывали в середине XX века.
Демонстрация Джорджтаунского университета и IBM в 1954 году оперировала лишь 250 словами и шестью грамматическими правилами. Система работала на жёстко заданных примерах и была, по сути, демонстрационной моделью. Однако именно она породила волну интереса и гигантские инвестиции в область. Ещё чуть-чуть, несколько лет - и проблема решена. Но язык оказался хитрее математики. В 1960-е надежды столкнулись с суровой реальностью: тексты выходили тяжёлыми, непонятными, требующими обширной правки. Американский комитет ALPAC в 1966 году вынес приговор: перспективы машинного перевода переоценены, финансирование следует сократить. Для отрасли это стало «зимой», которая затянулась на десятилетия.
Возрождение пришло в конце 1980-х - 1990-х годах вместе со статистическими методами. В основе подхода лежала не попытка запрограммировать грамматику, а анализ огромных массивов текстов - параллельных корпусов. Пионером здесь стала компания IBM со своей моделью Candide, обученной на парламентских стенограммах на английском и французском объемом в 2.2 миллиона предложений. Затем в 2010-е, когда нейросети совершили качественный скачок, произошла настоящая революция. Google, Microsoft сделали перевод доступным и достаточно точным для повседневных нужд. Например, в 2016 году Google внедрил нейронный машинный перевод (GNMT) в свой сервис, что привело к резкому скачку качества - снижению ошибок на 55-85% по сравнению с предыдущей статистической моделью (arXiv:1609.08144).
Российская компания Yandex не только догнала западных гигантов, но и предложила собственные решения. «Яндекс.Переводчик», запущенный в 2011 году, умеет работать офлайн, переводить тексты прямо с камеры смартфона и даже учитывать разговорные обороты, характерные для живого языка. Система обучена на гигантских объемах данных: к 2023 году модель обрабатывала тексты объемом более 10 миллиардов слов на 100 языках (Официальный блог Яндекса. Технологии Переводчика). В условиях многоязычной страны это стало реальным инструментом повседневного общения - от туристов до бизнес-корреспонденции. Более того, успех Яндекса показал: качественные технологии машинного перевода могут развиваться не только в Кремниевой долине, но и в Москве.
Сегодня системы машинного перевода используют модели-трансформеры с миллиардами параметров, обучаются на параллельных данных, учитывают контекст целого абзаца и даже стилистические особенности. Например, современные большие языковые модели (LLM), такие как GPT-4, тренируются на триллионах слов (OpenAI: GPT-4 Technical Report). Но поразительнее всего, что та же логика, которая начиналась с простого сопоставления слов, привела к современному искусственному интеллекту. Технологии обработки естественного языка стали фундаментом для чат-ботов, голосовых помощников и генеративных систем, способных создавать тексты, музыку и изображения. По сути, опыт Джорджтаунского университета и компании IBM можно рассматривать как первую публичную демонстрацию того, что компьютер способен «понимать» язык.
Конечно, споры не утихают и сегодня. Может ли машина действительно понимать текст? Или она лишь ловко имитирует знание, оперируя статистикой? Эти вопросы столь же актуальны сейчас, как и в 1950-х. Но практический результат неоспорим: международные компании давно полагаются на автоматический перевод, дипломаты используют системы для предварительного анализа документов, а бизнес сокращает издержки, переводя технические инструкции без участия человека. Объем рынка машинного перевода оценивается в миллиарды долларов и продолжает расти более чем на 15% в год (Machine Translation Market Size, Share & Trends Analysis Report).
В ретроспективе видно, что «наивность» первопроходцев была скорее проявлением стратегического видения. Они не знали, сколько десятилетий уйдёт на реализацию мечты, но они первыми публично показали, что барьер можно хотя бы попытаться преодолеть.
Сегодня, когда искусственный интеллект вновь вызывает ажиотаж, история машинного перевода служит важным уроком. Технологический прогресс редко идёт по прямой, отмечает Стародубцева Е.А., кандидат педагогических наук, доцент кафедры английского языка и профессиональной коммуникации Финансового университета при Правительстве РФ. Завышенные ожидания сменяются разочарованием, затем приходят новые идеи и неожиданные решения. Джорджтаунский университет и IBM были первыми, кто заставил общество поверить в то, что машина может говорить. А современный ИИ лишь продолжает этот диалог, начатый в январе 1954 года на Манхэттене.