Новая профессия – специалист по обучению беспилотников

Чтобы самоуправляемые автомобили могли передвигаться по улицам, необходима ручная работа сотен тысяч сотрудников
Алексей Таранин

Самоуправляемые автомобили могут показаться волшебством. Идея транспортного средства, которое не нуждается в поворотах руля или нажатии на педали, как будто сошла со страниц фантастических романов.

Однако, как и многие фантастические истории, она может быть реализована благодаря волшебникам, искусство которых остается незамеченным, – и их очень много. Как оказалось, проложить путь для полностью самоуправляемых автомобилей невозможно без огромного количества ручного труда.

Большинство компаний, разрабатывающих технологии беспилотных автомобилей, нанимают сотни, а то и тысячи человек – часто в таких центрах зарубежного аутсорсинга, как Индия и Китай. Задача всех этих людей – научить машины распознавать пешеходов, велосипедистов и другие препятствия. Эта работа делается вручную путем маркировки, часто кадр за кадром, тысяч часов видеосъемки, полученных с прототипов беспилотных автомобилей с тестовых полигонов в Кремниевой долине, Питсбурге и Фениксе.

«Машинное обучение – миф, это все работа для волшебника из страны Оз, – говорит Джереми Конрад, инвестор из Lemnos Labs в Сан-Франциско. – Команды, занимающиеся маркировкой видео, имеют невероятно важное значение для каждой компании, и потребность в них сохранится еще какое-то время, потому что технологии развиваются, а внешняя среда меняется очень быстро».

Разметка для робота

Значительный прогресс в развитии технологий искусственного интеллекта, в качестве сенсоров и мощности компьютеров заложил технологические основы для беспилотной революции. Однако, несмотря на все инновации, присутствие людей за кулисами процесса будет необходимо еще многие годы: они будут отмечать на видео деревья и дорожные знаки, чтобы данные в системах оставались актуальными.

«Специалисты-практики в сфере искусственного интеллекта самонадеянно заблуждаются, считая, что компьютеры могут решить все проблемы», – говорит Мэтт Бенке, основатель и генеральный директор компании Mighty.ai, привлекающей работников на неполный рабочий день с целью обработки и маркировки данных для машинного обучения для технологических компаний.

Подобная проблема существует для любых систем, использующих искусственный интеллект: компьютеры учатся, поглощая огромный объем вручную промаркированной информации, чтобы распознавать объекты и закономерности, когда они встретятся им снова.

Научить автомобиль

Обучение самоуправляемых автомобилей сложнее, чем других систем искусственного интеллекта, из-за бесчисленного разнообразия ситуаций, в которых может оказаться машина. Системы научатся делать поправки на погодные условия и уровень освещенности в разное время суток или года, но городская среда может кардинально измениться за ночь из-за строительных работ, проведения праздников, митингов или из-за аварии. «Процесс маркировки – это скрытые издержки, о которых руководители компаний, проектирующих самоходные транспортные средства, обычно не говорят. Это очень трудоемко и утомительно», – говорит Самип Тандон, генеральный директор Drive.ai, стартапа, разрабатывающего беспилотные автомобили.

Уровень точности, требующийся в этой сфере, также выше, чем для других систем искусственного интеллекта. Беспилотный автомобиль строит маршрут, сравнивая картинку окружающей местности, получаемую с камер и сенсоров, с имеющейся у него детальной трехмерной картой. Безопасность имеет первостепенное значение: если система распознавания лиц в Google Photos не идентифицирует человека на фотографии, это неудобно; если самоуправляемый автомобиль Waymo не заметит пешехода, это может закончиться для последнего фатально.

Одним из критериев успеха в гонке разработчиков беспилотных автомобилей является количество километров, которое проехали машины компании. Waymo в мае заявила, что ее самоуправляемые автомобили проехали 3 млн миль (4,8 млн км) по дорогам общего пользования. Tesla в прошлом году сообщала, что для разработки системы автопилота собрала данные более чем о 100 млн миль (160 млн км) дорог от владельцев своих автомобилей.

Час поездки – 100 часов работы

Больший километраж означает больший объем работы для тех, кто вручную обрабатывает полученные данные. Даже если беспилотный автомобиль проедет всего несколько километров, он может получить десятки гигабайт данных. Такие объемы уже не получается быстро передавать по беспроводным каналам связи. Вместо этого данные записывают на жесткий диск, который посылают во внешний центр обработки. Для такой передовой отрасли подобная логистика может показаться архаичной.

Каждый час езды беспилотного автомобиля может потребовать сотен часов работы по превращению полученных результатов в полезные данные, говорит Дэвид Лю, генеральный директор Plus.ai, еще одного стартапа из Кремниевой долины, занимающегося разработкой систем беспилотного вождения. По его словам, чтобы самоуправляемые автомобили могли ездить везде, нужны сотни тысяч, а возможно, и миллионы часов данных. Чтобы получить их, понадобятся сотни тысяч людей по всему миру.

Крупные технологические компании предпочитают не привлекать внимание публики к «ручному» аспекту работы с беспилотными технологиями. Ни Waymo, ни Uber, ни Tesla не согласились дать комментарии для этой статьи. «Очень трудно заставить людей говорить об этом. Все предпочитают говорить о магии машинного обучения», – указывает профессор информатики и программирования в University of Washington в Сиэтле Дэн Вельд.

Случаи публичного признания бывают редко. Так, еще в 2013 г. во время одной из встреч в University of California в Беркли бывший инженер Waymo и Uber Энтони Левандовски описал команду Google в Индии как «людей-роботов», маркирующих изображения, полученные через сервис Street View.

Большой бизнес

Такой трудоемкий процесс обходится недешево. В отрасли оценивают создание и поддержание актуальности карт для самоуправляемых автомобилей для всех городов США в миллиарды долларов в год.

Уровни самостоятельности

Сообщество автомобильных инженеров разработало классификацию беспилотных автомобилей, которая содержит шесть уровней, от нулевого до пятого, наивысшего. На нулевом уровне компьютер не контролирует машину, но имеет систему уведомлений для водителя. На втором уровне компьютер управляет ускорением, торможением и рулением кара, но водитель должен вмешиваться, если автопилот не смог справиться самостоятельно. Водитель может отключить автопилот. На пятом уровне действия человека ограничиваются стартом системы и указанием пункта назначения, компьютер полностью берет на себя поездку до любой точки назначения.

Некоторые стартапы видят возможности для развития бизнеса в этой сфере. Такие компании, как Plus.ai, Deepmap и Drive.ai, утверждают, что они могут использовать технологию «глубокого обучения», чтобы снизить вклад человеческой ручной работы, при этом сохранив необходимую для безопасного функционирования самоуправляемых автомобилей точность. Глубокое обучение – более новая и передовая технология обучения машин, стремящаяся воспроизвести аналитические процессы человеческого мозга.

«С машинным обучением очень сложно добиться точности выше 90–95%, однако глубокое обучение позволяет построить такую модель гораздо легче», – говорит Джеймс Ву, генеральный директор компании Deepmap, в мае привлекшей $25 млн финансирования.

Другие компании отрасли не думают, что глубокое обучение совсем избавит от потребности в ручном труде людей. Бенке из Mighty.ai напоминает о трудностях, с которыми столкнулись Facebook, YouTube и Twitter в борьбе с различными злоупотреблениями на страницах их платформ – от оскорблений до пропаганды терроризма. «Если бы у глубокого обучения были такие возможности, неужели вы думаете, что Facebook и другие до сих пор не решили бы эту проблему? Она ведь гораздо проще, чем задача обучения самоуправляемых автомобилей, а рынок велик», – говорит он.

Исследователи в сфере искусственного интеллекта повсеместно заняты задачей, как научить машины обучать друг друга самостоятельно, без помощи людей. Пока же разработчики роботов из Кремниевой долины и Детройта надеются, что клиенты и инвесторы по-прежнему не будут обращать внимания на то, что разрабатываемые ими чудо-машины не способны работать без труда многих людей, о котором мало кто знает.

Перевела Надежда Беличенко