Про беспилотные автомобили

[info]vitus_wagner подкинул ссылку на MIT-овскую статью по модной теме беспилотных автомобилей. Анонс – “В MIT разработали систему, которая позволяет беспилотным автомобилям ездить по сельским дорогам без точной карты” – не очень точно отражает суть работы. Системы типа nVidia DAVE2, довольно простые в реализации (у меня есть даже подборочка материалов по теме) точно так же могут вертеть рулем в нужном направлении, и для своей работы требуют только видеокамеру, смотрящую вперед – данные от GPS и карта там необязательны.

Что отличает эту систему от “нейросетевого” подхода – даже не детерминированность, пусть даже она и приятна (есть несколько публикаций, показывающих, что нейросеть по образцу сделанной в nVidia “сходит с ума” при некоторых манипуляциях с картинкой – вплоть до того, что пытается повернуть совсем в другую сторону, если изменить в картинке на входе всего один пиксель). Внимательно попробуйте осознать описание DAVE2 – эта система определяет угол поворота руля, исходя из картинки, которую видит перед собой “водитель”. Но… Посмотрите на эту схему, в том или ином виде присутствующую в любом вводном материале про спортивное или “экстремальное” вождение:

apeks

Три траектории, изображенные здесь – это три разных способа прохождения одного и того же поворота, в той или иной степени “хорошие” (в зависимости, конечно, от прочих факторов). Для наглядности изображена “шпилька” – поворот на 180°, но вся та же теория остается верной и в том случае, если угол будет другим. “Осознанное” управление автомобилем предполагает, что водитель, подъезжая к повороту (из левого нижнего угла картинки), определит точку поворота руля и точку апекса – и, соответственно, траекторию в повороте. Но обратите внимание, что видимая картинка при приближении к повороту во всех трех случаях одинакова – так что система, полагающаяся в своем принятии решений только на текущий видеокадр, очевидно будет неспособна “выбирать” траекторию. Обратите внимание на то, как в ролике nVidia нейросеть “крутит” руль, дергая его туда-сюда (примерно на 7:32):

А представьте, если это будет происходить не на сухой дороге и не на смешной скорости, а в гололед? На небольшой скорости, имея отличный “запас” сцепления шин с дорогой, можно позволить себе игнорировать “физику” движения автомобиля – что и делают сейчас последователи nVidia. Если же дорожные условия становятся чуть более сложными – то так можно оказаться и в кювете.

Так вот, важнейшее, на мой взгляд, новшество в подходе MIT – это определение траектории, исходя из конфигурации дороги. Границы дорожного полотна их система определяет с помощью лидара, сканирующего пространство вокруг автомобиля с частотой 5 раз в секунду. Затем строится “локальная” траектория (довольно примитивным, правда, образом – ровно посередине между левой и правой обочинами “вписывается” сплайн, то есть достаточно гладкая кривая), и до очередного обновления автомобиль движется по этой траектории. Никто, в общем, не мешает “вписывать” траекторию и более “правильным” образом – скажем, между правой обочиной и серединой дороги, как предписывают ПДД.

Заметьте, насколько это отличается от подхода “авось нейросеть научится” :)

Ответить

Или воспользуйтесь входом по OpenID: