Про беспилотные автомобили

[info]vitus_wagner подкинул ссылку на MIT-овскую статью по модной теме беспилотных автомобилей. Анонс — «В MIT разработали систему, которая позволяет беспилотным автомобилям ездить по сельским дорогам без точной карты» — не очень точно отражает суть работы. Системы типа nVidia DAVE2, довольно простые в реализации (у меня есть даже подборочка материалов по теме) точно так же могут вертеть рулем в нужном направлении, и для своей работы требуют только видеокамеру, смотрящую вперед — данные от GPS и карта там необязательны.

Что отличает эту систему от «нейросетевого» подхода — даже не детерминированность, пусть даже она и приятна (есть несколько публикаций, показывающих, что нейросеть по образцу сделанной в nVidia «сходит с ума» при некоторых манипуляциях с картинкой — вплоть до того, что пытается повернуть совсем в другую сторону, если изменить в картинке на входе всего один пиксель). Внимательно попробуйте осознать описание DAVE2 — эта система определяет угол поворота руля, исходя из картинки, которую видит перед собой «водитель». Но… Посмотрите на эту схему, в том или ином виде присутствующую в любом вводном материале про спортивное или «экстремальное» вождение:

apeks

Три траектории, изображенные здесь — это три разных способа прохождения одного и того же поворота, в той или иной степени «хорошие» (в зависимости, конечно, от прочих факторов). Для наглядности изображена «шпилька» — поворот на 180°, но вся та же теория остается верной и в том случае, если угол будет другим. «Осознанное» управление автомобилем предполагает, что водитель, подъезжая к повороту (из левого нижнего угла картинки), определит точку поворота руля и точку апекса — и, соответственно, траекторию в повороте. Но обратите внимание, что видимая картинка при приближении к повороту во всех трех случаях одинакова — так что система, полагающаяся в своем принятии решений только на текущий видеокадр, очевидно будет неспособна «выбирать» траекторию. Обратите внимание на то, как в ролике nVidia нейросеть «крутит» руль, дергая его туда-сюда (примерно на 7:32):

А представьте, если это будет происходить не на сухой дороге и не на смешной скорости, а в гололед? На небольшой скорости, имея отличный «запас» сцепления шин с дорогой, можно позволить себе игнорировать «физику» движения автомобиля — что и делают сейчас последователи nVidia. Если же дорожные условия становятся чуть более сложными — то так можно оказаться и в кювете.

Так вот, важнейшее, на мой взгляд, новшество в подходе MIT — это определение траектории, исходя из конфигурации дороги. Границы дорожного полотна их система определяет с помощью лидара, сканирующего пространство вокруг автомобиля с частотой 5 раз в секунду. Затем строится «локальная» траектория (довольно примитивным, правда, образом — ровно посередине между левой и правой обочинами «вписывается» сплайн, то есть достаточно гладкая кривая), и до очередного обновления автомобиль движется по этой траектории. Никто, в общем, не мешает «вписывать» траекторию и более «правильным» образом — скажем, между правой обочиной и серединой дороги, как предписывают ПДД.

Заметьте, насколько это отличается от подхода «авось нейросеть научится» :)

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *