В 2025 году компания Navio, пионер в области автономного транспорта, совершила дерзкий технологический скачок, отказавшись от традиционного алгоритмического подхода в пользу генеративного искусственного интеллекта (GenAI). Результатом этого прорывного решения стала разработка фотореалистичного симулятора, знаменующего собой новую эру в развитии российских автономных систем, где качество восприятия и принятия решений возведено в абсолют.

Классический подход: тернистый путь к автономности

Алгоритмический подход, долгое время считавшийся краеугольным камнем разработки автономного транспорта, зиждется на логической архитектуре, имитирующей последовательность действий водителя:

  • Восприятие окружающего мира: симфония сенсоров – радары, лидары, камеры – улавливает малейшие нюансы внешней среды.
  • Определение местоположения: триангуляция данных с карт, модулей позиционирования и сенсоров позволяет точно определить координаты.
  • Прогнозирование поведения: сложные алгоритмы, основанные на кинематике и динамике объектов, предсказывают действия участников дорожного движения.
  • Планирование пути: свод незыблемых правил, продиктованных Правилами Дорожного Движения (ПДД), определяет оптимальный маршрут.
  • Управление: электронные импульсы, рожденные в недрах автомобиля, приводят его в движение.

Этот подход, требующий кропотливого написания алгоритмов для каждого мыслимого сценария, оказался заложником непредсказуемости реального мира. Невозможность предусмотреть все варианты развития событий породила проблему «Long Tail» – бесконечного множества ситуаций, не поддающихся алгоритмизации. Стало очевидно, что алгоритмический подход не способен обеспечить стабильность и масштабируемость технологии в условиях динамичного городского трафика.

GenAI: рассвет автономного интеллекта

Цель Navio – создать Physical AI, превосходящий человеческие возможности в надежности, безопасности и стабильности управления автомобилем. В 2025 году компания совершила революционный переход к генеративному искусственному интеллекту (GenAI), открыв новую страницу в истории автономного транспорта.

Интеграция VLA-моделей (Vision-Language-Action) позволила автономному транспорту обрести истинное понимание окружающего мира. VLA – это симбиоз восприятия, прогнозирования и принятия решений, единая система, способная адаптироваться к новым сценариям в режиме реального времени и использовать накопленный опыт в нестандартных ситуациях. Обучение этих моделей требует колоссальных объемов данных – миллионы километров, пройденные масштабным парком автомобилей. Однако даже такой гигантский массив информации не гарантирует охват всех редких и потенциально опасных сценариев (лобовое столкновение, внезапное появление животного на дороге и т.д.).

Для полноценного тестирования и обучения генеративных моделей потребовалось воссоздание сложных дорожных ситуаций в идеально контролируемой среде. Так родился NavioSim – фотореалистичный симулятор, способный с невероятной точностью моделировать любые сценарии дорожного движения.

Фотореалистичный симулятор NavioSim

NavioSim – это фотореалистичный симулятор, позволяющий создавать неограниченное количество цифровых сценариев с беспрецедентной детализацией в режиме реального времени. В основе этой технологии лежит гармоничное сочетание генеративных и собственных нейросетевых моделей Navio.

Преимущества NavioSim:

  • Воссоздание редчайших и наиболее рискованных сценариев, позволяющее генеративным моделям развивать навыки решения критических задач в безопасной виртуальной среде.
  • Непревзойденная степень детализации, сопоставимая с качеством видеозаписи автомобильного регистратора.
  • Безграничные возможности симуляции на основе заданного контента, гибко адаптируемого под любые запросы: моделирование городских улиц, поведения участников движения, объектов, погодных условий и времени суток.
  • Значительное ускорение процесса разработки.
  • Повышение предсказуемости и безопасности автоматизированных систем.

Симулятор позволяет проводить тестирование как отдельных алгоритмов и подсистем, так и интеграционное тестирование полного пайплайна – от данных сенсоров до управляющих сигналов автомобиля. Это создает три контура тестирования:

  • SIL (Software-in-the-Loop): оперативное тестирование работоспособности алгоритмов в контролируемой среде.
  • HIL (Hardware-in-the-Loop): выявление проблем на стыке программного и аппаратного обеспечения. Воспроизведение любых внешних условий и искусственное внесение ошибок для оценки реакции компонентов.
  • VIL (Vehicle-in-the-Loop): «очки виртуальной реальности» для автомобиля на полигоне. Имитация сложнейших сценариев, невозможных в реальных условиях, путем передачи данных с датчиков автономного транспортного средства из симулятора.

Источники данных для моделирования сценариев в симуляторе:

  • Данные реальных дорожных ситуаций.
  • Модифицированные с помощью графического редактора записи реальных проездов.
  • Созданные с нуля синтетические данные.

Для обеспечения максимального соответствия тестирований в симуляторе реальным условиям необходимы:

  • Фотореалистичные данные с виртуальных камер, лидарные и радарные облака, неотличимые от данных реальных сенсоров.
  • Точная физическая модель автомобиля, безупречно отрабатывающая все сигналы управления и обеспечивающая корректную обратную связь, имитирующую поведение реального транспортного средства.
  • Почему фотореалистичность данных критически важна для VLA-моделей:

В отличие от классических алгоритмов, решающих узконаправленные задачи, VLA объединяет восприятие, прогнозирование и принятие решений в единую систему. Модель преобразует поток данных с камер, радаров и лидаров в понятное описание ситуации: что происходит на дороге, какие объекты находятся поблизости и как они могут себя повести. VLA видит полную картину, связывает ее с контекстом и интерпретирует смысл, как человек.

В основе VLA лежит большая визуально-языковая модель, анализирующая изображения с камер и определяющая оптимальную траекторию движения. Для эффективного тестирования модели в симуляторе необходимо предоставлять данные, максимально приближенные к реальным – фотореалистичную графику.

Как Navio создает фотореалистичные изображения для симулятора:

  • Метод 3D Gaussian Splatting (3DGS): технология создания и визуализации трехмерных сцен, основанная на представлении объектов с помощью гауссовых функций в трехмерном пространстве.
  • Преимущества метода: непревзойденный фотореализм, высокая скорость работы, свобода перемещения внутри сцены.
  • В основе модели лежит гауссиана – математический объект, визуализируемый как размытое пятно, характеризующееся размером, цветом, ориентацией и степенью деформации. Наложение сотен тысяч гауссиан в трехмерном пространстве формирует изображение, в котором сложно различить объекты и которое лишено необходимого уровня фотореалистичности.
  • На следующем этапе алгоритм обучения корректирует параметры гауссиан, добиваясь максимального сходства изображения в симуляторе с изображением, полученным с камеры. Это свойство гауссиан называется дифференцируемостью.
  • Симулятор также позволяет моделировать данные лидаров, рассчитывая расстояние от камеры до ближайшей гауссианы по прямой линии для каждой точки изображения.

Фотореалистичный симулятор NavioSim – краеугольный камень в разработке эффективных автономных систем PhysicalAI. Он обеспечивает экспоненциальный рост скорости сбора данных для обучения и тестирования, позволяя в полной мере реализовать все необходимые навыки вождения AI-водителя – полный спектр функций, выполняемых человеком за рулем автомобиля. В будущем NavioSim станет катализатором быстрого масштабирования технологии и ее триумфального внедрения в любой новой локации.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *