Как крупные модели стимулируют технологические инновации в автономном вождении

Традиционные системы автономного вождения часто полагаются на модульный дизайн. От восприятия окружающей среды, планирования принятия решений до контроля транспортных средств, каждая подсистема работает независимо и совместно контролирует работу транспортного средства. В сложных сценариях трафика эта иерархическая архитектура склонна к таким проблемам, как кумулятивные ошибки, потеря информации и недостаточная производительность в реальном времени. Крупные модели постепенно меняют эту ситуацию с помощью огромных параметров, межмодальных возможностей обработки данных и сквозных парадигм обучения. Он может не только достигать эффективного слияния многопользовательских данных на уровне восприятия, но и планировать более разумные стратегии вождения для транспортных средств посредством глубокого семантического понимания и логических рассуждений на уровне принятия решений, тем самым повышая общую безопасность и надежность.

Преимущества крупных моделей в автономном вождении

Процесс разработки самой технологии автономного вождения прошел через несколько этапов, от ранней помощи до постепенного перехода до полностью автономного вождения. Ранние системы в основном полагались на простое обнаружение объектов и контроль правил. С развитием глубокого обучения принятие таких методов, как CNN, RNN и даже GAN, постоянно улучшает экологические восприятия и возможности принятия решений. Более того, технология, объединяющая представление BEV (взгляды птичьего глаза), и трансформатор, в определенной степени, воспользовалась недостатками традиционных методов в пространственно-временном моделировании. Можно сказать, что введение крупных моделей в основном изменяет общую архитектуру автономных систем вождения, закладывая прочную основу для коммерциализации уровней L3, L4 и даже L5 в будущем.

Модельная архитектура, основанная на трансформаторе, обычно принимает механизм самоприщепления, который может запечатлеть зависимости на расстоянии, тем самым значительно улучшая глобальность и точность обработки информации. Благодаря подходу, обучающемуся перед тренировкой, модель предварительно обучает крупномасштабные немеченые данные, а затем настраивается на конкретные задачи автономического вождения. Это не только снижает зависимость от большого количества помеченных данных, но и позволяет модели иметь хорошие возможности для миграции междоменной. Мультимодальные большие модели могут одновременно обрабатывать различные формы данных, такие как изображения, точечные облака и радиолокационные данные, достигая скачка от «видения» к «пониманию», и предоставляя автономные системы вождения с когнитивными способностями, сходными с людьми.

Конкретное применение крупных моделей в автономном вождении

В системах автономного вождения применение крупных моделей в основном отражается в нескольких аспектах, таких как восприятие окружающей среды, принятие решений и планирование, а также контроль транспортных средств. С точки зрения восприятия окружающей среды, традиционные системы в основном полагаются на данные одного датчика для обнаружения целей и семантической сегментации. Однако из -за ограничений освещения, погоды и самих датчиков они часто испытывают трудности со сложными сценариями. Благодаря мультимодальной технологии слияния данных, крупные модели могут интегрировать различные данные, такие как камеры, лидары, радары из миллиметровых волн и карты высокой рецепты, чтобы сформировать более богатое и точное представление окружающей среды. Например, модель визуального языка (VLA) может одновременно извлекать визуальную информацию и семантическую информацию на изображении и демонстрирует чрезвычайно высокую точность при обнаружении препятствий, прогнозируя поведение пешеходов и судейские дорожные условия. После того, как информация о нескольких датчиках глубоко сливается с большой моделью, не только повышенная устойчивость обнаружения целей, но и прогнозирование динамических сцен может быть достигнуто с помощью анализа временных рядов, обеспечивая более надежный ввод для принятия решений транспортными средствами.

На уровне принятия решений и планирования традиционные системы автономного вождения обычно полагаются на предварительные правила или алгоритмы планирования на основе моделей для преобразования результатов восприятия в решения о планировании пути и действиях. Тем не менее, этот метод подвержен отказа при столкновении с сложными условиями движения, которые никогда не видели раньше, и конструкция интерфейса между каждым модулем довольно жесткая, что затрудняет достижение сквозной оптимизации. Благодаря сквозной структуре обучения, крупные модели могут напрямую извлекать ключевую информацию из необработанных данных датчика и генерировать команды управления транспортными средствами посредством присущих логических рассуждений. DriveGpt -4 и LanguageMempc продемонстрировали потенциал использования больших моделей для принятия решений с несколькими задачами. Их модели могут не только генерировать разумные стратегии вождения в сложных сценариях, но и предоставлять подробные объяснения, улучшая интерпретацию системы. Преимущество этого сквозного принятия решений заключается в сокращении промежуточных ошибок в процессе передачи информации и позволяет всей системе иметь возможность адаптироваться к новым сценариям.

Контроль транспортных средств, как окончательный этап автономного вождения, требует не только точности принятия решений, но и гарантии отклика системы в реальном времени. Поскольку крупные модели обычно имеют многочисленные параметры и огромные вычислительные затраты, существуют определенные проблемы в их прямом развертывании в системах, установленных на транспортных средствах. Индустрия провела обширные исследования в области сжатия моделей и легкого веса. Благодаря технологии дистилляции моделей, основные знания в крупных моделях извлекаются, а затем передаются в небольшие и эффективные модели, чтобы добиться идеального соответствия с аппаратным обеспечением в транспортных средствах (например, серии Nvidia Drive Agx). Эта технология не только сохраняет высокую производительность крупных моделей, но также гарантирует, что время отклика соответствует требованиям контроля в реальном времени, тем самым играя значительную роль в процессе коммерциализации автономного вождения L3\/L4.

В моделировании и проверке с закрытой контуром автономного вождения крупные модели также продемонстрировали значительные преимущества. Обучение с крупномасштабными данными и синтетическими сценами может построить реалистичные мировые модели, а тестирование с закрытым контуром может быть достигнуто в виртуальной среде с помощью цифровой технологии Twin. Этот метод не только значительно снижает риски и затраты на проведение большого количества тестов на реальных дорогах, но также может быстро имитировать различные экстремальные и длинные сценарии, обеспечивая достаточную поддержку данных для итерационной оптимизации модели. Модель EMMA от Waymo, используя платформы моделирования и большую модельную технологию, достигла высокой прогнозы траектории траектории и принятия решений о предотвращении столкновений. Его производительность намного превышает производительность традиционных иерархических систем, обеспечивая новый подход к проверке закрытого конюса будущих полностью автономных систем вождения.

Кроме того, крупные модели также сыграли важную роль в повышении безопасности системы и пользовательском опыте. Автономное вождение - это не просто техническая проблема; Это также включает в себя взаимодействие человека с компьютером и проблемы социального доверия. Благодаря технологии обработки естественного языка, крупные модели могут достичь разговоров в реальном времени с драйверами, предоставлять предложения по вождению и аварийные оповещения и даже предлагать персонализированную помощь на основе эмоций водителя. Такая конструкция взаимодействия может значительно повысить доверие пассажиров, что делает автономную систему вождения не только более продвинутой в технологии, но и в большей степени в соответствии с потребностями пользователей в практических приложениях.

Какие проблемы ставят большие модели в автономном вождении?

Хотя крупные модели продемонстрировали большой потенциал в области автономного вождения, все еще существует много проблем в преобразовании их из лабораторных достижений в коммерческие применения. Производительность в реальном времени и вычислительные ресурсы являются одним из основных узких мест в настоящее время. Крупные модели обычно имеют большой масштаб параметров и высокую вычислительную сложность. Для получения решений на уровне миллисекунды представляет чрезвычайно высокие требования для вычислительной мощности вычислительной платформы в транспортных средствах. Можно использовать выделенные чипы ИИ, и большие модели могут быть сжаты с помощью таких методов, как модель дистилляции и квантования, стремясь удовлетворить требования к ответам в реальном времени при обеспечении производительности.

Проблемы безопасности и надежности также являются основными проблемами при применении крупных моделей. Как только автономное транспортное средство совершит ошибку принятия решений, последствия могут быть очень серьезными. Следовательно, крупные модели должны подвергаться строгому тестированию и проверке, прежде чем быть введены в практическое использование, чтобы убедиться, что они могут правильно реагировать в различных сложных и экстремальных сценариях. Из-за природы больших моделей «черного ящика» их внутренние процессы принятия решений часто трудно объяснить. Как улучшить интерпретацию модели при обеспечении высокой производительности, стало неотложной проблемой для регулирующих органов и автопроизводителей для решения. В будущем, объединяя такие методы, как обучение подкреплению, тонкая настройка на основе отзывы человека и ограничения правил, ожидается, что он будет разработать системы принятия решений, которые являются как эффективными, так и прозрачными.

Конфиденциальность данных и этические проблемы нельзя игнорировать ни при применении крупных моделей. Автономные системы вождения должны собирать большое количество транспортных средств, окружающей среды и пользовательских данных, а безопасное хранение и использование этих данных напрямую связаны с защитой конфиденциальности пользователей. Как полностью использовать преимущества больших данных при обеспечении безопасности передачи и обработки данных - это первая проблема, с которой должны решить регулирующие органы. Необходимо сформулировать строгие стандарты защиты данных и механизмы защиты конфиденциальности, чтобы обеспечить институциональные гарантии для безопасного применения крупных моделей в автономном вождении.

Сотрудничество между программным обеспечением и оборудованием также является ключом к реализации крупных моделей. Успешное применение крупных моделей зависит не только от инноваций алгоритма, но и требует высокопроизводительной поддержки аппаратного обеспечения. В настоящее время крупные производители последовательно запустили платформы ввода-транспортных средств нового поколения, такие как Nvidia Drive Agx Pegasus, Atlan и т. Д. Непрерывное развитие сенсорной технологии также обеспечило более распространенные и высококачественные источники данных для мультимодального слияния данных. Благодаря постоянному улучшению всей экосистемы автономного вождения, глубокая интеграция программного обеспечения и оборудования обязана привести всю отрасль в совершенно новую эру интеллектуальных путешествий.

Глубокое влияние крупных моделей на технологию автономного вождения отражается не только в технических деталях, но также вызвало сдвиг парадигмы от традиционных модульных систем к сквозному и от воспринимаемого интеллекта к когнитивному интеллекту. Будущая система автономного вождения, возглавляемое крупными моделями, достигнет более высокого определения экологического восприятия, более гибкого принятия решений и планирования, а также более безопасного и более эффективного контроля транспортных средств. В то же время он достигнет нового уровня в взаимодействии человека и и машине, персонализированной помощи и безопасности данных.

Новости