端到端时代,基于场景的自动驾驶安全评价还有效吗?
摘要:端到端架构正从论文走向量产,但全球自动驾驶安全评价体系的基石——基于场景的开发与测试方法——仍建立在"感知-规划-控制"三模块可分解的假设之上。本文系统分析场景方法在端到端时代面临的五个结构性挑战,论证其仍然有效但不再充分,并提出以大规模航测自然驾驶数据补充场景方法、构建三层方法协同框架的演进路径。 图 1 引子:一个正在发生的范式冲突 2024年,自动驾驶行业发生了一个不太被安全工程师关注、但可能深刻改变他们工作方式的变化: 端到端(End-to-End)架构开始从论文走向量产。 特斯拉FSD V12全面转向端到端神经网络。华为、理想、小鹏、蔚来相继发布或预告了各自的端到端方案。学术界,UniAD拿下CVPR 2023最佳论文,DriveTransformer登上ICLR 2025,DiffusionDrive成为CVPR 2025 Highlight。 但与此同时,全球自动驾驶安全评价体系的基石——基于场景的开发与测试方法——仍然建立在一个核心假设之上:自动驾驶系统可以被分解为感知、规划、控制三个模块,分别识别各模块的干扰因素,进而构建测试场景。 当端到端把这三个模块融为一体,这套方法还能用吗? 这不是一个学术问题。这是每一个正在做L2+/L3产品的SOTIF工程师、测试工程师和安全架构师,今天就需要面对的实际问题。 图 2 图1 文章全景导航图 一、先理解场景方法的技术内核 在讨论"还有效吗"之前,必须先理解基于场景的方法到底在做什么。很多人对它的理解停留在"就是列一堆测试场景"的层面,这远远不够。 1.1 ISO 34502:场景的三层抽象 ISO 34502:2022是当前基于场景的安全评价领域最重要的国际标准,由日本SAKURA项目主席Satoshi Taniguchi(丰田)主导制定。它定义了一个三层场景抽象模型: 层级 定义 示例 功能场景 用自然语言描述的场景类型 “高速公路上,前车突然变道切入本车车道” 逻辑场景 参数化描述,参数取值为范围 切入角度5°-30°,相对速度10-40 km/h,横向距离1.5-3.5 m 具体场景 参数取值为单一确定值 切入角度15°,相对速度25 km/h,横向距离2.0 m 这个三层模型的价值在于:它把"无穷多的驾驶情况"转化为"有限且可管理的场景空间" 。功能场景用于专家讨论,逻辑场景用于参数化测试设计,具体场景用于可复现的仿真测试。 图 3 图2 ISO 34502 三层场景抽象模型 1.2 SAKURA从物理原理推导场景 上一篇文章详细介绍了SAKURA框架。这里聚焦它最核心的方法论——物理原理方法(Physical Principles Approach)。 SAKURA把动态驾驶任务(DDT)分解为三个过程,然后针对每个过程,基于物理原理系统性地识别干扰因素: 感知过程 → 传感器物理干扰 ├── 摄像头:可见光特性 → 强光、反光、低光照 ├── 毫米波雷达:电磁波特性 → 多径反射、相互干扰 └── LiDAR:红外光特性 → 雨雪吸收、灰尘散射 ...