端到端

摘要：2026 年初，Harness Engineering（驾驭工程）在 AI 工程社区迅速崛起，成为继 Prompt Engineering、Context Engineering 之后的第三代方法论范式。本文从驾驭工程的核心概念出发，系统分析其与当前基于端到端算法的智能驾驶系统在全生命周期各阶段的深层对应关系，揭示两者在控制论框架、改进循环、失败应对哲学上的结构性同构，并详细阐述其对智能驾驶用户体验与安全工程（尤其是 SOTIF / ISO 21448）的参考价值。研究发现：驾驭工程与汽车安全工程并非表面相似的类比，而是面对同一类根问题的两套独立演化解法，共享同一套底层操作系统。一、驾驭工程：第三代 AI 工程范式的崛起 1.1 概念与起源 Harness Engineering（驾驭工程）是围绕 AI 智能体设计和构建约束机制、反馈回路、工作流控制与持续改进循环的系统工程实践。它不优化模型本身，而是优化模型运行的整个"环境"。 “Harness"一词来自马具——缰绳、马鞍、嚼子——一套引导强大但不可完全预测的动物的完整装备。驾驭工程不是去削弱 AI 的能力，而是为它打造一套完整的约束与引导系统，让它跑得又快又稳。这个概念由 HashiCorp 联合创始人 Mitchell Hashimoto 在 2026 年 2 月 5 日首次提出。六天后，OpenAI 在其百万行代码实验报告中正式采用这一术语。随后 Martin Fowler 团队撰文深度分析，Anthropic 发布长时运行 Agent 最佳实践，一个月内"Harness Engineering"成为全球开发者社区的高频词。 Mitchell Hashimoto 的原始定义： “Harness engineering is the idea that anytime you find an agent makes a mistake, you take the time to engineer a solution such that the agent will not make that mistake again in the future.” ...

摘要：端到端架构正从论文走向量产，但全球自动驾驶安全评价体系的基石——基于场景的开发与测试方法——仍建立在"感知-规划-控制"三模块可分解的假设之上。本文系统分析场景方法在端到端时代面临的五个结构性挑战，论证其仍然有效但不再充分，并提出以大规模航测自然驾驶数据补充场景方法、构建三层方法协同框架的演进路径。图 1 引子：一个正在发生的范式冲突 2024年，自动驾驶行业发生了一个不太被安全工程师关注、但可能深刻改变他们工作方式的变化：端到端（End-to-End）架构开始从论文走向量产。特斯拉FSD V12全面转向端到端神经网络。华为、理想、小鹏、蔚来相继发布或预告了各自的端到端方案。学术界，UniAD拿下CVPR 2023最佳论文，DriveTransformer登上ICLR 2025，DiffusionDrive成为CVPR 2025 Highlight。但与此同时，全球自动驾驶安全评价体系的基石——基于场景的开发与测试方法——仍然建立在一个核心假设之上：自动驾驶系统可以被分解为感知、规划、控制三个模块，分别识别各模块的干扰因素，进而构建测试场景。当端到端把这三个模块融为一体，这套方法还能用吗？这不是一个学术问题。这是每一个正在做L2+/L3产品的SOTIF工程师、测试工程师和安全架构师，今天就需要面对的实际问题。图 2 图1 文章全景导航图一、先理解场景方法的技术内核在讨论"还有效吗"之前，必须先理解基于场景的方法到底在做什么。很多人对它的理解停留在"就是列一堆测试场景"的层面，这远远不够。 1.1 ISO 34502：场景的三层抽象 ISO 34502:2022是当前基于场景的安全评价领域最重要的国际标准，由日本SAKURA项目主席Satoshi Taniguchi（丰田）主导制定。它定义了一个三层场景抽象模型：层级定义示例功能场景用自然语言描述的场景类型 “高速公路上，前车突然变道切入本车车道” 逻辑场景参数化描述，参数取值为范围切入角度5°-30°，相对速度10-40 km/h，横向距离1.5-3.5 m 具体场景参数取值为单一确定值切入角度15°，相对速度25 km/h，横向距离2.0 m 这个三层模型的价值在于：它把"无穷多的驾驶情况"转化为"有限且可管理的场景空间" 。功能场景用于专家讨论，逻辑场景用于参数化测试设计，具体场景用于可复现的仿真测试。图 3 图2 ISO 34502 三层场景抽象模型 1.2 SAKURA从物理原理推导场景上一篇文章详细介绍了SAKURA框架。这里聚焦它最核心的方法论——物理原理方法（Physical Principles Approach）。 SAKURA把动态驾驶任务（DDT）分解为三个过程，然后针对每个过程，基于物理原理系统性地识别干扰因素：感知过程 → 传感器物理干扰 ├── 摄像头：可见光特性 → 强光、反光、低光照 ├── 毫米波雷达：电磁波特性 → 多径反射、相互干扰 └── LiDAR：红外光特性 → 雨雪吸收、灰尘散射 ...

驾驭工程（Harness Engineering）在智能驾驶领域的跨界应用

端到端时代，基于场景的自动驾驶安全评价还有效吗？