从 Robot SOTIF 看 CDV 的跨领域迁移

摘要:Yoav Hollander 是芯片验证领域的世界级专家,他创立的 Foretellix 把覆盖驱动验证(Coverage-Driven Verification, CDV)带进了自动驾驶。最近,他写了一篇文章,把这套方法论推到了更大的范围:AI 对齐。本文从我的研究领域出发,结合 SOTIF 四象限、Robot SOTIF 的树状结构和中国的标准语境,解读 CDV 的跨领域迁移。核心问题只有一个:你怎么知道你不知道什么? 几个月前,Yoav Hollander(Foretellix 联合创始人/CTO)给我发了一封邮件。 他是芯片验证领域世界级专家,发明了通用验证方法论(Universal Verification Methodology,UVM)的前身“e”语言,创办的 Verisity 被 Cadence 收购后,又创立了 Foretellix——做自动驾驶覆盖驱动验证(Coverage-Driven Verification, CDV),拿了 NVIDIA、沃尔沃和淡马锡的 C+ 轮融资。 Yoav 读了我几篇关于端到端安全、基于场景测评、SOTIF 的文章后,我们通过邮件和线上会议聊了几轮。最近,他写了一篇文章,把问题推到了更大的范围:AI 对齐。 经过 Yoav 本人许可,我把那篇文章翻译成了中文:[译] 覆盖驱动对齐:Teaching Claude Why 能从自动驾驶验证中借鉴什么。英文原文在这里:Coverage-driven alignment – What ‘Teaching Claude Why’ can borrow from AV verification。 下面从我的研究领域出发,对 CDV 跨领域迁移进行一些解读和延伸——结合 SOTIF 的实际情况,看看 CDV 在中国语境下意味着什么。 两条线的交汇 Yoav 在邮件里说过一句: “I am at heart a V&V guy, thinking about ‘how to achieve best risk reduction per week for the SUT, given fixed resources’. I feel much less confident regarding safety standards and ‘how to build a safety case’.” ...

2026年6月11日 · 约 8 分钟 · 约 3029 字 · 张玉新 Yuxin Zhang · 0

ASIL E 不重要,L4 无人兜底的证据链才重要

摘要:ASIL E 目前不是正式标准。它真正有价值的地方,不是提出了一个更高等级名称,而是把 L4/L5 自动驾驶安全论证里一个长期存在的问题说清楚了:当车里没有人时,安全案例不能继续 credit 一个不存在的人类控制者。对我来说,这份 proposal 更适合被翻译成三类工程资产:一页 L4 无人兜底审查清单、ADSafetyPilot 里的四个证据字段,以及 ROAM / DRIVEResearch / ADSafetyPilot 之间的一条运行阶段证据闭环。 前段时间,我在 LinkedIn 上看到一位功能安全同行发了一个 proposal,题目很直接: The Case for ASIL E. 本地 PDF 是 79 页,副标题是 A Sixth Integrity Level for L4/L5 Autonomous Systems。它的核心观点是:ISO 26262 的 ASIL D 是当前最高等级,但它背后的 controllability 逻辑,来自一个仍然有驾驶员作为残余控制者的世界。到了 SAE L4/L5,系统设计目标就是不依赖驾驶员接管,这个假设会断掉。 我读完之后,第一反应不是“ASIL E 要来了”。 恰恰相反,我的第一反应是: 这不是一个新等级问题,而是一个老问题终于被说清楚了。 先把边界说清楚 截至 2026 年 6 月 3 日,ASIL E 不在已发布的 ISO 26262、ISO 21448 或 UL 4600 中。 ...

2026年6月3日 · 约 11 分钟 · 约 4006 字 · 张玉新 Yuxin Zhang · 0

机器人也需要 SOTIF 了

摘要:2026年6月2日,《机器人预期功能安全实施指南》国家标准项目进入公示,公示截止日期为2026年7月2日。我把这个方向放进 OpenTopic,作为第二个开放研究专题:Robot SOTIF。它不是把自动驾驶 SOTIF 简单搬到机器人上,而是尝试建立一条从标准、ODD、场景、触发条件、物理交互、LLM/VLA 决策安全到 safety case 的证据链。 我最近看到一个标准项目公示,觉得必须认真记一笔。 2026年6月2日,国家标准项目《机器人预期功能安全实施指南》进入公示。项目周期18个月,归口全国机器人标准化技术委员会,公示截止日期是2026年7月2日。 这个标题里最值得关注的词,不是“机器人”。 而是“预期功能安全”。 英文不要逐词硬译。这个领域对应的是 SOTIF,也就是 Safety of the Intended Functionality。 它问的不是“零部件坏了怎么办”。 它问的是: 如果系统没有发生故障,功能也在按设计运行,但在某个复杂开放场景中仍然做出了不安全行为,我们该如何识别、量化、验证和缓解? 这个问题,自动驾驶行业已经痛苦地讨论了很多年。现在,它开始正式进入机器人标准化语境。 一、为什么这是一个重要信号 传统机器人安全,很多时候围绕隔离、防护、急停、限力、限速和协作应用展开。 这些当然重要。ISO 10218、ISO/TS 15066、ISO 13482 这些标准,给工业机器人、协作机器人和个人护理机器人提供了很重要的安全基础。 但机器人正在变。 它不再只在围栏里面工作,也不再只在结构化产线里重复动作。移动服务机器人、清洁消杀机器人、安防巡检机器人、物流配送机器人、养老医疗机器人,都会进入开放环境,面对普通用户、复杂任务和不稳定场景。 更关键的是,大模型和 VLA 让机器人决策系统从规则逻辑,走向语义理解、任务分解和端到端动作生成。 这时,安全问题就不再只是“有没有撞上人”。 还包括: 机器人是否理解错了用户意图? 是否在 ODD 边界外仍然继续执行? 是否为了完成任务而靠得太近、走得太急、停得太突然? 是否在长时序任务里一步步积累风险? 是否能把拒绝执行、回退、人工介入和运行日志变成可审查证据? 这就是机器人 SOTIF 的价值。 二、为什么我把它放进 OpenTopic OpenTopic 的初衷,是把研究思路也像数据集一样开源。 说来惭愧,我手里其实一直有一些可以继续做深的材料。之前已经整理过三份关于具身智能安全、物理交互安全、LLM/VLA 决策安全的报告。但这些报告如果只是留在文件夹里,价值很有限。 这次标准项目公示出来以后,我重新看了一遍,觉得最合适的处理方式不是再写一篇普通评论,而是把它开放成一个可持续维护的问题入口。 所以我在 OpenTopic 里新增了第二个话题: Robot SOTIF:机器人预期功能安全开放研究专题 专题下面先放了三条线索: 机器人 SOTIF 的标准地图与证据链 通用移动物理 AI 的物理交互安全 LLM/VLA 机器人决策安全 我的处理原则很保守:标准只引用官方来源;没有逐条核验的 SOTA 论文和实验数字,先作为研究线索,不写成事实结论。 ...

2026年6月3日 · 约 6 分钟 · 约 2246 字 · 张玉新 Yuxin Zhang · 0

无人车出了事,谁来兜底?

摘要:当无人车的 AI 搞不定的时候,行业有没有一套成体系的应急管理机制?答案是没有,连一个参考标准都没有。本文从武汉萝卜快跑事件出发,回顾 Robotaxi 行业近期的三记重锤,扫描 ISO/SAE/IEC/中国四大标准体系在远程运营领域的全部空白,分析武汉事件后中国监管的根本性转向,并介绍 ROAM(Remote Operations & Anomaly Management)开源参考架构的四个模块、十种运营模式与 52 条标准扫描结果。 3 月 31 日,武汉。 近百辆萝卜快跑在晚高峰时段于高架路段同时熄火。乘客被困车内,SOS 按钮无响应,客服热线打不通。最终解决方案是什么? 交警,一辆一辆地,手动救。 整个过程持续了两个小时。 同一天,大洋彼岸,美国参议员 Markey 发布了一份名为《Remote Back Seat Operators》的调查报告。他向七家头部自动驾驶公司(Aurora、May Mobility、Motional、Nuro、Tesla、Waymo、Zoox)提了一个很简单的问题: 你们的无人车到底多久需要一次远程人工干预? 七家公司的回答高度一致——商业机密,拒绝回答。 这两件事凑在一起,指向了同一个问题:当无人车的 AI 搞不定的时候,行业有没有一套成体系的应急管理机制? 答案是没有。更让人不安的是,连一个参考标准都没有。 一、Robotaxi 的三记重锤 把时间线拉长一点看,2025 年底到 2026 年初这几个月,行业连续挨了三记重锤。 2025 年 12 月 13 日,旧金山电网故障。 Waymo 的 20 多辆车失去通信,瘫在路上。应急服务拨打 Waymo 热线 31 次,累计等了 2 小时 36 分钟。Waymo 事后承认:断网的时候,他们没有办法把整个区域的车统一召回来。 2026 年 3 月 31 日,武汉萝卜快跑事件。 规模更大——近百辆车同时出问题,乘客被困在高架桥上。所有远程系统集体失效:SOS、客服、远程干预,全部瘫痪。 ...

2026年5月4日 · 约 8 分钟 · 约 2880 字 · 张玉新 Yuxin Zhang · 0

Harness 的用户体验 vs 安全合规——12 Primitives × SOTIF 完整映射

摘要:2026 年 Q1,Harness Engineering 在 OpenAI、Anthropic、明日新程 Nextie 几乎同步出现,“12 Primitives"在社区收敛为新的隐性共识。本文论证:主流路线对 Harness 的投入几乎全部集中在"用户体验、性能、效率"维度;而 Safety-Critical 场景里决定能否上市的"安全合规"维度几乎没有被任何商业玩家系统性投入。本文用 12 Primitives × SOTIF / ISO 21448 的双向映射建立桥梁,并识别 12 条可深入研究的方向,作为标准组织、企业预研团队、第三方机构、研究机构共同补位"安全合规维度 Harness"的起点。本文约一万字,公众号上有约 3000 字的精简版。 一、引子:两条线索的同时浮现 最近两个月,“Harness Engineering"这个词在两个完全不同的圈子里被高频讨论。 1.1 AI 工程圈的密集信号 2026 年 2 月,OpenAI 官方博客《Harness Engineering: Leveraging Codex in an Agent-First World》第一次把这个概念从隐性共识变成正式术语。同年 3 月,Anthropic 推出 Managed Agents 架构,技术文档反复强调"Agent Harness"作为一等工程对象。4 月,明日新程 Nextie 在一个月内连融两轮,陆奇和李开复罕见同框入场,核心叙事是"群体智能 + Harness”。同月新智元一篇《最新风口 Harness,李开复、陆奇已重金入场》把 Harness 推成产业热词。 与此同时,GitHub 上的 awesome-harness-engineering 仓库把 12 个原语(Agent Loop、Planning、Context Delivery、Tool Design、Skills/MCP、Permissions、Memory、Task Runners、Verification、Observability、Debugging、HITL)从社区隐性共识收敛成了一份分类法。 1.2 汽车行业的低调但明确的同期信号 汽车行业的信号则相对低调但同样明确。头部智驾公司不约而同地在加码模型输出可解释性与透明度相关工作,把它定义为未来 5–10 年的核心战略。越来越多的车企技术团队开始在内部文件里讨论 Harness。 ...

2026年4月19日 · 约 27 分钟 · 约 10631 字 · 张玉新 Yuxin Zhang · 0

驾驭工程(Harness Engineering)在智能驾驶领域的跨界应用

摘要:2026 年初,Harness Engineering(驾驭工程)在 AI 工程社区迅速崛起,成为继 Prompt Engineering、Context Engineering 之后的第三代方法论范式。本文从驾驭工程的核心概念出发,系统分析其与当前基于端到端算法的智能驾驶系统在全生命周期各阶段的深层对应关系,揭示两者在控制论框架、改进循环、失败应对哲学上的结构性同构,并详细阐述其对智能驾驶用户体验与安全工程(尤其是 SOTIF / ISO 21448)的参考价值。研究发现:驾驭工程与汽车安全工程并非表面相似的类比,而是面对同一类根问题的两套独立演化解法,共享同一套底层操作系统。 一、驾驭工程:第三代 AI 工程范式的崛起 1.1 概念与起源 Harness Engineering(驾驭工程) 是围绕 AI 智能体设计和构建约束机制、反馈回路、工作流控制与持续改进循环的系统工程实践。它不优化模型本身,而是优化模型运行的整个"环境"。 “Harness"一词来自马具——缰绳、马鞍、嚼子——一套引导强大但不可完全预测的动物的完整装备。驾驭工程不是去削弱 AI 的能力,而是为它打造一套完整的约束与引导系统,让它跑得又快又稳。 这个概念由 HashiCorp 联合创始人 Mitchell Hashimoto 在 2026 年 2 月 5 日首次提出。六天后,OpenAI 在其百万行代码实验报告中正式采用这一术语。随后 Martin Fowler 团队撰文深度分析,Anthropic 发布长时运行 Agent 最佳实践,一个月内"Harness Engineering"成为全球开发者社区的高频词。 Mitchell Hashimoto 的原始定义: “Harness engineering is the idea that anytime you find an agent makes a mistake, you take the time to engineer a solution such that the agent will not make that mistake again in the future.” ...

2026年4月9日 · 约 22 分钟 · 约 8775 字 · 张玉新 · 0

VDA AI in QM :德国率先给AI立规矩,对中国自动驾驶行业意味着什么?

摘要:2026年3月,德国VDA发布了全球汽车行业首个AI质量管理标准化指南——VDA 20《AI in Quality Management》(191页)。本文深度解读其AIQM三级风险分级、80项检查表和12个应用案例,分析对中国自动驾驶行业的参考价值,并探讨中国在端到端评估方法论和数据基础设施上的领先优势与机会窗口。 图 1 文末附全文下载链接 章节导读 一、文档背景——VDA AI in QM 是什么?为什么全球汽车行业需要关注? 二、核心框架——风险分级、80项检查表、应用案例、AI安全标准全景图 三、对中国自动驾驶的参考价值——填补AI质量管理空白、变更管理分类 四、中国落地的额外考量——法规差异、组织文化差异、数据生态差异 五、挑战与优化——自身局限 + 端到端可解释性、数据漂移、供应链协调 六、中国的领先优势——AI应用速度领先、端到端评估、数据基础设施 七、关键启示——对OEM/Tier1、标准制定者、研究者分别的行动建议 八、一句话总结——谁先给路上跑的AI立规矩,谁就定义下一个十年 一、文档背景 2026年3月,德国汽车工业协会(VDA)发布了VDA 20——《AI in Quality Management》(以下简称"黄皮书"),这是全球汽车行业首个针对AI质量管理的系统性标准化指南,共191页。 为什么值得关注? 德国VDA标准在全球汽车行业的影响力不亚于ISO标准——VDA 6.3(过程审核)、VDA 6.5(产品审核)是几乎所有进入德国市场的汽车供应商的必修课。VDA 20的发布,意味着AI在汽车质量管理中的使用不再是"可选项",而是开始有了规范化的框架和评估方法。 图 2 黄皮书章节框架 二、黄皮书的核心框架 2.1 AIQM三级风险分级——给AI系统"定安全等级" 黄皮书最核心的贡献是提出了AIQM(AI in Quality Management)三级风险分类方法,基于七个风险维度对AI系统进行评估。 七个风险维度: 维度 评估什么 与自动驾驶的关联 1. AI法规合规 是否属于EU AI Act高风险AI系统 端到端自动驾驶AI组件→高风险 2. 数据保护 是否涉及个人敏感数据 驾驶行为数据、车辆位置→涉及 3. 偏差与公平 模型是否存在系统性偏差 训练数据地域偏差→影响跨区域泛化 4. 透明性 模型是否可解释 端到端黑箱→AIQM-3最高等级 5. 财务风险 错误输出的经济损失 误判导致召回→巨大财务风险 6. 声誉风险 错误的公众影响 自动驾驶事故→极高声誉风险 7. 产品安全特性 功能安全 + 预期功能安全 + 网络安全 最直接的自动驾驶关联维度 分级结果: ...

2026年4月6日 · 约 13 分钟 · 约 5163 字 · 张玉新 Yuxin Zhang · 0

博世工程师开源了一个项目,可能改变每个汽车工程师的工作方式

摘要:博世工程师Thejeswarareddy R开源了一套将汽车工程标准知识系统性注入Claude Code的智能体项目,覆盖75+技能类别。我Fork后补充了自动驾驶安全标准(ISO 21448/34502/4804等)、中国即将实施的强制性国标、以及SOTIF深度实践内容。本文解读这个项目的架构亮点,以及我的补充思路。 图 1 如果你是一个初级的汽车功能安全工程师,你一定有过这样的经历: 早上9点,项目经理发来消息:“这个ADAS功能需要做ASIL分解,下午客户评审前需要给我更新的HARA表格。” 于是你开始翻ISO 26262 Part 3。翻了半小时找到ASIL确定规则,又花20分钟回忆严重度S、暴露率E、可控性C的定义。然后打开Excel模板,逐行填写。填到一半,某个失效模式的ASIL等级拿不准,又翻回标准。等HARA初稿完成——三个小时过去了。 而这还只是一个标准的一个环节。 你同时还要查AUTOSAR的命名规范、MISRA的合规规则、ISO 21434的TARA分析模板、ASPICE的工作产品清单…… 这些工作不难,但极其耗时。据统计,一个初级的功能安全工程师每周大概有10-15个小时花在”翻标准、对条款、填模板”上。 我一直觉得这件事应该有更好的解决方式,但从来没有真正动手去做。直到上周,我看到了一个博世工程师做的事情。 这位博世工程师做了什么 Thejeswarareddy R,博世的一位Lead Engineer,做了一件让我佩服的事: 他把汽车软件工程中最常用的标准和工程知识,系统性地“注入”到了AI助手Claude Code****中,做成了一个完整的开源智能体系统。 图 2 这不是“把几篇标准摘要丢给ChatGPT”那种问答式玩法。他做的是一套经过精心架构设计的工程化系统: 图 3 我来翻译一下这意味着什么。 以前你要做ASIL分解,需要自己翻标准、建模板、填表格。现在你可以直接说: “帮我对这个L3级别的HWP的紧急制动功能做HARA分析,输出ASIL等级” AI会根据注入的ISO 26262知识,按标准流程输出一份结构化的HARA表格。你要做的是审核和判断——而不是把时间花在查找和格式化上。 这个项目有几点让我特别欣赏: **第一,架构设计很讲究。**它用了一种”追加式”安装方式——你现有的开发环境一个字符都不会被修改,所有新增内容都带automotive-前缀避免冲突。这说明作者是真正做工程的人,知道不能动别人的工作环境。 **第二,规模感令人敬畏。**75+个技能类别意味着他梳理了ADAS、BMS、V2X、动力总成、诊断、OTA、数字孪生、Zonal架构等十几个汽车细分领域的知识体系。这不是一两天能做出来的事情。 **第三,完全开源。**MIT协议,你可以自由使用、修改,甚至用在商业项目中。 我做了一些小小的补充 说了这么多好话,说一个”但是”。 这个项目的覆盖重心是传统汽车软件工程——ISO 26262功能安全、AUTOSAR架构、MISRA编码规范、ASPICE过程管理——这些做得很扎实。 但有两个方向,由于作者的工作背景和地域,覆盖比较薄: **一是自动驾驶安全领域的专项标准。**近两三年密集发布了一批重要的ADAS/AD安全标准,原项目基本没有涉及。 **二是中国标准法规体系。**中国正在加速建立自己的智能网联汽车标准,包括两个即将实施的强制性国标,原项目里完全没有。 这两个方向恰好是我日常工作的领域,所以我Fork了这个项目,做了一些补充。以下是我补充的主要内容: 图 4 补充一:自动驾驶安全标准 这几年,自动驾驶安全评估从”没有标准可依”快速进入了”标准框架基本成型”的阶段。以下几项标准构成了当前AD安全评估的核心框架: 图 5 这几项标准,在我的Fork中都以结构化的技能文件形式集成了——不是放一份摘要,而是提取了核心框架、关键概念和工程实施要点。 补充二:中国标准法规 对在国内做L2/L3产品的工程师来说,有两份即将实施的强制性国标是绕不开的: 第一个是L2组合驾驶辅助系统安全要求(GB强标)。 图 6 这是中国第一个针对L2 组合驾驶辅助系统的强制性国家标准。2027年执行,所有新上公告的搭载L2组合辅助驾驶功能的车型都必须满足。它涵盖了ODD定义、功能安全、SOTIF、DMS、HMI、网络安全等全方位要求。如果你在主机厂或Tier1做L2产品,明年这个标准就是你的”甲方”。 第二个是自动驾驶系统安全要求(GB强标)。 图 7 这是面向L3准入的国家战略级的强制标准(还在征求意见中),要求ADS的安全水平至少等同于”合格谨慎的人类驾驶员”。标准里提出了安全管理体系(SMS)、仿真测试验证、在用安全监控(ISMR)等系统性要求,覆盖L3和L4。草案目前50页,结构清晰,对做ADS产品准入的团队非常重要。 ...

2026年4月6日 · 约 6 分钟 · 约 2227 字 · 张玉新 Yuxin Zhang · 0

端到端时代,基于场景的自动驾驶安全评价还有效吗?

摘要:端到端架构正从论文走向量产,但全球自动驾驶安全评价体系的基石——基于场景的开发与测试方法——仍建立在"感知-规划-控制"三模块可分解的假设之上。本文系统分析场景方法在端到端时代面临的五个结构性挑战,论证其仍然有效但不再充分,并提出以大规模航测自然驾驶数据补充场景方法、构建三层方法协同框架的演进路径。 图 1 引子:一个正在发生的范式冲突 2024年,自动驾驶行业发生了一个不太被安全工程师关注、但可能深刻改变他们工作方式的变化: 端到端(End-to-End)架构开始从论文走向量产。 特斯拉FSD V12全面转向端到端神经网络。华为、理想、小鹏、蔚来相继发布或预告了各自的端到端方案。学术界,UniAD拿下CVPR 2023最佳论文,DriveTransformer登上ICLR 2025,DiffusionDrive成为CVPR 2025 Highlight。 但与此同时,全球自动驾驶安全评价体系的基石——基于场景的开发与测试方法——仍然建立在一个核心假设之上:自动驾驶系统可以被分解为感知、规划、控制三个模块,分别识别各模块的干扰因素,进而构建测试场景。 当端到端把这三个模块融为一体,这套方法还能用吗? 这不是一个学术问题。这是每一个正在做L2+/L3产品的SOTIF工程师、测试工程师和安全架构师,今天就需要面对的实际问题。 图 2 图1 文章全景导航图 一、先理解场景方法的技术内核 在讨论"还有效吗"之前,必须先理解基于场景的方法到底在做什么。很多人对它的理解停留在"就是列一堆测试场景"的层面,这远远不够。 1.1 ISO 34502:场景的三层抽象 ISO 34502:2022是当前基于场景的安全评价领域最重要的国际标准,由日本SAKURA项目主席Satoshi Taniguchi(丰田)主导制定。它定义了一个三层场景抽象模型: 层级 定义 示例 功能场景 用自然语言描述的场景类型 “高速公路上,前车突然变道切入本车车道” 逻辑场景 参数化描述,参数取值为范围 切入角度5°-30°,相对速度10-40 km/h,横向距离1.5-3.5 m 具体场景 参数取值为单一确定值 切入角度15°,相对速度25 km/h,横向距离2.0 m 这个三层模型的价值在于:它把"无穷多的驾驶情况"转化为"有限且可管理的场景空间" 。功能场景用于专家讨论,逻辑场景用于参数化测试设计,具体场景用于可复现的仿真测试。 图 3 图2 ISO 34502 三层场景抽象模型 1.2 SAKURA从物理原理推导场景 上一篇文章详细介绍了SAKURA框架。这里聚焦它最核心的方法论——物理原理方法(Physical Principles Approach)。 SAKURA把动态驾驶任务(DDT)分解为三个过程,然后针对每个过程,基于物理原理系统性地识别干扰因素: 感知过程 → 传感器物理干扰 ├── 摄像头:可见光特性 → 强光、反光、低光照 ├── 毫米波雷达:电磁波特性 → 多径反射、相互干扰 └── LiDAR:红外光特性 → 雨雪吸收、灰尘散射 ...

2026年4月6日 · 约 13 分钟 · 约 5065 字 · 张玉新 Yuxin Zhang · 0

日本SAKURA自动驾驶安全评价框架V4.0价值与挑战

摘要:2026年3月,JAMA发布了SAKURA自动驾驶安全评价框架第四版(Ver.4.0),一份344页的国家级安全评价技术文档。本文从公司价值、工程师视角、核心方法论到端到端AI时代的前沿挑战,系统解读这份由丰田、本田、日产等日本主流车企联合打造的安全评价体系,并探讨其对中国标准工作的启示。 图 1 2026年3月,SAKURA项目正式结题,日本汽车工业协会(JAMA)发布了SAKURA自动驾驶安全评价框架的第四版——一份长达344页的技术文档。 这不是某个车企的内部报告,而是丰田、本田、日产、马自达、斯巴鲁、铃木、日野、三菱等几乎全部日本主流车企,加上博世日本、大陆日本等Tier 1,在日本经济产业省(METI)主导下,联合打造的国家级安全评价体系。 SAKURA项目主席Satoshi Taniguchi来自丰田,同时也是ISO 34502的项目负责人。该项目也与我们熟知的德国PEGASUS系列项目有密切联动和协作,并支持了第一个L3法规UNECE R157,换句话说,这份文档的方法论直接塑造了国际标准。 图 2 它为什么值得我们花时间读?读完又能用在哪里? 本文将从公司价值、工程师价值、核心方法论,一直到端到端AI时代的前沿挑战,做一个系统的解读。 一、先搞清楚:SAKURA到底在做什么 SAKURA的全称是Safety Assurance for automated driving using Knowledge-based Universal Risk Assessment。名字很长,核心思路却很简洁: 用物理原理,系统性地穷举自动驾驶需要面对的所有安全场景。 图 3 具体怎么做?框架把动态驾驶任务(DDT)拆解为感知****→决策→****操作三个过程,然后针对每个过程,基于物理原理识别可能的干扰因素: 感知干扰传感器物理机制决定的——雷达的电磁波特性、LiDAR的红外光特性、摄像头的可见光特性,分别会在什么条件下"看不清" 交通干扰道路几何×自车行为×周围车辆行为的系统组合——什么样的交通态势会构成威胁 车辆动力学干扰作用于车辆的物理力——路面状态、风力、轮胎性能如何影响控制 这套方法的精髓在于:不是从事故数据中倒推场景(数据驱动),而是从物理第一性原理正向推导场景(原理驱动)。好处是可以论证场景集合的完备性——你能说清楚为什么这些场景"够了"。 在此基础上,框架还建立了一个四象限模型:按"合理可预见性"和"可预防性"两个维度划分所有场景。核心评价对象是象限A——可预见且可预防的场景,自动驾驶系统在这些场景中不能出事故。 图 4 Ver.4.0相比之前的版本,最大的更新是在之前主要面向结构化道路的基础上,全面纳入了城市行车场景和弱势交通参与者VRU(行人和骑行者),并扩展了一般道路的遮挡场景考量。 图 5 二、这份文档对谁有用? 整车企业(OEM) 安全论证结构。文档展示了一套完整的、与ISO 21448对齐的安全保障流程——从ODD定义到安全评估的闭环。OEM安全部门可以直接参照搭建自己的安全论证体系。 场景矩阵。框架通过系统组合构建了58类交通干扰场景,为测试场景库建设提供了结构化起点。不用再从零开始拍脑袋。 C&C Driver****模型。这是文档技术含量最高的部分之一——将人类驾驶员的碰撞规避行为量化为具体参数:感知延迟0.75秒、最大减速度0.774G。这些数字直接定义了安全判据的基准线。 自动驾驶科技公司 合规出海的核心参考。Annex G直接对应UN R-157法规的仿真验证要求。如果你的AD系统要出海,这一章是必读。 Pass/Fail****的量化依据。文档给出了Cut-in、Cut-out、Deceleration三类典型场景的可预防性边界——绿色区域表示系统应当能避免碰撞。这是算法测试判据的直接来源。 传感器供应商 Annex E大约100页,是全球最系统的传感器物理原理干扰场景建模文档之一。毫米波雷达5类干扰、LiDAR 3类干扰、摄像头3类干扰,每类都从物理原理出发建立了完整的干扰模型。传感器团队的必读材料。 研究机构 Physical Principle Approach本身就是方法论创新。C&C Driver模型的局限性(仅覆盖制动、仅覆盖安全维度、参数区域局限)是明确的open research question。VRU场景的量化方法尚在发展中。 三、工程师应该怎么读 不同角色的工程师,关注点差异很大。 算法工程师 应该重点理解场景不是随机产生的,而是通过DDT过程分解+物理原理推导出来的。重点看第5章——Cut-in场景如何从数据采集→参数提取→分布估计→概率阈值设定,一步步定义出"合理可预见"的参数范围。以及第6.4节的可预防性边界——这直接决定了你的规划模块应该设置多大的安全裕度。 ...

2026年4月6日 · 约 10 分钟 · 约 3653 字 · 张玉新 Yuxin Zhang · 0