摘要:2026年6月2日,《机器人预期功能安全实施指南》国家标准项目进入公示,公示截止日期为2026年7月2日。我把这个方向放进 OpenTopic,作为第二个开放研究专题:Robot SOTIF。它不是把自动驾驶 SOTIF 简单搬到机器人上,而是尝试建立一条从标准、ODD、场景、触发条件、物理交互、LLM/VLA 决策安全到 safety case 的证据链。

我最近看到一个标准项目公示,觉得必须认真记一笔。
2026年6月2日,国家标准项目《机器人预期功能安全实施指南》进入公示。项目周期18个月,归口全国机器人标准化技术委员会,公示截止日期是2026年7月2日。
这个标题里最值得关注的词,不是“机器人”。
而是“预期功能安全”。
英文不要逐词硬译。这个领域对应的是 SOTIF,也就是 Safety of the Intended Functionality。
它问的不是“零部件坏了怎么办”。
它问的是:
如果系统没有发生故障,功能也在按设计运行,但在某个复杂开放场景中仍然做出了不安全行为,我们该如何识别、量化、验证和缓解?
这个问题,自动驾驶行业已经痛苦地讨论了很多年。现在,它开始正式进入机器人标准化语境。
一、为什么这是一个重要信号
传统机器人安全,很多时候围绕隔离、防护、急停、限力、限速和协作应用展开。
这些当然重要。ISO 10218、ISO/TS 15066、ISO 13482 这些标准,给工业机器人、协作机器人和个人护理机器人提供了很重要的安全基础。
但机器人正在变。
它不再只在围栏里面工作,也不再只在结构化产线里重复动作。移动服务机器人、清洁消杀机器人、安防巡检机器人、物流配送机器人、养老医疗机器人,都会进入开放环境,面对普通用户、复杂任务和不稳定场景。
更关键的是,大模型和 VLA 让机器人决策系统从规则逻辑,走向语义理解、任务分解和端到端动作生成。
这时,安全问题就不再只是“有没有撞上人”。
还包括:
- 机器人是否理解错了用户意图?
- 是否在 ODD 边界外仍然继续执行?
- 是否为了完成任务而靠得太近、走得太急、停得太突然?
- 是否在长时序任务里一步步积累风险?
- 是否能把拒绝执行、回退、人工介入和运行日志变成可审查证据?
这就是机器人 SOTIF 的价值。
二、为什么我把它放进 OpenTopic
OpenTopic 的初衷,是把研究思路也像数据集一样开源。
说来惭愧,我手里其实一直有一些可以继续做深的材料。之前已经整理过三份关于具身智能安全、物理交互安全、LLM/VLA 决策安全的报告。但这些报告如果只是留在文件夹里,价值很有限。
这次标准项目公示出来以后,我重新看了一遍,觉得最合适的处理方式不是再写一篇普通评论,而是把它开放成一个可持续维护的问题入口。
所以我在 OpenTopic 里新增了第二个话题:
专题下面先放了三条线索:
我的处理原则很保守:标准只引用官方来源;没有逐条核验的 SOTA 论文和实验数字,先作为研究线索,不写成事实结论。
这个领域现在最需要的不是热闹,而是证据链。
三、自动驾驶经验能迁移什么
机器人 SOTIF 最值得借鉴自动驾驶的地方,不是把 ISO 21448 照搬过来。
真正能迁移的是方法论。
第一,ODD。
自动驾驶里的 ODD 通常包括道路、天气、光照、交通参与者、速度范围等。机器人也需要 ODD,但维度会更多:环境、任务、用户、移动本体、接触对象、通信状态、地面状态、载荷和监管边界。
第二,场景。
自动驾驶已经建立了基于场景的安全评价框架。ISO 34502 提供了功能场景、逻辑场景和具体场景的三层抽象。机器人也需要类似框架,只是场景不再只围绕道路交通,还要加入任务语义、人机距离、接触状态和用户行为。
第三,触发条件。
SOTIF 的核心不是泛泛说“有风险”,而是找到风险被触发的条件。对机器人来说,触发条件可能来自感知不足,也可能来自语义误判、任务前提不成立、用户突然靠近、地面湿滑、载荷偏移、通信延迟或模型置信度异常。
第四,安全论证。
机器人 SOTIF 最终不能只给一个分数。它需要 safety case:主张、论证、证据。数据、仿真、实测、运行时监控、回退策略和日志,都应该成为可复核证据。
四、移动物理 AI 是更大的背景
我近期提交的一份专项指南征集申报材料里,把“移动物理 AI”定义为 AI 对真实物理世界规律的理解与交互能力,并在复杂开放环境中实现自主感知、决策、运动和执行。
这个定义比“机器人”更宽。
它覆盖智能汽车、移动机器人、无人机、物流装备、飞行汽车等移动具身载体。它真正关心的是:这些系统能不能在真实物理世界里安全、自然、有效地行动。
这里面有一个很关键的方法框架:HMRM,Human-like Mobility Reference Model,类人移动参考模型。它的作用是给不同移动本体建立可比较的参考行为分布。
与它配套的是 HLMB,Human-like Mobility Behaviour,类人移动行为。它指的是被评价对象在通行、避让、跟随、让行、交付等任务中的外部可观测行为。
简单说,HMRM 是参考模型,HLMB 是评价对象。两者接在一起,就能把 Safety、Smoothness、Efficiency 三个维度放进同一条跨本体测评链路里。
这和机器人 SOTIF 是天然相关的。
因为很多时候,安全不是一个孤立阈值,而是一个行为分布问题。
比如同样是 jerk,在乘用车里关系到驾乘舒适;在商用车里还关系到货物完整;在末端配送车里关系到货件稳定;在宏观移动机器人里则可能关系到底盘稳定、设备保护和行人预期。
如果只看“有没有撞”,我们会漏掉大量真实部署中的安全问题。
五、接下来可以怎么做
这个专题不是结论,而是一个面向研究深化、企业验证和产品落地的开放问题入口。
我更希望相关领域的研究人员、企业工程团队、测评机构和工厂现场团队,都能把它当成一份可以继续推进的开放问题清单。
可以做的方向很多:
- 机器人 SOTIF 场景与触发条件分类,并转化为可复核的测评项
- 移动服务机器人 ODD 模板和部署准入清单
- 末端配送机器人接近、让行、停靠和避让行为评价
- LLM/VLA 机器人任务规划中的安全监控器和运行时回退策略
- 基于真实轨迹回放的机器人决策安全评测协议
- HMRM 在移动机器人和智能驾驶之间的跨本体映射,并进入产品测评指标
- 面向标准化和产品准入的机器人 safety case 模板
我也会继续把这个专题维护下去。标准公示结束以后,如果项目内容有新变化,再更新一次。
这件事短期看是一个标准项目,长期看可能是一个新方向。
自动驾驶安全过去十年走过的路,机器人和移动物理 AI 不一定要重新摔一遍。
真正有价值的迁移,不是复制答案,而是复用问题意识、证据结构和工程纪律。
参考来源: