机器人也需要 SOTIF 了

摘要：2026年6月2日，《机器人预期功能安全实施指南》国家标准项目进入公示，公示截止日期为2026年7月2日。我把这个方向放进 OpenTopic，作为第二个开放研究专题：Robot SOTIF。它不是把自动驾驶 SOTIF 简单搬到机器人上，而是尝试建立一条从标准、ODD、场景、触发条件、物理交互、LLM/VLA 决策安全到 safety case 的证据链。

图1：机器人 SOTIF 的证据链

我最近看到一个标准项目公示，觉得必须认真记一笔。

2026年6月2日，国家标准项目《机器人预期功能安全实施指南》进入公示。项目周期18个月，归口全国机器人标准化技术委员会，公示截止日期是2026年7月2日。

这个标题里最值得关注的词，不是“机器人”。

而是“预期功能安全”。

英文不要逐词硬译。这个领域对应的是 SOTIF，也就是 Safety of the Intended Functionality。

它问的不是“零部件坏了怎么办”。

它问的是：

如果系统没有发生故障，功能也在按设计运行，但在某个复杂开放场景中仍然做出了不安全行为，我们该如何识别、量化、验证和缓解？

这个问题，自动驾驶行业已经痛苦地讨论了很多年。现在，它开始正式进入机器人标准化语境。

一、为什么这是一个重要信号

传统机器人安全，很多时候围绕隔离、防护、急停、限力、限速和协作应用展开。

这些当然重要。ISO 10218、ISO/TS 15066、ISO 13482 这些标准，给工业机器人、协作机器人和个人护理机器人提供了很重要的安全基础。

但机器人正在变。

它不再只在围栏里面工作，也不再只在结构化产线里重复动作。移动服务机器人、清洁消杀机器人、安防巡检机器人、物流配送机器人、养老医疗机器人，都会进入开放环境，面对普通用户、复杂任务和不稳定场景。

更关键的是，大模型和 VLA 让机器人决策系统从规则逻辑，走向语义理解、任务分解和端到端动作生成。

这时，安全问题就不再只是“有没有撞上人”。

还包括：

机器人是否理解错了用户意图？
是否在 ODD 边界外仍然继续执行？
是否为了完成任务而靠得太近、走得太急、停得太突然？
是否在长时序任务里一步步积累风险？
是否能把拒绝执行、回退、人工介入和运行日志变成可审查证据？

这就是机器人 SOTIF 的价值。

二、为什么我把它放进 OpenTopic

OpenTopic 的初衷，是把研究思路也像数据集一样开源。

说来惭愧，我手里其实一直有一些可以继续做深的材料。之前已经整理过三份关于具身智能安全、物理交互安全、LLM/VLA 决策安全的报告。但这些报告如果只是留在文件夹里，价值很有限。

这次标准项目公示出来以后，我重新看了一遍，觉得最合适的处理方式不是再写一篇普通评论，而是把它开放成一个可持续维护的问题入口。

所以我在 OpenTopic 里新增了第二个话题：

Robot SOTIF：机器人预期功能安全开放研究专题

专题下面先放了三条线索：

我的处理原则很保守：标准只引用官方来源；没有逐条核验的 SOTA 论文和实验数字，先作为研究线索，不写成事实结论。

这个领域现在最需要的不是热闹，而是证据链。

三、自动驾驶经验能迁移什么

机器人 SOTIF 最值得借鉴自动驾驶的地方，不是把 ISO 21448 照搬过来。

真正能迁移的是方法论。

第一，ODD。

自动驾驶里的 ODD 通常包括道路、天气、光照、交通参与者、速度范围等。机器人也需要 ODD，但维度会更多：环境、任务、用户、移动本体、接触对象、通信状态、地面状态、载荷和监管边界。

第二，场景。

自动驾驶已经建立了基于场景的安全评价框架。ISO 34502 提供了功能场景、逻辑场景和具体场景的三层抽象。机器人也需要类似框架，只是场景不再只围绕道路交通，还要加入任务语义、人机距离、接触状态和用户行为。

第三，触发条件。

SOTIF 的核心不是泛泛说“有风险”，而是找到风险被触发的条件。对机器人来说，触发条件可能来自感知不足，也可能来自语义误判、任务前提不成立、用户突然靠近、地面湿滑、载荷偏移、通信延迟或模型置信度异常。

第四，安全论证。

机器人 SOTIF 最终不能只给一个分数。它需要 safety case：主张、论证、证据。数据、仿真、实测、运行时监控、回退策略和日志，都应该成为可复核证据。

四、移动物理 AI 是更大的背景

我近期提交的一份专项指南征集申报材料里，把“移动物理 AI”定义为 AI 对真实物理世界规律的理解与交互能力，并在复杂开放环境中实现自主感知、决策、运动和执行。

这个定义比“机器人”更宽。

它覆盖智能汽车、移动机器人、无人机、物流装备、飞行汽车等移动具身载体。它真正关心的是：这些系统能不能在真实物理世界里安全、自然、有效地行动。

这里面有一个很关键的方法框架：HMRM，Human-like Mobility Reference Model，类人移动参考模型。它的作用是给不同移动本体建立可比较的参考行为分布。

与它配套的是 HLMB，Human-like Mobility Behaviour，类人移动行为。它指的是被评价对象在通行、避让、跟随、让行、交付等任务中的外部可观测行为。

简单说，HMRM 是参考模型，HLMB 是评价对象。两者接在一起，就能把 Safety、Smoothness、Efficiency 三个维度放进同一条跨本体测评链路里。

这和机器人 SOTIF 是天然相关的。

因为很多时候，安全不是一个孤立阈值，而是一个行为分布问题。

比如同样是 jerk，在乘用车里关系到驾乘舒适；在商用车里还关系到货物完整；在末端配送车里关系到货件稳定；在宏观移动机器人里则可能关系到底盘稳定、设备保护和行人预期。

如果只看“有没有撞”，我们会漏掉大量真实部署中的安全问题。

五、接下来可以怎么做

这个专题不是结论，而是一个面向研究深化、企业验证和产品落地的开放问题入口。

我更希望相关领域的研究人员、企业工程团队、测评机构和工厂现场团队，都能把它当成一份可以继续推进的开放问题清单。

可以做的方向很多：

机器人 SOTIF 场景与触发条件分类，并转化为可复核的测评项
移动服务机器人 ODD 模板和部署准入清单
末端配送机器人接近、让行、停靠和避让行为评价
LLM/VLA 机器人任务规划中的安全监控器和运行时回退策略
基于真实轨迹回放的机器人决策安全评测协议
HMRM 在移动机器人和智能驾驶之间的跨本体映射，并进入产品测评指标
面向标准化和产品准入的机器人 safety case 模板

我也会继续把这个专题维护下去。标准公示结束以后，如果项目内容有新变化，再更新一次。

这件事短期看是一个标准项目，长期看可能是一个新方向。

自动驾驶安全过去十年走过的路，机器人和移动物理 AI 不一定要重新摔一遍。

真正有价值的迁移，不是复制答案，而是复用问题意识、证据结构和工程纪律。

参考来源：

一、为什么这是一个重要信号#

二、为什么我把它放进 OpenTopic#

三、自动驾驶经验能迁移什么#

四、移动物理 AI 是更大的背景#

五、接下来可以怎么做#

一、为什么这是一个重要信号

二、为什么我把它放进 OpenTopic

三、自动驾驶经验能迁移什么

四、移动物理 AI 是更大的背景

五、接下来可以怎么做