从“人类”驾驶,到“类人”驾驶

导读:智能驾驶要“像人一样开车”,前提是搞清楚人到底是怎么开的。本文从“类人驾驶”这个概念出发,讨论人类驾驶行为研究的五个落地方向、获取答案的四条路径,以及我们团队正在做的开源数据实践。全文约5000字。本文 2026 年 3 月底首发于微信公众号,2026 年 6 月收录入本站。 人类自古以来就热衷于研究自己的行为。 婴儿后半夜为什么突然哭醒?我有经验——大半是尿憋的。 两三岁的孩子为什么每天追着你问一百个“为什么”? 青春期为什么开始在意同学的看法胜过父母? 刚工作的年轻人为什么明知该早睡却总忍不住刷手机到凌晨? 人到中年为什么突然迷上了跑步、钓鱼或者自驾? 人老了,为什么总喜欢翻老照片、讲当年的故事? 每一种行为研究的背后,都有实际的用处。搞清楚孩子为什么问“为什么”,你就不会不耐烦而是顺势引导;理解了“报复性熬夜”的心理机制,你才能真正改掉它;知道中年人为什么迷上户外,也许下一个消费品牌就藏在里面。 那——人到底是怎么开车的?搞清楚这个问题,又能帮到谁? 一、研究“人类”驾驶,实现“类人”驾驶 我研究车辆相关的工作,不经意间也快二十年了,时间都去哪儿了!从小对车就非常感兴趣,小时候在农村,很少有漂亮的轿车从门口经过,每次都会和小伙伴追在车后面跑,连闻汽车尾气都觉得是一种乐趣。 高考的时候,每一个志愿填的第一专业都是车辆工程。本科没去成,进了机械工程。后来辗转进入吉大汽车学院读博,研究过水陆两栖车、工程车辆、飞行汽车、商用车……最终聚焦到乘用车智能驾驶方向。 近十几年的核心工作,是研究智能驾驶的安全——怎么让智能系统比人更安全。 在这个过程中,我逐渐意识到一个问题:要让系统“比人更安全、或高一个数量级”,你得先知道人的安全水平到底是什么样的。更进一步,要让智能驾驶“像人一样开车、开得比人更好”,得先搞清楚人到底是怎么开车的。 前几天卓驭×红旗的BOSS直测中,沈老师反复提到一个词——“类人驾驶”。我觉得这个词比行业里常说的“拟人驾驶”更好。“拟人”是“模拟人”,暗含着一个假设:人是标准答案,系统去模仿就好。但“类人”更诚实——它承认智能驾驶不是也不该是人类的复制品,而是一种“像人但可以更好”的驾驶方式。安全的底线要守住甚至超越,但在舒适、效率、交互节奏上,要像人一样自然。 更妙的是,“类人”和“人类”恰好构成一组镜像。我们研究的是“人类”的驾驶行为,研究的目的,是让智能驾驶实现“类人”的驾驶。 人类,类人。两个字颠倒过来只需要一秒,但从研究人类驾驶到实现类人驾驶,中间隔着海量的数据采集、场景分析、模型构建、工程验证——这条路很长也很艰辛,但值得整个行业去推进。 什么是“类人驾驶”?安全是底线,这毫无疑问。但消费者真正为之买单的,是那些比“安全”更微妙的东西:起步不顿、跟车不紧、变道不愣、过弯不晃。绿灯亮了不会傻等半天,遇到加塞不会急刹到乘客晕车。 这些不是靠几个安全指标就能覆盖的。这些是人类在日常驾驶中,每天都在做的事情。 驾驶行为研究其实由来已久。我的导师郭孔辉院士,早在1981年赴美国密歇根大学做访问学者期间,就在驾驶员行为模型与人-车闭环系统动力学仿真方面做出了开创性的工作。当时的驾驶员模型主要服务于车辆操纵稳定性研究,而非自动驾驶。 近年来更常被提及的是“驾驶员参考能力模型”,比如UNECE R157法规和ISO 34502中的定义,主要基于场地测试——在封闭环境中,选取驾驶员样本,针对特定场景进行测试,得出关键安全参数。这些工作很有价值,它们画出了安全的底线。 但场地测试能覆盖的场景是非常有限的。而人类每天在路上面对的场景,99%以上都不是那些极限工况。起步时踩油门的力度曲线,跟车时保持的时距随速度怎么变化,过弯时的轨迹偏好,在十字路口和行人、非机动车怎么交互——这些“正常”的行为数据,才是实现“类人驾驶”的真正基准。 场地测试画出“安全”的底线,自然驾驶数据画出“类人”的基准。两条线之间,就是智能驾驶该有的样子。 二、这个答案到底对谁有用 回到那个问题:搞清楚“人是怎么开车的”,到底能帮到谁? 我沿着一辆智能汽车从开发到上路的全过程来展开。 产品定义和系统开发 智能驾驶的开发链条上,很多环节都需要人类驾驶行为数据作为参考。 当前行业正在快速向端到端方案演进——感知、决策、控制不再是分开的模块,而是一个大模型端到端学习。但即便在端到端的范式下,仍然有大量工作离不开“人类是怎么开的”这个问题: 产品经理在定义功能边界:城市NOA需要覆盖哪些场景?这些场景中人类的行为多样性有多大? 系统/安全工程师在划定安全边界:巡航功能需要应对多激进的加塞?什么程度的cut-in算超出系统能力? 数据工程师在筛选训练数据:海量车端数据中,哪些片段包含高价值的人车交互行为?筛选标准是什么? 测试工程师在定义验收标准:端到端模型输出的轨迹,怎么判断“够好”还是“不够好”? 他们面对的其实是同一个问题:人类在这些场景下到底是怎么开的? 据我了解,现实中很多边界和标准是“拍脑袋”定的,或者从文献里找一个不太完备的数字凑合用。上路后发现太激进或太保守,再反复调。说实话,很多时候做了很多妥协。 如果有一份足够丰富的人类驾驶行为数据——不同速度段、不同道路类型、不同交互场景下的行为参数分布——上面这些工作就可以从“拍脑袋”变成“看数据”。 这不是效率的提升,是开发范式的升级。 标准制定与合规测试 标准法规是智能驾驶准入和上路的门槛。门槛定得太低,有安全隐患;定得太高,企业合规成本爆炸,技术进步被拖慢。 场地测试数据能支撑有限场景下的标准制定。但中国的交通环境——高速加塞、非机动车混行、不规则路口、匝道博弈——远比场地测试能模拟的要复杂得多。 更丰富多样的自然驾驶场景数据与实车场地测试等数据联合,可以在两个维度上帮助标准制定: 一是场景选择更合理。哪些场景在中国的道路上真正高频出现?哪些场景看似常见实则罕见?有了大规模自然驾驶数据的统计支撑,标准中纳入的场景就能更贴近真实道路情况,而不是靠专家经验或个别热点事件来决定。 二是通过阈值更准确。日本的SAKURA项目在这方面做了很好的方法论探索——它提出了“可预见/不可预见”和“可预防/不可预防”的四象限框架,给出了典型场景清单。但要画出每个具体场景中那条“可预防边界”到底在哪里——比如在某个速度段下,多短的TTC算“人类也来不及反应”,多长的TTC算“正常人完全可以避免”——这需要大量真实数据来定义,而不是拍脑袋划一条线。 类人驾驶测评 这是我认为当前最有价值、也最有想象力的应用方向。 现有的辅助驾驶和自动驾驶标准法规测试,大多聚焦在安全性上:能不能识别障碍物?能不能紧急制动?这些当然重要——车厂和供应商会使用“各种方法”让推向市场的量产车的智驾系统都能“通过”这类场景——但消费者的感受远不止于此。 经常看智驾博主试驾视频的朋友一定熟悉这些场景: 高速上开着智驾,旁边车道的车一个接一个插进来——系统每次都礼让,你坐在车里越来越焦虑,最后忍不住接管了。 前面明明没什么车了,智驾还在用60码的速度慢悠悠地巡航——你手动踩一脚油门,车速上去了,体验也上去了。 过一个大曲率弯道,方向盘修正的节奏和你自己开时不一样——说不上哪里不对,但你就是觉得不自然。 这些画面在各种直播和试驾评测中反复出现。有意思的是,博主们和车企领导在描述这些问题时,用的几乎都是主观感受——“跟车太远了”“过弯有点愣”“起步不够丝滑”。但到底“太远”是远了多少?“不够丝滑”的减速曲线长什么样?目前并没有一个权威的量化基准来回答这些问题。 这恰恰是“类人驾驶”真正要解决的事情。智能驾驶要想让消费者真正信任并愿意持续使用,不仅要“安全”,还要在舒适性和通行效率上接近甚至超越人类驾驶习惯——而这些维度的量化,必须建立在大规模人类驾驶行为数据之上。 类人驾驶测评需要的不是“一个老司机的意见”,而是“千万条行车轨迹告诉你的答案”。 事故研究:区分“能避免”和“避不了” 前面说的都是正向开发和测评的应用。还有一个是反向的——从事故中学习。 交通事故数据是极其宝贵的资源。但光看事故本身,你很难判断一个关键问题:这个事故,换一个正常的人类驾驶员,能不能避免? ...

2026年6月10日 · 约 18 分钟 · 约 7021 字 · 张玉新 Yuxin Zhang · 0