AD4CHE

导读：智能驾驶要“像人一样开车”，前提是搞清楚人到底是怎么开的。本文从“类人驾驶”这个概念出发，讨论人类驾驶行为研究的五个落地方向、获取答案的四条路径，以及我们团队正在做的开源数据实践。全文约5000字。本文 2026 年 3 月底首发于微信公众号，2026 年 6 月收录入本站。人类自古以来就热衷于研究自己的行为。婴儿后半夜为什么突然哭醒？我有经验——大半是尿憋的。两三岁的孩子为什么每天追着你问一百个“为什么”？青春期为什么开始在意同学的看法胜过父母？刚工作的年轻人为什么明知该早睡却总忍不住刷手机到凌晨？人到中年为什么突然迷上了跑步、钓鱼或者自驾？人老了，为什么总喜欢翻老照片、讲当年的故事？每一种行为研究的背后，都有实际的用处。搞清楚孩子为什么问“为什么”，你就不会不耐烦而是顺势引导；理解了“报复性熬夜”的心理机制，你才能真正改掉它；知道中年人为什么迷上户外，也许下一个消费品牌就藏在里面。那——人到底是怎么开车的？搞清楚这个问题，又能帮到谁？一、研究“人类”驾驶，实现“类人”驾驶我研究车辆相关的工作，不经意间也快二十年了，时间都去哪儿了！从小对车就非常感兴趣，小时候在农村，很少有漂亮的轿车从门口经过，每次都会和小伙伴追在车后面跑，连闻汽车尾气都觉得是一种乐趣。高考的时候，每一个志愿填的第一专业都是车辆工程。本科没去成，进了机械工程。后来辗转进入吉大汽车学院读博，研究过水陆两栖车、工程车辆、飞行汽车、商用车……最终聚焦到乘用车智能驾驶方向。近十几年的核心工作，是研究智能驾驶的安全——怎么让智能系统比人更安全。在这个过程中，我逐渐意识到一个问题：要让系统“比人更安全、或高一个数量级”，你得先知道人的安全水平到底是什么样的。更进一步，要让智能驾驶“像人一样开车、开得比人更好”，得先搞清楚人到底是怎么开车的。前几天卓驭×红旗的BOSS直测中，沈老师反复提到一个词——“类人驾驶”。我觉得这个词比行业里常说的“拟人驾驶”更好。“拟人”是“模拟人”，暗含着一个假设：人是标准答案，系统去模仿就好。但“类人”更诚实——它承认智能驾驶不是也不该是人类的复制品，而是一种“像人但可以更好”的驾驶方式。安全的底线要守住甚至超越，但在舒适、效率、交互节奏上，要像人一样自然。更妙的是，“类人”和“人类”恰好构成一组镜像。我们研究的是“人类”的驾驶行为，研究的目的，是让智能驾驶实现“类人”的驾驶。人类，类人。两个字颠倒过来只需要一秒，但从研究人类驾驶到实现类人驾驶，中间隔着海量的数据采集、场景分析、模型构建、工程验证——这条路很长也很艰辛，但值得整个行业去推进。什么是“类人驾驶”？安全是底线，这毫无疑问。但消费者真正为之买单的，是那些比“安全”更微妙的东西：起步不顿、跟车不紧、变道不愣、过弯不晃。绿灯亮了不会傻等半天，遇到加塞不会急刹到乘客晕车。这些不是靠几个安全指标就能覆盖的。这些是人类在日常驾驶中，每天都在做的事情。驾驶行为研究其实由来已久。我的导师郭孔辉院士，早在1981年赴美国密歇根大学做访问学者期间，就在驾驶员行为模型与人-车闭环系统动力学仿真方面做出了开创性的工作。当时的驾驶员模型主要服务于车辆操纵稳定性研究，而非自动驾驶。近年来更常被提及的是“驾驶员参考能力模型”，比如UNECE R157法规和ISO 34502中的定义，主要基于场地测试——在封闭环境中，选取驾驶员样本，针对特定场景进行测试，得出关键安全参数。这些工作很有价值，它们画出了安全的底线。但场地测试能覆盖的场景是非常有限的。而人类每天在路上面对的场景，99%以上都不是那些极限工况。起步时踩油门的力度曲线，跟车时保持的时距随速度怎么变化，过弯时的轨迹偏好，在十字路口和行人、非机动车怎么交互——这些“正常”的行为数据，才是实现“类人驾驶”的真正基准。场地测试画出“安全”的底线，自然驾驶数据画出“类人”的基准。两条线之间，就是智能驾驶该有的样子。二、这个答案到底对谁有用回到那个问题：搞清楚“人是怎么开车的”，到底能帮到谁？我沿着一辆智能汽车从开发到上路的全过程来展开。产品定义和系统开发智能驾驶的开发链条上，很多环节都需要人类驾驶行为数据作为参考。当前行业正在快速向端到端方案演进——感知、决策、控制不再是分开的模块，而是一个大模型端到端学习。但即便在端到端的范式下，仍然有大量工作离不开“人类是怎么开的”这个问题：产品经理在定义功能边界：城市NOA需要覆盖哪些场景？这些场景中人类的行为多样性有多大？系统/安全工程师在划定安全边界：巡航功能需要应对多激进的加塞？什么程度的cut-in算超出系统能力？数据工程师在筛选训练数据：海量车端数据中，哪些片段包含高价值的人车交互行为？筛选标准是什么？测试工程师在定义验收标准：端到端模型输出的轨迹，怎么判断“够好”还是“不够好”？他们面对的其实是同一个问题：人类在这些场景下到底是怎么开的？据我了解，现实中很多边界和标准是“拍脑袋”定的，或者从文献里找一个不太完备的数字凑合用。上路后发现太激进或太保守，再反复调。说实话，很多时候做了很多妥协。如果有一份足够丰富的人类驾驶行为数据——不同速度段、不同道路类型、不同交互场景下的行为参数分布——上面这些工作就可以从“拍脑袋”变成“看数据”。这不是效率的提升，是开发范式的升级。标准制定与合规测试标准法规是智能驾驶准入和上路的门槛。门槛定得太低，有安全隐患；定得太高，企业合规成本爆炸，技术进步被拖慢。场地测试数据能支撑有限场景下的标准制定。但中国的交通环境——高速加塞、非机动车混行、不规则路口、匝道博弈——远比场地测试能模拟的要复杂得多。更丰富多样的自然驾驶场景数据与实车场地测试等数据联合，可以在两个维度上帮助标准制定：一是场景选择更合理。哪些场景在中国的道路上真正高频出现？哪些场景看似常见实则罕见？有了大规模自然驾驶数据的统计支撑，标准中纳入的场景就能更贴近真实道路情况，而不是靠专家经验或个别热点事件来决定。二是通过阈值更准确。日本的SAKURA项目在这方面做了很好的方法论探索——它提出了“可预见/不可预见”和“可预防/不可预防”的四象限框架，给出了典型场景清单。但要画出每个具体场景中那条“可预防边界”到底在哪里——比如在某个速度段下，多短的TTC算“人类也来不及反应”，多长的TTC算“正常人完全可以避免”——这需要大量真实数据来定义，而不是拍脑袋划一条线。类人驾驶测评这是我认为当前最有价值、也最有想象力的应用方向。现有的辅助驾驶和自动驾驶标准法规测试，大多聚焦在安全性上：能不能识别障碍物？能不能紧急制动？这些当然重要——车厂和供应商会使用“各种方法”让推向市场的量产车的智驾系统都能“通过”这类场景——但消费者的感受远不止于此。经常看智驾博主试驾视频的朋友一定熟悉这些场景：高速上开着智驾，旁边车道的车一个接一个插进来——系统每次都礼让，你坐在车里越来越焦虑，最后忍不住接管了。前面明明没什么车了，智驾还在用60码的速度慢悠悠地巡航——你手动踩一脚油门，车速上去了，体验也上去了。过一个大曲率弯道，方向盘修正的节奏和你自己开时不一样——说不上哪里不对，但你就是觉得不自然。这些画面在各种直播和试驾评测中反复出现。有意思的是，博主们和车企领导在描述这些问题时，用的几乎都是主观感受——“跟车太远了”“过弯有点愣”“起步不够丝滑”。但到底“太远”是远了多少？“不够丝滑”的减速曲线长什么样？目前并没有一个权威的量化基准来回答这些问题。这恰恰是“类人驾驶”真正要解决的事情。智能驾驶要想让消费者真正信任并愿意持续使用，不仅要“安全”，还要在舒适性和通行效率上接近甚至超越人类驾驶习惯——而这些维度的量化，必须建立在大规模人类驾驶行为数据之上。类人驾驶测评需要的不是“一个老司机的意见”，而是“千万条行车轨迹告诉你的答案”。事故研究：区分“能避免”和“避不了” 前面说的都是正向开发和测评的应用。还有一个是反向的——从事故中学习。交通事故数据是极其宝贵的资源。但光看事故本身，你很难判断一个关键问题：这个事故，换一个正常的人类驾驶员，能不能避免？ ...