清华大学智能产业研究院(AIR)在《npj Artificial Intelligence》上发表了一项研究,揭示了人类驾驶员与智能驾驶算法在视觉注意力机制上存在的本质差异。研究团队通过对比驾驶员眼动数据与算法表现,首次量化了人类驾驶注意力的三阶段模型。该模型将人类视觉处理划分为扫描、检查与重新评估三个阶段。其中,检查阶段涉及对场景的语义评估,是人类经验的核心体现。研究发现,算法难以自主获取人类通过长期经验形成的语义优先级判断能力。为了弥补这一差距,研究提出将人类在检查阶段的注意力特征融入现有智驾算法(如AxANet)。实验结果表明,这种融合有效提升了算法的性能。在异常检测任务中,算法准确率获得了提升;在轨迹规划任务中,误差显著降低。研究进一步提出了一种高效的双阶段伪注意力生成方案。该方案仅需少量驾驶员眼动数据即可优化算法,使中等规模的模型无需依赖大规模预训练就能增强语义理解能力。这一方案已在车载实时系统中验证了可行性。该研究为提升智能驾驶系统的可靠性与人性化水平提供了新的思路,即通过算法融合人类的驾驶经验与注意力模式,来弥补纯数据驱动方法的不足。


