动力类负极
产品中心
自动驾驶中的人机共驾模型及控制策略
来源:kok平台 | 作者:kok平台买球赛hiveyan | 发布时间: 2021-07-31 23:52:47 | 18 次浏览 | 分享到:

  对于在实现完全无人驾驶过程的SAE L5级之前,在一些自动驾驶无法正常处理的复杂或突发工况下,要求驾驶员必须在规定的时间内进行足够能力的响应过程,从系统角度上讲,需要能够尽可能的探测驾驶员当前的精神状态(如注意力是否集中、是否疲劳等)以及是否具备足够的驾驶接管能力,问题处理成功的关键是驾驶员是否及时且有效的响应系统发出的报警信息以及能否采用最有效的运动反应。这个过程实际是带有一定的不确定性,除开对于自动驾驶报警系统过程需要进行实时且准确地要求外,对于要求驾驶员在环也是具有很高的要求,比如驾驶员接管力度、速度、方式、能力等等。

  道路交通系统的人为因素和技术特征,以及它们与自动驾驶系统的交互兼容性决定性地影响了实际驾驶过程的安全性,即事故预防的可能性。如何科学的建立了一种方法,通过定性(描述性)以及定量(数学)的经验模型推导来获取驾驶员控制模型参数是比较重要的。

  本文将研究驾驶员在道路交通中的行为建模方法,其重点是利用预测性原则或称“预期的可观察性标准”,对驾驶员接管控制与驾驶状态进行监视,量化人类对车辆固有的驾驶能力限制,系统探测道路和交通环境特征与驾驶员能力限制之间的差距,从而为自动驾驶系统的安全开发过程奠定基础。

  在控制系统理论的状态空间表示中,三个标准是功能前提:可观察性,可控制性和稳定性。可观察性是指通过有限数量的可测量状态变量来了解整个系统的知识部分。生成的模型不可避免地是不完整的,但是尽管如此,它仍可以通过幅度和时间来深入了解人类控制行为的传递特性,从而获得重要的定量洞察力。它清楚地显示了人类的适应性及其局限性。

  驾驶员模型的最早方法起源于日本(Kondo 1953),模型描述了驾驶员在侧风干扰下的转向响应。它已经以预览距离的简单形式提出了模拟前方驾驶环境的人类预期感知能力的原理。这意味着驾驶员可以将所需路径的横向偏差外推至预览距离处的某个点,从而补偿估计的未来控制误差。这种方法也称为 “车架模型”。

  如下图描述了一种适用于自动驾驶系统的通用驾驶员控制模型,该模型适用于描述不同阶段的人类行为学习过程。下图中带有灰色背景的连接箭头的粗细表示关于两个模型的行为和任务级别之间的交互强度。

  如上图表示中,驾驶员行为模型预测包含三个主要方面,其一是利用先验知识对驾驶员行为进行行为预测,然后是基于一定规则对预测的驾驶员行为进行建模,最后利用采样感知数据与驾驶员建模结果融合生成一定的控制信号。

  基于先验知识的驾驶行为模型包含三个主要层面的驾驶员响应处理,首先通过驾驶员监控系统传感器输入对驾驶员特征信息进行检测,以此识别驾驶员身份或当前状态,其二是对驾驶员相关任务进行决策,如需要发出制动、转向或关闭转向灯等等,最后对生成的驾驶任务进行规划,可以按照安全或舒适模型进行排序,优先响应安全级别最高的驾驶任务。

  在系统获取了驾驶员先验知识模型后,对于该驾驶员相关的驾驶风格及能力已经有了相应的判断,通过类似大数据收集模式将该驾驶员的驾驶行为模式(规则)拟成类似清单一样的格式,可以存储在相应的模型存储单元中,该模型可以根据主观经验选择有效的变体。

  基于技能的行为特点是类似反射的刺激-反应机制,这就是通过第二层基于规则的驾驶行为收集过程后,自动驾驶系统可以逐渐对人类驾驶行为进行学习并建立人类驾驶行为仿真模型,这些是系统在经过或多或少长时间的学习过程中形成的,然后以准自主、稳定的流程进行驾驶行为模拟。从而后期系统可以逐渐以完善的人类驾驶技能进行主动驾驶。这种自主学习过程不仅可以极大程度的提升系统驾驶控制能力,减少对于人类驾驶的接管依赖度,也可以在不断对于人类驾驶的处理过程中学习到对于各种工况下的稳定处理能力。

  导航级别的典型时间范围是从一次完整行驶的可能持续时间(大约几个小时)到几分钟的范围(如果突然宣布要求更改路线,例如通过交通标志)。因此,当今的导航系统会从第一个指示开始,并在接近关键点时反复进行和证实。在良好的能见度条件下,驾驶员只要眼睛能感知到前方相应的道路和交通场景,就可以得出所需的目标变量并启动预期的控制动作。

  考虑到运动预期时间约为1 s,特别是在发生突发事件的情况下,交通环境感知的过程必须明显提前。报告的反应时间显示平均值约为2 s,也就是说,在复杂的道路交通环境中的信息和警报系统应该使总的预期时间长于大约3 s。

  “导航驾驶任务”包括从可用的道路网络中选择合适的行驶路线以及行驶时间的估算。如果发生有关当前干扰的信息,例如事故,道路工程或交通拥堵,则可能需要修改路线规划。在以前未知的交通环境中,导航任务需要有意识的计划过程,因此必须分配给导航任务基于先验知识的行为级别。导航过程的特征可以是通常由不同的道路标记引发的时间离散活动。

  “引导性驾驶任务”就是利用导航信息指导自动驾驶车辆朝向目的地沿着固定的轨迹进行自动驾驶。自动驾驶系统在对驾驶员指导级别上的核心任务是从前方的交通场景中得出合理且安全的所需功能,例如目标轨道和目标速度,同时通过预期的开环控制进行预测性干预,以便为所需和实际输出功能之间的最小偏差创建有利的前提条件。在此,子模型“预期的开环控制”的单个输入变量是规定的期望轨迹(道路中心线)的曲率(即半径的倒数)。预期前馈控制动作在所需路径曲率变化之前的某个时间间隔(称为“运动预期时间TA”)开始,然后通过增益因子和平滑滞后时间常数进行传递。

  “稳定性驾驶过程”则是对自动驾驶车辆的实际控制作用,在稳定的任务级别上,驾驶员必须将车辆运动与所选的引导变量对齐。这意味着他必须通过闭环控制过程来确保通过适当的纠偏动作保持出现偏差的稳定性,并补偿在可接受的水平。如上图,稳定性控制模型中主要是采集后向反馈的横向位置偏差、航向角以及路径曲率误差来做补偿控制。为了满足稳定性标准,较高的车速需要驾驶员做出较小的时移。这种必要性也可以通过所谓的交叉频率模型来解释:车辆横向动力学的稳定性裕量随车速的增加而减小。

  在指定的各种行为类别中,自动驾驶系统引导和稳定性任务的执行结果在很大程度上取决于系统驾驶经验以及系统已经遇到特定交通状况的频率。对于驾驶员驾驶过程的三层控制,特别是在静态环境中移动以及运动中的异物会不断改变驾驶员的感觉输入信息,特别是在驾驶员眼中三维世界的透视表示中,不断变化的这一视野包含指导变量以及车辆运动状态与驾驶员意图的偏差。

  其中H(s)表示为驾驶员控制模型,其接收到传感器发送的预测车辆的相对位置rp与实际反馈位置yp之差ep=rp-yp,其输出的驾驶员转向角δ作为车辆动力学模型G(s)的输入用于调节模型输出的实时计算值并更新车辆位置y与实时横摆角。其中B(s)所表示的预测器对当前已经更新的位置y进行重新预测,最终更新预测值yp,该预测器可以采用卡尔曼滤波器进行预测+更新;

  一般情况下,对于自动驾驶控制而言,当检测到有碰撞危险情况时可以通过制动或者转向进行避撞,实际过程中往往通过权衡二者之间的避撞权重关系进行决策,比如采用制动的权重大于转向,则系统自动利用转向进行避撞,而实际过程中,驾驶员可能观测到前方的碰撞危险状态,从而及时做出一定的决策反应,比如施加轻微的制动力或者转向力在自车上,此时系统需要通过一定的算法充分检测到驾驶员对于系统的控制作用,及时调整系统本身的控制策略,如下图表示了一种驾驶员对系统控制的干扰过程。

  AFS controller表示由自动驾驶控制的转向过程扭矩或转角,而驾驶员控制器Driver Controller表示对驾驶员驾驶模型的预测器,当对驾驶员操作的预测输出转角δdriver被检测到时,将其作为AFS的作用因子输入到AFS控制器中,从而控制AFS的实际输出转角δAFS, 作为反馈每一个输出控制的实际观测值x(k+1)都将作为作用因子,从而影响Driver Controller与AFS Controller的新一轮预测值。

  这里需要注意的是,无论驾驶员采取何种策略,都应该是系统配合驾驶员进行输出控制调整,因此系统的策略是需要充分检测驾驶员对转向的控制(如转向角及转向速率)而进行的。

  一般的针对L3控制下的低速场景,驾驶员模型的回避能力通常是采用仅通过制动进行的。通过释放油门踏板或踩下制动踏板进行速度校正通常比转向需要更长的预期时间。系统驱动程序模型分为以下三个部分:“感知”、“决策”、“执行”。而系统控制过程中需要实时的对驾驶员可以控制车辆的能力及行为进行判断和预测。

  该图中表示了一个有经验的驾驶员对于切入切出车辆的反应,其中包含对风险感知及决策的能力过程Perception time,当感知到相关风险时进行风险最小化策略评估,其评估的时间延迟Delay in Decision,随后驾驶员开始丢油门释放加速响应,其具体的时间为Accelerator release time,当加速踏板完全释放后,判断满足制动条件,此时进入到制动功能控制。对于制动控制而言需要实时的检测驾驶员对于制动踏板开度的踩踏深度及踩踏速率,其踏板深度主要用于对自动驾驶系统是否被驾驶员纵向操控退出逻辑的判断,而踩踏速率则是及时响应驾驶员的作用力度,比如驾驶员以比较大的速率踩踏制动踏板,则系统认为前方出现了比较大的碰撞危险,此时系统需要提高对于危险的预判能力,提早触发AEB的辅助制动功能。

  除此之外,在L3控制下的高速场景,通常随着速度的增加,驾驶员对于前方危险的预判能力就越弱,或者说其反应时间越滞后,为了保持整个驾驶员-车辆控制系统的足够的稳定性裕度,必须通过增加差动部分和缩短驾驶员响应的延迟时间来补偿这种影响。

  自动驾驶车辆过程中,总会出现驾驶员需要手动干预系统进行人机共驾的情况,亦或者在设计运行范围外需要驾驶员手动接管的情况,期间,系统需要对驾驶员采取的干预或接管策略及影响进行及时的预测、响应及反馈调节,如何对驾驶员行为模式进行有效的建模,是自动驾驶系统可以更好的控制车辆的前提。本文从整体驾驶员控制角度进行驾驶员建模,针对性的从横向纵向的干预过程进行说明,对于自动驾驶系统研发有比较重要的意义。