進階課程 丨Apollo控制技術詳解 控制理論

2022-11-24 21:41:44 字數 3627 閱讀 9510

控制模組根據**的軌跡和估計的車輛狀態向油門、剎車或轉向扭矩傳送適當的命令。控制模組使汽車儘可能接近計劃的軌跡。控制器引數可以通過最小化理想狀態和觀測狀態之間的誤差函式(偏差)來估計。

決策問題通常用pomdp加上一些機器學習的技術來解決。解決好規劃問題,需要把兩個方面做好,一個是資料閉環(data driven),另一個是基於規則的方法

上週阿波君為大家詳細介紹了「進階課程apollo規劃技術詳解——understand more on the mp difficulty」。詳細地講解了apollo em planner規劃框架,以及解決優化問題的常用方法:離散化的方式、expectation  maximization(期望最大化)

閱讀原文

以下,enjoy  

本次課主要介紹以下三個方面的內容:

首先我們回顧一下apollo自動駕駛框架的基本結構,如圖1所示。

▲圖1  apollo 軟體框架

從圖中可以看出,控制模組的輸入一方面來自planning(規劃模組),另一方面來自反饋階段資訊(如localization和hd map),此部分資訊包括車輛位置、朝向、速度等。

其輸出結果是控制指令,與下層模組canbus(車輛互動標準)進行互動;同時控制模組也會從底層車輛得到反饋訊號(車輛本身in vehicle reference frame:速度資訊、四輪轉速資訊、車輛健康狀況資訊、底盤是否報錯資訊、危險資訊)

如圖2所示,控制模組包括三個部分:預處理、控制器和後處理。其中,預處理部分的主要功能包括三方面,第一是對輸入訊號的檢查,對不正常訊號的過濾;第二是做一些緊急處理,第三是做一些濾波操作,例如訊號的平滑等。

▲圖2 控制模組的組成

控制器主要功能包括:模型建立、系統識別和分析,控制器/觀察器設計以及引數調優等功能,如圖3所示。

▲圖3 控制器的主要功能

後處理部分將訊號傳送給執行器,包括限制的處理以及訊號濾波,如圖4所示。因為油門、剎車、轉向這種執行器本身有上下限、滯後(回滯曲線),所以需要對訊號進行一些相關處理。

▲圖4 後處理

控制主要是為了彌補數學模型和物理世界執行之間的不一致性。對於自動駕駛而言,規劃的軌跡和車輛的實際執行軌跡並不完全一致,控制器按照規劃軌跡在條件允許下儘可能地調節車輛本身。為了能夠安全、舒適的行駛,自動駕駛系統對效能的要求需要控制模組,主要體現在以下幾個方面,如圖5所示。

▲圖5 自動駕駛系統對效能的要求

具體而言,自動駕駛系統是否滿足效能要求可以從三個角度去評測:時域、頻域以及discrete domain(離散域)。時域是指輸出在時間軸上應該滿足的要求。其衡量的指標包括steady state gain、rising time、setting time、overshoot和undershoot。每個指標對應的具體含義如圖6所示。

▲圖6 控制模組在時域上的效能要求

類似的,系統在頻域裡也需要滿足一定的要求。在頻域空間,x軸是輸入頻率,y軸是輸出跟輸入的比例,理想狀態下輸出和輸入比例應該為1。系統效能在頻域中的評價指標包括pass band、cutoff frequency等,如圖7所示。

▲圖7 頻域的評判指標

除了時域和頻域的要求,還需要滿足discrete domain的要求。

▲圖8 時域和頻域的相互關係

對系統來說,在time domain跟frequency domain中的系統需求是可以等價轉換的。系統在時域中的要求、響應、數學表達跟頻域是可以相互對應的。

此外,系統效能要求還有一些其它的考量指標,如圖9所示。

▲圖9 滿足系統效能要求的額外考量指標

前面介紹了自動駕駛系統需要滿足一些效能需求,如果沒有控制器的話,這些效能指標可能難以滿足,這就是為什麼在自動駕駛系統中需要引入控制器的原因。

那麼怎麼樣設計出好的控制模組呢?最簡單的控制器就是pid控制器,即比例、積分、微分控制,它是一個model free的控制方法,也就是說pid控制具有通用性。pid控制的基本原理如圖10所示。

▲圖10  pid 控制器

u是參考量,它和反饋訊號之間的差距用error表示,即圖中的e。比例控制p的意思是該控制量與誤差成比例,用kp*e(t)表示。當kp比較小的時候,接近終值的速度會非常慢,如右圖的紅線所示,但是它有超調與undershoot現象。當kp設定比較大時,則達到穩態速度變快,但會超調,如右圖紫色曲線所示。如果系統中存在損耗,比如汽車上坡的動力或者摩擦損耗,使得比例控制每次增加的控制量就等於或者小於損耗時,出現穩態誤差,這就是引入積分控制的目的,它可以將之前的誤差進行積分,消除穩態誤差。而微分控制的目的是使系統更快的從瞬態轉化為穩態。系統的控制量就是p+i+d三項的和。