
基于偽逆的反復(fù)學(xué)習(xí)控制(翻譯一)
13頁基于偽逆的反復(fù)學(xué)習(xí)控制學(xué)習(xí)控制是用于一固定時間間隔內(nèi)重復(fù)作用的跟蹤控制的有效方法本文給出一種反復(fù)學(xué)習(xí)控制算法,適用于一些具有擾動和初始誤差的非線性非最小相位對象該算法要求對一線性對象的近似轉(zhuǎn)換而非精確轉(zhuǎn)換這種方法的一個優(yōu)點是不需區(qū)分對象的輸出漸進(jìn)軌跡誤差的范圍通過一精確的試驗列出,并且可以看到其隨著擾動范圍持續(xù)的增大該控制器的結(jié)構(gòu)是這樣的,其低頻部分的軌跡匯合要比高頻部分快索引術(shù)語——反復(fù)學(xué)習(xí)控制,非線性跟蹤,偽逆I. 緒論反復(fù)學(xué)習(xí)控制用到了一類自調(diào)整控制器,其某一特定任務(wù)的系統(tǒng)性能在同一任務(wù)先前性能的基礎(chǔ)上逐漸改善和完美學(xué)習(xí)控制的最常見應(yīng)用是在工業(yè)生產(chǎn)的機(jī)器人控制領(lǐng)域,這里要求機(jī)器人執(zhí)行一個單一的任務(wù),比方說反復(fù)在一給定軌跡下取放物體單獨一個反饋控制器時,相同的軌跡誤差會一直在反復(fù)的試驗中存在相反,學(xué)習(xí)控制器可以利用前一次執(zhí)行信息來改進(jìn)下一次軌跡執(zhí)行的性能而在一些應(yīng)用中,多次重復(fù)一個軌跡的要求不利于學(xué)習(xí),所以我們將注意力集中在別的一些場合,那里來說學(xué)習(xí)控制是自然的解決方案本文中我們在[1]提出一種反復(fù)學(xué)習(xí)控制算法的修正以使其適用于帶有輸入擾動和輸出傳感噪聲的非線性非最小相位對象在章節(jié) 出一個在起始位置描述一偽逆線性裝置的學(xué)習(xí)控制器。
在章節(jié) 出仿真例子以展示所提學(xué)習(xí)控制器的性能最后,章節(jié) 全文總結(jié)有擾動的非線性非最小相位對象本節(jié)中,我們?yōu)榉蔷€性系統(tǒng)提出一個魯棒迭代學(xué)習(xí)算法我們僅考慮方(相同的輸入和輸出)時不變非線性系統(tǒng)A. 系統(tǒng)描述來考察一個在 x = 0 時起始近似穩(wěn)定(也就是說線性對象的所有特征根都在復(fù)平面的左半部分)而且輸入穩(wěn)定的非線性系統(tǒng)這里 i 為 迭代系數(shù), 是輸入順序集合, 及 ,方程 表示系統(tǒng)反復(fù)隨機(jī)的有界擾動;它可以是持續(xù)的,非可再生摩擦力,和狀態(tài)獨立的模型誤差等等 代表傳感器噪聲所期待的軌跡 維持在有限的時間域?qū)W習(xí)的目的是構(gòu)建一個輸入軌跡的順序 如 ,這樣 使系統(tǒng)在[0,T] 間“盡可能近的”跟蹤軌跡 我們做以下假設(shè):(程 是連續(xù)可微的,而 是連續(xù)的這里的 是 間的封閉子集統(tǒng)是第一漸進(jìn)穩(wěn)定和輸入狀態(tài)穩(wěn)定備注:如果系統(tǒng)不穩(wěn)定,可以運用我們的方法使其穩(wěn)定)動 和 分別由 制(也就是說, 且 ) 期待的軌跡 非常接近于軌跡 , 其滿足以下方程:針對該系統(tǒng),在圖 給出一個反復(fù)學(xué)習(xí)控制 1 所示的學(xué)習(xí)控制器的一個好的候選者可以這樣獲得,首先對對象進(jìn)行線性化,然后用一個偽逆的線性裝置作為學(xué)習(xí)控制器現(xiàn)代的反復(fù)學(xué)習(xí)控制法則由因式 P,線性對象 ,其伴隨矩陣 和時域 t∈[0,T]組成,也就是:注意到對所有的 i 如果 (注意在圖 1 中,減因子 放置在匯合點之前) 。
定義 : 由于非線性系統(tǒng)(1)是輸入狀態(tài)穩(wěn)定(且 是連續(xù)的( ,因此這樣定義一個因果關(guān)系的非線性輸入到輸出的映射P: 因為 P 是第一狀態(tài)漸近穩(wěn)定的(,我們定義一穩(wěn)定時不變的輸入到輸出線性因式 , 需要對系統(tǒng)(1)在內(nèi) 線 性 化 :圖 1, 非 線 性 學(xué) 習(xí) 控 制 系 統(tǒng) P: 非 線 性 對 象 , 學(xué) 習(xí) 控 制 器 , : 負(fù) 因 子這 里 , 因 此 , 由 于 且 A 為 赫 茲 【 在 ( 4) 中 】 , 我 們 可 以 用代 替 而 不 必 改 變 ( 4) 中 定 義 的 輸 入 輸 出 ( 映 射 , 因 此 得 到 的唯 一 映 射 是 1—1定 義 : 考 察 伴 隨 系 統(tǒng) 的 I—O 映 射由 于 A 是 赫 茲 , - 雙 曲 線 的 ( 也 就 是 , 所 有 的 特 征 值 都 沒 有 零 實 部 ), 從 而 ( 5) 式 定 義了 唯 一 的 無 關(guān) 聯(lián) 映 射 , 如 給 出 的 ( 參 見 附 錄 ) 伴 隨 系 統(tǒng) 滿 足 忽略較高階限制,我們可以在方程(1)的解 附 近 獲 得 一 個 線 性 對 象 :這 里 因 為 ( 4) 是 穩(wěn) 定 的 , 可以 根 據(jù) 李 亞 普 諾 夫 方 法 證 明 , 如 果 有 界 那 么 ( 6) 也 是 有 界 輸 入 輸 出 穩(wěn) 定 的 。
注 意 , 這 里我 們 也 可 以 用 代 替 ( 如 ( 4) 中 ) 而 且 沒 有 改 變 輸 入 輸 出 映 射 線 性 穩(wěn) 定 系 統(tǒng) ( 6) 有 解 并且 定 義 了 一 個 線 性 輸 入 輸 出 映 射 : 定 義 : 由 偽 逆 【 4】 的 觀 念 啟 發(fā) , 我 們 通 過 下 面 的 線 性 因 子 來 定 義 學(xué) 習(xí) 控 制 器 :因 為 , 我 們 把 “近 似 反 轉(zhuǎn) ”稱 為 的 α - 偽 逆 為 簡 單 起 見 , 下 文 把 α - 偽 逆 稱為 簡 單 偽 逆 在 時 域 下 用 ( 4) 和 ( 5) :因 為 是 穩(wěn) 定 的 , ( 8) 是 具 有 特 征 根 的 雙 曲 線 , 因 此 , 【 2】 中且 是 無 關(guān) 聯(lián) 的 在 ( 8) 中 解 , 我 們 可 以看 到 反 向 算 子 為 :上 面 系 統(tǒng) 的 特 征 根 α 的 連 續(xù) 函 數(shù) 在 極 限 為 雙 曲 線 的 ( 因 為 A 為 赫 茲 ) 從 而我 們 通 常 對 雙 曲 線 選 擇 一 個 α 系 統(tǒng) ( 9) 可 以 根 據(jù) 等 人 的 穩(wěn) 定 無 關(guān) 解 方 法 解 決 。
因 此 ,學(xué) 習(xí) 控 制 器 是 偽 逆 且 在 時 域 中 給 出 : 對 角 塊 , 因 此 特 征 根 是 ( 9) 和 的 特 征 根 由 于 是 α 雙 曲 線 的 , 因 此 雙 曲 線 從 而 , 及 (10)所 描 述的 線 性 控 制 器 的 解 可 以 利 用 穩(wěn) 定 無 關(guān) 解 [2]求 得 ( 使 用 時 而 不 是 時 的 初 始 條 件可 以 通 過 控 制 ) 因 此 跟 蹤 性 能 可 以 根 據(jù) 假 設(shè) 和得 到 改 善 C. 集 中 分 析定 義 1: 我 們 為 方 程 定 義 λ 標(biāo) 準(zhǔn) :注 意 意 味 著 和 是 等 價 的 標(biāo) 準(zhǔn) 集 中 結(jié)果 可 以 用 任 一 標(biāo) 準(zhǔn) 證 實 導(dǎo) 致 的 λ 標(biāo) 準(zhǔn) :定 義 的 傅 立 葉 變 換 條 件 1: ( 也 就 是 說 , 軸 上 沒 有 確 定 或 者 非 確 定 的 零 點 ) , 遵 循法 則 1: 如 果 假 設(shè) ( 和 條 件 1 滿 足 , 沒 有 擾 動 ( 即 且 ) 和 初 始 誤 差 () , 那 么 算 則 ( 3) 導(dǎo) 出 了 一 個 輸 入 順 序 , 輸 入 匯 合 于 。
如 果 , 及 初始 狀 態(tài) 誤 差 是 有 界 的 ( ) , 隨 著 , 匯 合 于 球的 半 徑 r 連 續(xù) 的 取 決 于 擾 動 , 和 初 始 誤 差 界 限 如 果 存 在 一 個 具 有的 , 那 么 將 匯 合 于 期 望 的 輸 入 解 驗證:驗證依賴于對輸入順序應(yīng)用不同的收縮映射定理[5]驗證的主要想法是在時 展 現(xiàn) 出 這 表 明 了 極 限 ,, 這 兒 為 擾 動 和 初 始 誤 差 界 限 的 連 續(xù) 因 子 通 過 以 下 定 義 構(gòu) 造 序 列: 為 簡 單 起 見 下 文 用 表 示 現(xiàn) 在 , 維 持 頁 尾 所 示 的 從 ( 3) 到 關(guān) 斷 器( 12) 的 線 性 在 [6]后 , 我 們 用 表 示 P 的 分 叉 , 也 即 滿 足在 式 ( 13) 中 , 這 樣 定 義 : 從 ( 13)式 , 我 們 可 以 發(fā) 現(xiàn) s 就 是 , 為 表 示 , 我 們 重 寫 ( 12) 如 下 :因為 是 ,這表明 ,如限制 和 :由假設(shè) :,從而 由(6) ,我們列寫:因此,利用三角不等式, 及 的限制,我們得到利用 等 式 ( 見 )。
用 乘 式 ( 15) , 定 義且 假 設(shè) , 我 們 得 到 :注 意 到 對 一 常 數(shù) , 在 上 較 大 值 , 我 們 有 :和(4)相似,可以證明:這里 為式(4)的輸入定義 :定義一線性因子 ,所以:根據(jù)式(6) ,因子 的輸出為: ,且由式(4)因子 的輸出為 這表明因此,利用式(16) , (17) ,及 的范圍,我們可以得到:列出壓縮映射:由式(12) ,我們可以得到下文頁底所示的方程從以下可看到,如果 滿足條件 1,當(dāng) ,那么 當(dāng) 選擇足夠小,可以使得 任意小令 且 ,( 傅立葉變換)如果條件 1 滿足,那么 ,這里 0重新考慮式(19) ,令,因此 注意到:因此,我們可以寫為, (利用式(19) ),當(dāng)隨著 的選擇,可以使得 任意小如果相應(yīng)于 的傳遞函數(shù)確實恰當(dāng),那么在 時,條件 1 無法滿足那么隨著1,而且,直觀地,輸入序列的高頻部分會緩慢的匯合在那種情況下,學(xué)習(xí)控制器得以以下方式加以修正:不是把 當(dāng)作學(xué)習(xí)因子,而是把 當(dāng)作修正后的學(xué)習(xí)控制器,這里 可以通過對 加入一個前饋期獲得因此,可以根據(jù)修正式(4)給出如下:這里 修正后的因子滿足條件 1 并且集總分析可以在 足夠小時以相同的方式進(jìn)行。
從式(19)代人限制條件 ,且將式(19)乘以 我們可以在 上取大列寫式(19)的 型如下:這里 為初始狀態(tài)誤差的標(biāo)準(zhǔn)范圍 和 分別為輸入及輸出擾動的標(biāo)準(zhǔn)范圍由于 ,當(dāng) 足夠小,我們可以發(fā)現(xiàn) ,這使得 因此,得到:這里 包括了控制器的初始狀態(tài)誤差和擾動的標(biāo)準(zhǔn)范圍因此,極限 ,即 ,如,這里 為收縮映射 的固定點,且 為半徑,球心為 的開球體如果沒有擾動和初始誤差, ,從而 匯合于如果 如 ,收縮映射 的固定點 表示為沒有 和初始誤差的如果 且 這表明學(xué)習(xí)控制器的輸出 為 0因此,收縮一旦得以證實,可以看出 (如前定義)也是從 空間( )的封閉子空間到其自身的映射因此, 為收縮映射為說明這個,來考察一期望軌跡 從式(2) ,因 , 在式(12)中,如果考慮 那么,由于(這里 ) , 是從 附近一封閉球到其自身的收縮映射注意, 附近球的尺寸必須足夠小這樣式(14)也得到滿足因此,如果初始軌跡位于 附近, 對所有的 從其附近到其本身構(gòu)成映射不失一般性,我們考慮另一對 及 (如(2)所給) 從連續(xù)性來說,盡管 充分接近 , 也從其附近到其本身構(gòu)成映射這便是 的動機(jī)仿真結(jié)果具有輸入擾動的仿真結(jié)果本節(jié)中,我們展示一個單輸入單輸出非線性非最小相位對象 P 的仿真研究,其起始漸進(jìn)穩(wěn)定,輸入狀態(tài)穩(wěn)定,具有以下描述的輸入擾動:首先,我們考慮沒有輸出擾動 。
這樣給出參考輸出軌跡:0, 其他通過線性化系統(tǒng)(21)這樣定義 :由于線性控制器是非穩(wěn)定的,我們應(yīng)用穩(wěn)定無關(guān)解方式[2]我們引入 作為有界的輸入擾動 通常為限制于 間的隨機(jī)數(shù) 仿真[圖 2(a)和(b)] 展示了兩個反復(fù)后期望輸出的近似完美的跟蹤注意高頻部分緩慢匯合所引起的余差具有輸入輸出擾動的仿真結(jié)果現(xiàn)在,我們引入 作為(21)所給的相同非線性系統(tǒng)的隨機(jī)有界輸出擾動同時存在先前引入的輸入擾動 仿真圖[圖 3]展示了三次反復(fù)后期望輸出軌跡的良好跟蹤A. 討論這里的 案比[1]中給出的多了一些優(yōu)點在[1]中,線性對象的逆 被當(dāng)做學(xué)習(xí)因子這使得用輸出的分叉顛倒系統(tǒng)成為必要實際上,在具有輸出傳感噪聲時分叉無法可靠的計算進(jìn)一步說,對象本。
