西安建筑科技大學(xué) 信息與控制工程學(xué)院
TU995;TP273
“十三五”國家重點(diǎn)研發(fā)計劃(編號:2017YFC0704207)資助 ]自適應學(xué)習率方法。訓練出當前狀態(tài)下最優(yōu)的PID增益后,根據式(2)~式(7)計算出控制量,在控制量作用后再觀(guān)察新?tīng)顟B(tài)下的流量和室溫,比較前后時(shí)刻狀態(tài)獲得獎勵,并繼續進(jìn)行訓練學(xué)習,不斷通過(guò)觀(guān)察狀態(tài)訓練Q表,得出每個(gè)狀態(tài)下的PID增益以控制閥門(mén)開(kāi)度改變環(huán)境狀態(tài)。故結合Q學(xué)習PID控制算法的偽代碼如算法2所示
段中興,趙莎,馬祥雙.基于Q學(xué)習的供熱末端自適應PID控制算法計算機測量與控制[J].,2020,28(6):80-85.
復制