內容簡介
本書對增強學習與近似動態規劃的理論、演算法及應用進行了深入研究
和論述。主要內容包括:求解Markov鏈學習預測問題的時域差值學習算
法和理論,求解連續空間Markov決策問題的梯度增強學習演算法以及進化一
梯度混合增強學習演算法,基於核的近似動態規劃演算法,增強學習在移動機器
人導航與控制中的應用等。本書是作者在多個國家自然科學基金專案資助
下取得的研究成果的總結,意在推動增強學習與近似動態規劃理論與應用
的發展,對於智慧科學的前沿研究和智慧學習系統的應用具有重要的科學
意義。
本書可作為高等院校與科研院所中從事人工智慧與智慧資訊處理、機
器人與智慧控制、智慧決策支援系統等專業領域的研究和教學用書,也可作
為自動化、電腦與管理學領域其他相關專業師生及科研人員的參考書。
商品資料
出版社:科學出版社出版日期:2010-05-01ISBN/ISSN:9787030275653 語言:簡體中文For input string: ""
裝訂方式:平裝頁數:211頁
購物須知
退換貨說明:
會員均享有10天的商品猶豫期(含例假日)。若您欲辦理退換貨,請於取得該商品10日內寄回。
辦理退換貨時,請保持商品全新狀態與完整包裝(商品本身、贈品、贈票、附件、內外包裝、保證書、隨貨文件等)一併寄回。若退回商品無法回復原狀者,可能影響退換貨權利之行使或須負擔部分費用。
訂購本商品前請務必詳閱退換貨原則。