當前位置:知知館 >

生活百科

> 強化學習同一個學習率的圖一樣嗎

強化學習同一個學習率的圖一樣嗎

強化學習同一個學習率的圖一樣嗎

強化學習同一個學習率的圖不一樣。監督學習要求訓練集和測試集數據分佈越相近越好,但是包含的數據不一樣,不能把分類任務中的一張圖片,同時放到訓練集和測試集中,因為實際情況中可能出現訓練集不包含的圖片,這時要保證監督學習算法具有一定的泛化能力,能夠在沒見過這張圖片的情況下,對其正確處理。強化學習的目的是優化馬爾科夫決策過程中的智能體的策略,每次學習是專門針對一個任務進行的。因此,不能讓強化學習優化好一個走迷宮的任務,然後拿學習好的策略去幹其他事,哪怕是讓訓練好的智能體走一個佈局稍有變化的迷宮,效果也會下降。

標籤: 學習 強化
  • 文章版權屬於文章作者所有,轉載請註明 https://zhizhiguan.com/zh-mo/shbk/6oljlq.html