2 回答

TA貢獻(xiàn)1815條經(jīng)驗(yàn) 獲得超6個(gè)贊
圖書
Reinforcement Learning: An Introduction
Sutton的良心巨制,最近也出了第二版。致力于長(zhǎng)期從事RL研究的同志們一定要去拜讀一下。
馮超 | 強(qiáng)化學(xué)習(xí)精要
知乎大神馮超的新書,在圖書館偶然看到就讀了一下,涵蓋的面挺廣的,從實(shí)現(xiàn)到原理都有細(xì)致的討論。
課程
UCB CS294
我不太愛看課程視頻來(lái)學(xué)東西,感覺來(lái)的比較慢,而且太大而全了也不太消化的了。但有一個(gè)系統(tǒng)性的認(rèn)識(shí)是很有必要的,而且UCB CS294這個(gè)課非常前沿,有時(shí)間的話非常推薦去看,沒時(shí)間看看他們課程的Slides也大有脾益。
快速入門
強(qiáng)化學(xué)習(xí)從入門到放棄的資料
先擺上一份大神的集錦,也是一份總結(jié),相比我這個(gè)更全,很多資料也是從那里看到的。
南京大學(xué)俞揚(yáng)老師強(qiáng)化學(xué)習(xí)介紹
俞揚(yáng)老師是周志華老師(西瓜書的作者)的高徒,從事強(qiáng)化學(xué)習(xí)的研究也有七八年了,做了很多非常扎實(shí)的研究。這里列了他做一些會(huì)議報(bào)告的Slides,邏輯清楚、舉例得當(dāng),適合短時(shí)間內(nèi)對(duì)RL有一個(gè)整體的了解。
知乎專欄 | 無(wú)痛的機(jī)器學(xué)習(xí)
上面提到的馮超寫的一系列文章,雖然主題是機(jī)器學(xué)習(xí),但也花了很大的篇幅在討論RL。里面一些文章也寫進(jìn)了他的新書里。
知乎專欄 | 強(qiáng)化學(xué)習(xí)知識(shí)大講堂
這個(gè)專欄我一直在關(guān)注,里面有很多非常好的文章,比如Actor-Critic算法小結(jié),對(duì)AC方法做了非常細(xì)致的總結(jié)。更多寶藏大家可以自己去挖掘。
莫煩python | 強(qiáng)化學(xué)習(xí)
莫煩大神的博客非常推薦,對(duì)很多問(wèn)題都有直觀的解釋,而且都有詳細(xì)的代碼實(shí)現(xiàn)和講解。上面的只給了他RL部分的博客,在他Pytorch的博客里也有一部分Pytorch對(duì)RL算法的實(shí)現(xiàn)。
Pytorch Tutorials | Reinforcement Learning (DQN) Tutorial
個(gè)人非常喜歡Pytorch,因此經(jīng)常逛Pytorch的官網(wǎng)。Pytorch也會(huì)把一些國(guó)外大牛的文章放在自己的教程里,更關(guān)系實(shí)現(xiàn)細(xì)節(jié)的同學(xué)們可以去學(xué)習(xí)一下。
OpenAI Spinning Up
前段時(shí)間OpenAI放出的大殺器,旨在幫助新手迅速上手RL。非常不錯(cuò)的資料,里面甚至還列舉了RL各個(gè)方向上的一些經(jīng)典Paper。
- 2 回答
- 0 關(guān)注
- 1314 瀏覽
添加回答
舉報(bào)