第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

各位可以推薦一些強(qiáng)化學(xué)習(xí)入門的資料么?

各位可以推薦一些強(qiáng)化學(xué)習(xí)入門的資料么?

各位可以推薦一些強(qiáng)化學(xué)習(xí)入門的資料么?本人渣渣小碩一枚?
查看完整描述

2 回答

?
紅糖糍粑

TA貢獻(xiàn)1815條經(jīng)驗(yàn) 獲得超6個(gè)贊

圖書

Reinforcement Learning: An Introduction

Sutton的良心巨制,最近也出了第二版。致力于長(zhǎng)期從事RL研究的同志們一定要去拜讀一下。


馮超 | 強(qiáng)化學(xué)習(xí)精要

知乎大神馮超的新書,在圖書館偶然看到就讀了一下,涵蓋的面挺廣的,從實(shí)現(xiàn)到原理都有細(xì)致的討論。


課程

UCB CS294

我不太愛看課程視頻來(lái)學(xué)東西,感覺來(lái)的比較慢,而且太大而全了也不太消化的了。但有一個(gè)系統(tǒng)性的認(rèn)識(shí)是很有必要的,而且UCB CS294這個(gè)課非常前沿,有時(shí)間的話非常推薦去看,沒時(shí)間看看他們課程的Slides也大有脾益。


快速入門

強(qiáng)化學(xué)習(xí)從入門到放棄的資料

先擺上一份大神的集錦,也是一份總結(jié),相比我這個(gè)更全,很多資料也是從那里看到的。


南京大學(xué)俞揚(yáng)老師強(qiáng)化學(xué)習(xí)介紹

俞揚(yáng)老師是周志華老師(西瓜書的作者)的高徒,從事強(qiáng)化學(xué)習(xí)的研究也有七八年了,做了很多非常扎實(shí)的研究。這里列了他做一些會(huì)議報(bào)告的Slides,邏輯清楚、舉例得當(dāng),適合短時(shí)間內(nèi)對(duì)RL有一個(gè)整體的了解。


知乎專欄 | 無(wú)痛的機(jī)器學(xué)習(xí)

上面提到的馮超寫的一系列文章,雖然主題是機(jī)器學(xué)習(xí),但也花了很大的篇幅在討論RL。里面一些文章也寫進(jìn)了他的新書里。


知乎專欄 | 強(qiáng)化學(xué)習(xí)知識(shí)大講堂

這個(gè)專欄我一直在關(guān)注,里面有很多非常好的文章,比如Actor-Critic算法小結(jié),對(duì)AC方法做了非常細(xì)致的總結(jié)。更多寶藏大家可以自己去挖掘。


莫煩python | 強(qiáng)化學(xué)習(xí)

莫煩大神的博客非常推薦,對(duì)很多問(wèn)題都有直觀的解釋,而且都有詳細(xì)的代碼實(shí)現(xiàn)和講解。上面的只給了他RL部分的博客,在他Pytorch的博客里也有一部分Pytorch對(duì)RL算法的實(shí)現(xiàn)。


Pytorch Tutorials | Reinforcement Learning (DQN) Tutorial

個(gè)人非常喜歡Pytorch,因此經(jīng)常逛Pytorch的官網(wǎng)。Pytorch也會(huì)把一些國(guó)外大牛的文章放在自己的教程里,更關(guān)系實(shí)現(xiàn)細(xì)節(jié)的同學(xué)們可以去學(xué)習(xí)一下。


OpenAI Spinning Up

前段時(shí)間OpenAI放出的大殺器,旨在幫助新手迅速上手RL。非常不錯(cuò)的資料,里面甚至還列舉了RL各個(gè)方向上的一些經(jīng)典Paper。



查看完整回答
反對(duì) 回復(fù) 2019-06-12
  • 2 回答
  • 0 關(guān)注
  • 1314 瀏覽

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)