關(guān)于扮演Snake的神經(jīng)網(wǎng)絡(luò)的澄清我是神經(jīng)網(wǎng)絡(luò)/機(jī)器學(xué)習(xí)/遺傳算法的新手,對于我的第一次實現(xiàn),我正在寫一個學(xué)會玩蛇的網(wǎng)絡(luò)(以前你沒有玩過它的例子)我有幾個問題我不喜歡完全明白:在我提出問題之前,我只想確保正確理解一般的想法。有一群蛇,每一條都有隨機(jī)產(chǎn)生的DNA。DNA是神經(jīng)網(wǎng)絡(luò)中使用的權(quán)重。每次蛇移動時,它都會使用神經(jīng)網(wǎng)絡(luò)決定去哪里(使用偏差)。當(dāng)人口死亡時,選擇一些父母(可能是最高適應(yīng)度),并以輕微的突變機(jī)會交叉他們的DNA。1)如果給整個電路板作為輸入(大約400個點)足夠的隱藏層(不知道有多少,可能是256-64-32-2?),并且有足夠的時間,它是否會學(xué)會不打包?2)什么是好的投入?以下是我的一些想法:400個輸入,一個用于電路板上的每個空間。如果蛇應(yīng)該去那里(蘋果)是正面的,如果它是墻/你的身體則是負(fù)面的。越接近-1/1,它就越接近。6個輸入:游戲?qū)挾?,游戲高度,蛇x,蛇y,蘋果x和蘋果y(如果按照這種方式訓(xùn)練,可以學(xué)習(xí)在不同尺寸的板上玩,但不知道如何輸入它的身體,因為它改變了大?。┙o它一個視野(可能在頭前3x3平方),可以警告蛇的墻壁,蘋果或它的身體。(不幸的是,蛇只能在前面看到什么,這可能會妨礙它的學(xué)習(xí)能力)3)給定輸入法,隱藏圖層大小的起點是什么(當(dāng)然計劃調(diào)整這個,只是不知道什么是好的起點)4)最后,蛇的健身。除了獲得蘋果的時間,它的長度,它的壽命,還有其他因素嗎?為了讓蛇學(xué)會不阻擋自己,還有什么我可以添加到健身幫助嗎?謝謝!
關(guān)于扮演Snake的神經(jīng)網(wǎng)絡(luò)的澄清
楊__羊羊
2019-08-28 15:08:14