2 回答

TA貢獻(xiàn)1869條經(jīng)驗(yàn) 獲得超4個(gè)贊
根據(jù)如何處理經(jīng)驗(yàn)、環(huán)境或者任何我們稱之為輸入的數(shù)據(jù),算法分為不同種類。機(jī)器學(xué)習(xí)和人工智能課本通常先考慮算法可以適應(yīng)的學(xué)習(xí)方式。
這里只討論幾個(gè)主要的學(xué)習(xí)風(fēng)格或?qū)W習(xí)模型,并且有幾個(gè)基本的例子。這種分類或者組織的方法很好,因?yàn)樗仁鼓闳ニ伎驾斎霐?shù)據(jù)的角色和模型準(zhǔn)備的過程,然后選擇一個(gè)最適合你的問題的算法,從而得到最佳的結(jié)果。
監(jiān)督學(xué)習(xí):輸入數(shù)據(jù)被稱為訓(xùn)練數(shù)據(jù),并且有已知的結(jié)果或被標(biāo)記。比如說一封郵件是否是垃圾郵件,或者說一段時(shí)間內(nèi)的股價(jià)。模型做出預(yù)測(cè),如果錯(cuò)了就會(huì)被修正,這個(gè)過程一直持續(xù)到對(duì)于訓(xùn)練數(shù)據(jù)它能夠達(dá)到一定的正確標(biāo)準(zhǔn)。問題例子包括分類和回歸問題,算法例子包括邏輯回歸和反向神經(jīng)網(wǎng)絡(luò)。
無監(jiān)督學(xué)習(xí):輸入數(shù)據(jù)沒有被標(biāo)記,也沒有確定的結(jié)果。模型對(duì)數(shù)據(jù)的結(jié)構(gòu)和數(shù)值進(jìn)行歸納。問題例子包括Association rule learning和聚類問題,算法例子包括 Apriori 算法和K-均值算法。
半監(jiān)督學(xué)習(xí):輸入數(shù)據(jù)是被標(biāo)記的和不被標(biāo)記的數(shù)據(jù)的混合,有一些預(yù)測(cè)問題但是模型也必須學(xué)習(xí)數(shù)據(jù)的結(jié)構(gòu)和組成。問題例子包括分類和回歸問題,算法例子基本上是無監(jiān)督學(xué)習(xí)算法的延伸。
增強(qiáng)學(xué)習(xí):輸入數(shù)據(jù)可以刺激模型并且使模型做出反應(yīng)。反饋不僅從監(jiān)督學(xué)習(xí)的學(xué)習(xí)過程中得到,還從環(huán)境中的獎(jiǎng)勵(lì)或懲罰中得到。問題例子是機(jī)器人控制,算法例子包括Q-learning以及Temporal difference learning。
當(dāng)整合數(shù)據(jù)模擬商業(yè)決策時(shí),大多數(shù)會(huì)用到監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的方法。當(dāng)下一個(gè)熱門話題是半監(jiān)督學(xué)習(xí),比如圖像分類問題,這中問題中有一個(gè)大的數(shù)據(jù)庫,但是只有一小部分圖片做了標(biāo)記。增強(qiáng)學(xué)習(xí)多半還是用在機(jī)器人控制和其他控制系統(tǒng)的開發(fā)上。
- 2 回答
- 0 關(guān)注
- 952 瀏覽
添加回答
舉報(bào)