3 回答

TA貢獻(xiàn)94條經(jīng)驗(yàn) 獲得超2個(gè)贊
Java程序員轉(zhuǎn)大數(shù)據(jù)工程師的學(xué)習(xí)路線圖:
第一步:分布式計(jì)算框架
掌握hadoop和spark分布式計(jì)算框架,了解文件系統(tǒng)、消息隊(duì)列和Nosql數(shù)據(jù)庫,學(xué)習(xí)相關(guān)組件如hadoop、MR、spark、hive、hbase、redies、kafka等;
第二步:算法和工具
學(xué)習(xí)了解各種數(shù)據(jù)挖掘算法,如分類、聚類、關(guān)聯(lián)規(guī)則、回歸、決策樹、神經(jīng)網(wǎng)絡(luò)等,熟練掌握一門數(shù)據(jù)挖掘編程工具:Python或者Scala。目前主流平臺(tái)和框架已經(jīng)提供了算法庫,如hadoop上的Mahout和spark上的Mllib,你也可以從學(xué)習(xí)這些接口和腳本語言開始學(xué)習(xí)這些算法。
第三步:數(shù)學(xué)
補(bǔ)充數(shù)學(xué)知識(shí):高數(shù)、概率論和線代
第四步:項(xiàng)目實(shí)踐
1)開源項(xiàng)目:tensorflow:Google的開源庫,已經(jīng)有40000多個(gè)star,非常驚人,支持移動(dòng)設(shè)備;
2)參加數(shù)據(jù)競(jìng)賽
3)通過企業(yè)實(shí)習(xí)獲取項(xiàng)目經(jīng)驗(yàn)
如果你僅僅是做大數(shù)據(jù)開發(fā)和運(yùn)維,則可以跳過第二步和第三步,如果你是側(cè)重于應(yīng)用已有算法進(jìn)行數(shù)據(jù)挖掘,那么第三步也可以先跳過。
- 3 回答
- 0 關(guān)注
- 2106 瀏覽
添加回答
舉報(bào)