3 回答

TA貢獻(xiàn)1796條經(jīng)驗(yàn) 獲得超4個(gè)贊
在平臺(tái)方面,hadoop環(huán)境需要搭建在linux服務(wù)器上,首先需要了解Linux的基礎(chǔ)知識與命令;
開發(fā)方面,hadoop首先是個(gè)提供大數(shù)據(jù)存儲(chǔ)的平臺(tái),因此我們要使用其存儲(chǔ)功能,因此需要掌握其數(shù)據(jù)操作的api(scala api 或者 java api);其次是hadoop是大數(shù)據(jù)分析的數(shù)據(jù)源,熟悉對大數(shù)據(jù)的 分析/使用 方法(spark/map-reduce技術(shù),都有scala 和 java兩種api)。
因此,學(xué)習(xí)hadoop必須掌握scala或者java中的一門開發(fā)語言,然后在學(xué)習(xí)hadoop數(shù)據(jù)操作命令,api,spark/map-reduce分析技術(shù)。
另外,還可以學(xué)習(xí)hbase這種基于hdfs的結(jié)構(gòu)化大數(shù)據(jù)存儲(chǔ)技術(shù),和flume大數(shù)據(jù)采集技術(shù)。

TA貢獻(xiàn)1799條經(jīng)驗(yàn) 獲得超6個(gè)贊
1.大數(shù)據(jù)支持很多開發(fā)語言,但企業(yè)用的最多的還是java,所以并不是完全需要,有其它語言基礎(chǔ)也可以,同時(shí)hadoop是由java編寫的,要想深入學(xué)習(xí),學(xué)習(xí)java是有必要的。
2.于此,hadoop一般在工業(yè)環(huán)境大部分是運(yùn)行在linux環(huán)境下,hadoop是用java實(shí)現(xiàn)的。所以最好是熟悉linux環(huán)境下編程。至于java做到看得懂比較好,遇到問題可以看看源碼從而找出問題在哪。所以如果你想操作hadoop的話,需要java知識:比如IO流,JDBC之類,更是要重點(diǎn)掌握。
3.其實(shí),如果要進(jìn)行Hadoop開發(fā)領(lǐng)域,那么編碼知識是必須的。沒有java 或python的知識,你不能成為hadoop開發(fā)人員的主人。所以,這完全取決于具體方面。
但是,在所有方面都是必須的,這是基本知識和基礎(chǔ)知識。一般建議在選擇任何方面的第一個(gè)主題之前,如果有Java和Python的知識,那么這是一個(gè)額外的優(yōu)勢。如果想掌握大數(shù)據(jù),那么首先要了解一下為什么應(yīng)該學(xué)習(xí)大數(shù)據(jù),為什么大數(shù)據(jù)出現(xiàn)在哪里,大數(shù)據(jù)等等。如今,每個(gè)人都在學(xué)習(xí)hadoop,所以如果想在hadoop開始你的職業(yè)生涯,那么需要了解什么是大數(shù)據(jù)。很多人在理解大數(shù)據(jù)時(shí)往往會(huì)盲目地認(rèn)為處理大量數(shù)據(jù)就是大數(shù)據(jù),稍懂一些的人往往認(rèn)為學(xué)習(xí)大數(shù)據(jù)就是學(xué)習(xí)hadoop。
添加回答
舉報(bào)