? 快速且通用的集群計(jì)算平臺(tái)
? spark是快速的
○ Spark擴(kuò)充了流行的Mapreduce計(jì)算模型
○ Spark是基于內(nèi)存的計(jì)算
? spark是通用的
○ 容納了其他分布式系統(tǒng)擁有的功能:批處理、迭代式計(jì)算、交互查詢和流處理,方便維護(hù)
○ 優(yōu)點(diǎn):降低了維護(hù)成本
? spark是高度開放的
○ Spark提供了Python,Java,Scala,SQL的API和豐富的內(nèi)置庫(kù)。
○ Spark和其他的大數(shù)據(jù)工具整合的很好,包括hadoop,kafka等。
? spark是快速的
○ Spark擴(kuò)充了流行的Mapreduce計(jì)算模型
○ Spark是基于內(nèi)存的計(jì)算
? spark是通用的
○ 容納了其他分布式系統(tǒng)擁有的功能:批處理、迭代式計(jì)算、交互查詢和流處理,方便維護(hù)
○ 優(yōu)點(diǎn):降低了維護(hù)成本
? spark是高度開放的
○ Spark提供了Python,Java,Scala,SQL的API和豐富的內(nèi)置庫(kù)。
○ Spark和其他的大數(shù)據(jù)工具整合的很好,包括hadoop,kafka等。
2020-05-18
最新回答 / AnananananD
ssh是個(gè)網(wǎng)絡(luò)協(xié)議,用于遠(yuǎn)程控制。配置ssh免密防止啟動(dòng)集群的時(shí)候每次都要輸入密碼
2020-05-04
最贊回答 / 哎呀阿坨
老師講的那個(gè)500G文件分成5個(gè)文件是建立在文件在hdfs的基礎(chǔ)上的,使用hdfs的文件系統(tǒng)路徑,一次性拿文件全部?jī)?nèi)容
2019-11-24
最新回答 / 慕的地1117626
使用standalone mode啟動(dòng)spark:命令行輸入<...code...>參考https://uohzoaix.github.io/studies//2014/09/13/sparkRunning/
2019-08-01