簡(jiǎn)介:大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),越來(lái)越多的行業(yè)面臨著大量數(shù)據(jù)需要存儲(chǔ)以及分析的挑戰(zhàn)。Hadoop,作為一個(gè)開(kāi)源的分布式并行處理平臺(tái),以其高擴(kuò)展、高效率、高可靠等優(yōu)點(diǎn),得到越來(lái)越廣泛的應(yīng)用。本課旨在培養(yǎng)學(xué)員理解Hadoop的架構(gòu)設(shè)計(jì)以及掌握Hadoop的運(yùn)用能力。
第1章 初識(shí)Hadoop
本章講述課程大綱,授課內(nèi)容,授課目標(biāo)、預(yù)備知識(shí)等等,介紹Hadoop的前世今生,功能與優(yōu)勢(shì)
第2章 Hadoop安裝
本章通過(guò)案例的方式,介紹Hadoop的安裝過(guò)程,以及如何管理和配置Hadoop
第3章 Hadoop的核心-HDFS簡(jiǎn)介
本章重點(diǎn)講解Hadoop的組成部分HDFS的體系結(jié)構(gòu)、讀寫(xiě)流程,系統(tǒng)特點(diǎn)和HDFS的使用。
第4章 Hadoop的核心-MapReduce原理與實(shí)現(xiàn)
本章介紹MapReduce的原理,MapReduce的運(yùn)行流程,最后介紹一個(gè)經(jīng)典的示例WordCount
第5章 開(kāi)發(fā)Hadoop應(yīng)用程序
本章介紹在Hadoop下開(kāi)發(fā)應(yīng)用程序,涉及多個(gè)典型應(yīng)用,包括數(shù)據(jù)去重,數(shù)據(jù)排序和字符串查找。