Hadoop 2.x配置及簡(jiǎn)單MapReduce案例
標(biāo)簽:
大數(shù)據(jù)
去官网下载压缩包
配置jdk(hadoop运行在java环境上)
Hadoop 2.x基本配置及运行MapReduce案例在本地模式下
在hadoop文件下
mkdir input cp etc/hadoop/*.xml input/ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'cat output/part-r-00000 ##小案例mkdir wcinput cd wcinput/ touch wc.input vi wc.input hadoop mapreduce hadoop hdfs yaen nodemanger hadoop resourcemanager bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar woedcount wcinput wcoutputeduce-examples-2.5.0.jar wordcount wcinput wcoutput12345678910111213141516
配置部署启动HDFS及本地模式运行MapReduce案例(使用HDFS上数据)
修改主机名:
vi /etc/sysconfig/network vi /etc/hosts /etc/rc.d/init.d/network restart123
修改/opt/modules/hadoop-2.5.0/etc/hadoop/core-site.xml
修改/opt/modules/hadoop-2.5.0/etc/hadoop/hdfs-site.xml
格式化hdfs
bin/hdfs namenode -format1
启动主节点
sbin/hadoop-daemon.sh start namenode1
启动从节点
sbin/hadoop-daemon.sh start datanode1
查看hadoop控制台
新增hdfs文件
bin/hdfs dfs -mkdir -p /user/beifeng/1
查询hdfs文件
bin/hdfs dfs -ls -R /1
hdfs上传文件
bin/hdfs dfs -put wcinput/wc.input /user/beifeng/mapreduce/wordcount/input/1
运行MapReduce程序
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar woedcount /user/beifeng/mapreduce/wordcount/input/ /user/beifeng/mapreduce/wordcount/output1
查看运行结果
bin/hdfs dfs -cat /user/beifeng/mapreduce/wordcount/output/part*1
配置部署启动YARN及在YARN上运行MapReduce程序
配置yarn-site.xml
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.resourcemanager.hostname</name> <value>min</value> </property></configuration>12345678910111213
配置slaves
vi etc/hadoop/slaves min123
启动:
sbin/yarn-daemon.sh start resourcemanager sbin/yarn-daemon.sh start nodemanager12
访问:
配置mapred-env.sh
vi etc/hadoop/mapred-env.sh ##修改jdk配置路径export JAVA_HOME=/usr/java/jdk1.8.0_11123
历史任务服务器启动
sbin/mr-jobhistory-daemon.sh start historyserver1
YARN的日志聚集功能配置使用
日志聚集功能配置
停止resourcemanager
sbin/yarn-daemon.sh stop resourcemanager1
停止noderesourcemanager
sbin/yarn-daemon.sh stop nodemanager1
停止历史任务服务器
sbin//mr-jobhistory-daemon.sh stop historyserver1
启动resourcemanager、resourcemanager、历史任务服务器
查看log日志
配置HDFS垃圾回收
vi etc/hadoop/core-site.xml 1
Hadoop 2.x组件启动的三种方式及配置SSH无密码登录
不建议用下面这种
配置SSH无密码登录
cd cd .ssh ssh-keygen -t rsa ssh-copy-id min1234
配置namenode第二个节点
vi etc/hadoop/hdfs-site.xml1
配置历史服务器
vi etc/hadoop/mapred-site.xml1
點(diǎn)擊查看更多內(nèi)容
為 TA 點(diǎn)贊
評(píng)論
評(píng)論
共同學(xué)習(xí),寫(xiě)下你的評(píng)論
評(píng)論加載中...
作者其他優(yōu)質(zhì)文章
正在加載中
感謝您的支持,我會(huì)繼續(xù)努力的~
掃碼打賞,你說(shuō)多少就多少
贊賞金額會(huì)直接到老師賬戶(hù)
支付方式
打開(kāi)微信掃一掃,即可進(jìn)行掃碼打賞哦
今天注冊(cè)有機(jī)會(huì)得
100積分直接送
付費(fèi)專(zhuān)欄免費(fèi)學(xué)
大額優(yōu)惠券免費(fèi)領(lǐng)