启动Hive
启动hive
2.建表
建表
3.导入数据
导入数据
4.查询:
查看wordcount 表
至此,数据导入完成。我原先以为做单词统计,这一张表就可以,但是我发现非常的困难,到这个地步就不能在用Hadoop里的MR来思维了,应该用RMDS的思维来解决这个问题,所以我又新建了一张表,叫words,用来存储分割字符串后的单词。
6.新建words表
建表
7对words表进行格式上的处理执行下列语句
insert overwrite table wordsselect explode(split(word,'[ \t]+')) wordfrom wordcount; explode是hive的函数,在以后的深入学会了解到。
对表行一个处理,即遇到一个“\t”自动切分
words表中的格式
8.使用HQL语句查询words表
select word ,count(*) from words group by word
作者:起个什么呢称呢
链接:https://www.jianshu.com/p/6407088212e5
點(diǎn)擊查看更多內(nèi)容
為 TA 點(diǎn)贊
評(píng)論
評(píng)論
共同學(xué)習(xí),寫下你的評(píng)論
評(píng)論加載中...
作者其他優(yōu)質(zhì)文章
正在加載中
感謝您的支持,我會(huì)繼續(xù)努力的~
掃碼打賞,你說多少就多少
贊賞金額會(huì)直接到老師賬戶
支付方式
打開微信掃一掃,即可進(jìn)行掃碼打賞哦