sparksql 表定義 存儲(chǔ)在哪
sparksql 表定義 存儲(chǔ)在哪
慕虎7371278
2018-11-05 05:04:19
TA貢獻(xiàn)1860條經(jīng)驗(yàn) 獲得超8個(gè)贊
Spark SQL是支持在Spark中使用Sql、HiveSql、Scala中的關(guān)系型查詢表達(dá)式。它的核心組件是一個(gè)新增的RDD類型SchemaRDD,它把行對(duì)象用一個(gè)Schema來描述行里面的所有列的數(shù)據(jù)類型,它就像是關(guān)系型數(shù)據(jù)庫里面的一張表。它可以從原有的RDD創(chuàng)建,也可以是Parquet文件,最重要的是它可以支持用HiveQL從hive里面讀取數(shù)據(jù)。
下面是一些案例,可以在Spark shell當(dāng)中運(yùn)行。
首先我們要?jiǎng)?chuàng)建一個(gè)熟悉的Context,熟悉spark的人都知道吧,有了Context我們才可以進(jìn)行各種操作。
舉報(bào)