業(yè)務(wù)有數(shù)據(jù) 主鍵 列 頻度 h -> hi 1 h -> hey 5 h -> hello 10 ... ... 1、如何設(shè)計(jì)表,可以存如上的數(shù)據(jù),hbase中key如果重復(fù)插入的話,就會(huì)被新的記錄覆蓋掉。 2、存以上數(shù)據(jù)后,讀取表的時(shí)候需要按照頻度字段倒序排,取前5條記錄。就是求頻度最大的前5條查詢(xún)?yōu)?h 的值列 (hi, hey,hello等)。 求方案,先謝了!
1 回答
紫衣仙女
TA貢獻(xiàn)1839條經(jīng)驗(yàn) 獲得超15個(gè)贊
主鍵設(shè)計(jì)成:現(xiàn)有的主鍵+頻度+列,即h+1+hi,但是最好將每個(gè)都格式化成定長(zhǎng)的字符串,當(dāng)你需要取前5個(gè)記錄時(shí)使用過(guò)濾器取出前5條記錄即可。大體如此,具體細(xì)節(jié)可能還需要好好設(shè)計(jì)
- 1 回答
- 0 關(guān)注
- 128 瀏覽
添加回答
舉報(bào)
0/150
提交
取消
