1 回答

TA貢獻(xiàn)1833條經(jīng)驗(yàn) 獲得超4個(gè)贊
目前主流的數(shù)據(jù)庫或者NoSQL要么在CAP里面選擇AP,比較典型的例子是Cassandra,要么選擇CP比如HBase,這兩個(gè)是目前用得非
常多的NoSQL的實(shí)現(xiàn)。我們的價(jià)值觀一定認(rèn)為未來是分布式的,一定是盡量傾向于全部都擁有,大部分情況下取舍都是HA,主流的比較頂級(jí)的數(shù)據(jù)庫都會(huì)選擇
C,分布式系統(tǒng)一定逃不過P,所以A就只能選擇HA?,F(xiàn)在主要領(lǐng)域是數(shù)據(jù)庫的開發(fā),完全分布式,主要方向和谷歌的F1方向非常類似。
目前看NewSQL代表未來(Google Spanner、F1、FoundationDB),HBase在國內(nèi)有六個(gè)Committer,在目
前主流的開源數(shù)據(jù)庫里面幾乎是最強(qiáng)的陣容。大家選型的時(shí)候會(huì)有一個(gè)猶豫,到底應(yīng)該選擇HBase還是選Cassandra。根據(jù)應(yīng)用場景,如果需要一致
性,HBase一定是你最好的選擇,我推薦HBase。它始終保持強(qiáng)一致,我們非常喜歡一致性,喪失一致性的時(shí)候有些錯(cuò)誤會(huì)特別詭異,很難查。對(duì)于
Push-down特性的設(shè)計(jì)其實(shí)比較好,全局上是一個(gè)巨大的分布式數(shù)據(jù)庫,但是邏輯上是分成了一個(gè)個(gè)Region,Region在哪臺(tái)機(jī)器上是明確的。
比如要統(tǒng)計(jì)記錄的條數(shù),假設(shè)數(shù)據(jù)分布在整個(gè)系統(tǒng)里面,對(duì)數(shù)十億記錄做一個(gè)求和操作,就是說不同的機(jī)器上都要做一個(gè)sum,把條件告訴他要完成哪些任務(wù),他給你任務(wù)你再匯總,這是典型的分布式的 MPP,做加速的時(shí)候是非常有效的。
- 1 回答
- 0 關(guān)注
- 784 瀏覽
添加回答
舉報(bào)