第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

<kbd id="hxipf"></kbd><blockquote id="hxipf"><tbody id="hxipf"></tbody></blockquote>

已解決430363個(gè)問(wèn)題，去搜搜看，總會(huì)有你想問(wèn)的

大數(shù)據(jù)怎么樣判斷數(shù)據(jù)唯一性效率高？

首頁(yè) 猿問(wèn) 大數(shù)據(jù)怎么樣判斷數(shù)據(jù)唯一性效率高？

大數(shù)據(jù)怎么樣判斷數(shù)據(jù)唯一性效率高？

大數(shù)據(jù)

吃雞游戲 2018-07-30 17:33:14

我想用python對(duì)全網(wǎng)的網(wǎng)站進(jìn)行掃描記錄，想用mysql建個(gè)表記錄每個(gè)網(wǎng)站的信息，數(shù)據(jù)量大后怎么能快速的判斷這個(gè)網(wǎng)站已經(jīng)記錄過(guò)呢？基本表結(jié)構(gòu)有：id,url,name,datetime等相關(guān)字段，url想有唯一性，是拿到url查詢一下判斷沒(méi)有數(shù)據(jù)再插入還是怎么辦？如果做了唯一性索引直接插入時(shí)會(huì)報(bào)錯(cuò)，謝謝，或是有沒(méi)有別的有效的解決辦法？

查看完整描述

3 回答

慕俠2389804

TA貢獻(xiàn)1719條經(jīng)驗(yàn) 獲得超6個(gè)贊

推薦使用Bloom Filter存儲(chǔ)已經(jīng)抓取到的url.
Bloom Filter實(shí)際上是由一組哈希函數(shù)和一個(gè)字節(jié)列表組成.?

如果使用Python可直接安裝Pybloom包, 這里已經(jīng)實(shí)現(xiàn)了Bloom Filter.

反對(duì) 回復(fù) 2018-08-02

狐的傳說(shuō)

TA貢獻(xiàn)1804條經(jīng)驗(yàn) 獲得超3個(gè)贊

對(duì)url進(jìn)行hash，就是微博短域名一樣，然后用kv，mysql都行

反對(duì) 回復(fù) 2018-08-02

蕭十郎

TA貢獻(xiàn)1815條經(jīng)驗(yàn) 獲得超13個(gè)贊

分布式kv數(shù)據(jù)庫(kù)
對(duì)url分組

反對(duì) 回復(fù) 2018-08-02

3 回答
0 關(guān)注
1194 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

<blockquote id="oppwo"><mark id="oppwo"></mark></blockquote>