我想用python對全網(wǎng)的網(wǎng)站進行掃描記錄,想用mysql建個表記錄每個網(wǎng)站的信息,數(shù)據(jù)量大后怎么能快速的判斷這個網(wǎng)站已經(jīng)記錄過呢?基本表結構有:id,url,name,datetime等相關字段,url想有唯一性,是拿到url查詢一下判斷沒有數(shù)據(jù)再插入還是怎么辦?如果做了唯一性索引直接插入時會報錯,謝謝,或是有沒有別的有效的解決辦法?
大數(shù)據(jù)怎么樣判斷數(shù)據(jù)唯一性效率高?
吃雞游戲
2018-07-30 17:33:14