具體問題是這樣的:某個網(wǎng)站,uid和注冊時間是正相關(guān)且單調(diào),比如uid[1001-1100]是2016年6月6日注冊的,uid[1101-1200]是2016年6月7日注冊的。示例如果已知uid1000對應(yīng)2016.6.5,uid1001和1100對應(yīng)2016.6.6,uid1101對應(yīng)2016.6.7,那么可以判定uid1001到1100都對應(yīng)2016.6.6想要獲取某個uid的注冊時間,只能爬取一次https://domain.com/user/:uid我現(xiàn)在想獲取每個uid對應(yīng)的注冊時間,那么要怎樣設(shè)計uid生成策略,才能使得爬取的次數(shù)盡量少呢?假設(shè)總共經(jīng)過了1000天,每天平均有100個新用戶注冊(具體數(shù)量完全隨機),爬取次數(shù)大概能減少到哪個數(shù)量級?
如何使用最少的請求實現(xiàn)兩列相關(guān)數(shù)據(jù)的一一對應(yīng)?
皈依舞
2019-05-07 08:49:41