話說同志們在爬取數(shù)據(jù)的時候如何保存已經(jīng)訪問過的url和隊列?對于爬取過的url,我使用redis的set來保存,訪問隊列是用list來保存,數(shù)據(jù)量是直線上升,內(nèi)存不大,也只有4g,扛不住。不知道以前的方法是什么?
爬蟲如何保存已經(jīng)訪問過的url
郎朗坤
2019-04-07 09:37:37