話說同志們在爬取數(shù)據(jù)的時(shí)候如何保存已經(jīng)訪問過的url和隊(duì)列?對于爬取過的url,我使用redis的set來保存,訪問隊(duì)列是用list來保存,數(shù)據(jù)量是直線上升,內(nèi)存不大,也只有4g,扛不住。不知道以前的方法是什么?
爬蟲如何保存已經(jīng)訪問過的url
慕森王
2019-04-06 08:32:08