現(xiàn)在有一批沒(méi)有規(guī)律的url,在文件中存儲(chǔ)。希望抓取每個(gè)url對(duì)應(yīng)的頁(yè)面,并從中提取特定的內(nèi)容。對(duì)于每個(gè)url,不需要遞歸抓取。請(qǐng)問(wèn)要怎么通過(guò)pyspider實(shí)現(xiàn)?
1 回答

慕哥9229398
TA貢獻(xiàn)1877條經(jīng)驗(yàn) 獲得超6個(gè)贊
可以存到數(shù)據(jù)庫(kù)里 用數(shù)據(jù)庫(kù)讀取
但是你這些url怎么加載呢 頁(yè)面元素也是不一樣的吧
- 1 回答
- 0 關(guān)注
- 624 瀏覽
添加回答
舉報(bào)
0/150
提交
取消