第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定
已解決430363個問題,去搜搜看,總會有你想問的

請問一下,爬蟲小白問個不知道關(guān)于scrapy爬取json動態(tài)生成列表的問題?

請問一下,爬蟲小白問個不知道關(guān)于scrapy爬取json動態(tài)生成列表的問題?

catspeake 2019-11-27 19:06:16
爬蟲小白問個不知道關(guān)于scrapy爬取json動態(tài)生成列表的問題
查看完整描述

3 回答

?
HUWWW

TA貢獻1874條經(jīng)驗 獲得超12個贊

對于只是讀取某幾個網(wǎng)站更新內(nèi)容的爬蟲完全沒必要在python代碼中實現(xiàn)增量的功能,直接在item中增加Url字段。 item['Url'] = response.url 然后在數(shù)據(jù)端把儲存url的column設(shè)置成unique。 之后在python代碼中捕獲數(shù)據(jù)庫commit

查看完整回答
反對 回復(fù) 2019-12-01
?
aluckdog

TA貢獻1847條經(jīng)驗 獲得超7個贊

試試這個
def start_requests(self):
script = """
function main(splash)
splash:set_viewport_size(1028, 10000)
splash:go(splash.args.url)
local scroll_to = splash:jsfunc("window.scrollTo")
scroll_to(0, 2000)
splash:wait(15)
return {
html = splash:html()
}
end
"""

for url in self.start_urls:
yield Request(url,callback=self.parse_info_index,meta = {
'dont_redirect': True,
'splash':{
'args':{'lua_source':script,'images':0},
'endpoint':'execute',

}
})



查看完整回答
反對 回復(fù) 2019-12-01
  • 3 回答
  • 0 關(guān)注
  • 1047 瀏覽
慕課專欄
更多

添加回答

舉報

0/150
提交
取消
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號