最贊回答 / SeaRhyme
有可能是數(shù)據(jù)庫初始化函數(shù)里面的內(nèi)容沒有運(yùn)行到,__init__(self)這個名字init左右都是雙下劃線,pycharm寫對了會變色的
2018-09-11
已采納回答 / qq_蔚藍(lán)色的天空_3
這個是scrapy中回調(diào)時被過濾了? 解決方法在?allowed_domains?中加入 url?在 scrapy.Request() 函數(shù)中將參數(shù)?dont_filter=True?設(shè)置為 True修改這一行代碼如下,我個人采取第二種方式dont_filter=Ture:
yield?scrapy.Request("https://movie.douban.com/top250"+next_link,?callback=self.parse,?dont_filter=True)
2018-08-31
已采納回答 / Accidie漠然
只顯示“1994?/?美國?/?犯罪 劇情”是因?yàn)樵趂or循環(huán)里,douban_item['introduce']的值被覆蓋了,如果想全部爬取的話,可以聲明douban_item['introduce']為一個數(shù)組,把i_content循環(huán)append到數(shù)組里就可以了
2018-08-19
講師回答 / 大壯老師
很多網(wǎng)站,瀏覽器里解析出來的結(jié)果和scrapy解析的結(jié)果是不同的。使用scrapy Request網(wǎng)頁后,可以將網(wǎng)頁保存到本地,查看一下
2018-08-03