課程
                    
                        /后端開(kāi)發(fā)
                        
                            /Python
                        
                        /Python最火爬蟲(chóng)框架Scrapy入門(mén)與實(shí)踐

分頁(yè)，回調(diào)沒(méi)成功

#?-*-?coding:?utf-8?-*-
import?scrapy
from?douban.items?import?DoubanItem

class?DoubanSpiderSpider(scrapy.Spider):
????#爬蟲(chóng)名
????name?=?'douban_spider'
????allowed_domains?=?['movic.douban.com']
????start_urls?=?['https://movie.douban.com/top250']

????def?parse(self,?response):
????????movic_list=response.xpath("http://div[@class='article']//ol[@class='grid_view']/li")
????????for?i_item?in?movic_list:
????????????douban_item=DoubanItem()
????????????douban_item['serial_number']=i_item.xpath(".//div[@class='item']//em/text()").extract_first()
????????????douban_item['movic_name']=i_item.xpath(".//div[@class='info']/div[@class='hd']/a/span[1]/text()").extract_first()
????????????content=i_item.xpath(".//div[@class='info']//div[@class='bd']/p[1]/text()").extract_first()
????????????for?i_content?in?content:
????????????????content_s="".join(i_content.split())
????????????????douban_item['introduce']=content_s
????????????douban_item['star']=i_item.xpath(".//span[@class='rating_num']/text()").extract_first()
????????????douban_item['evaluate']=i_item.xpath(".//div[@class='star']//span[4]/text()").extract_first()
????????????douban_item["des"]=i_item.xpath(".//p[@class='quote']/span/text()").extract_first()
????????????print(douban_item)
????????????yield??douban_item
????????next_link=response.xpath("http://span[@class='next']/link/@href").extract()
????????if?next_link:
????????????next_link=next_link[0]
????????????yield?scrapy.Request("https://movie.douban.com/top250"?+?next_link,?callback=self.parse)

躺著學(xué)代碼

2018-08-31

源自：Python最火爬蟲(chóng)框架Scrapy入門(mén)與實(shí)踐 2-7

關(guān)注問(wèn)題我要回答

1193

操作

收起

1 回答

qq_蔚藍(lán)色的天空_3 回答被采納 +2 積分
2018-09-09

這個(gè)是scrapy中回調(diào)時(shí)被過(guò)濾了? 解決方法

在?allowed_domains?中加入 url?
在 scrapy.Request() 函數(shù)中將參數(shù)?dont_filter=True?設(shè)置為 True

修改這一行代碼如下，我個(gè)人采取第二種方式dont_filter=Ture：

yield?scrapy.Request("https://movie.douban.com/top250"+next_link,?callback=self.parse,?dont_filter=True)

3 回復(fù) 有任何疑惑可以回復(fù)我~

收起回答

舉報(bào)

0/150

提交

取消

Python最火爬蟲(chóng)框架Scrapy入門(mén)與實(shí)踐

參與學(xué)習(xí) 67423 人
解答問(wèn)題 235 個(gè)

做為爬蟲(chóng)工程師Python Scrapy主流爬蟲(chóng)框架你必須要會(huì)！

進(jìn)入課程

本課相似問(wèn)答

1 回答分頁(yè)做不了

2 回答沒(méi)有報(bào)錯(cuò),但是沒(méi)有抓取到任何網(wǎng)頁(yè)信息

4 回答老師問(wèn)一下，response.text可以打印出top250頁(yè)面。但是i_item無(wú)法打印，可能是什么原因造成的？

3 回答這個(gè)錯(cuò)誤是怎么回事?

1 回答Xpath在解析的時(shí)候沒(méi)問(wèn)題，但是有的Xpath語(yǔ)句就爬不到東西怎么回事呢

搜索更多本課相關(guān)問(wèn)答

分頁(yè)，回調(diào)沒(méi)成功

我要回答關(guān)注問(wèn)題

使用 Ctrl+D 可將網(wǎng)站添加到書(shū)簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

分頁(yè)，回調(diào)沒(méi)成功

1 回答

本課相似問(wèn)答

分頁(yè)，回調(diào)沒(méi)成功

分頁(yè)，回調(diào)沒(méi)成功

分頁(yè)，回調(diào)沒(méi)成功