首頁(yè) 猿問請(qǐng)問為什么這個(gè)爬蟲沒有爬出內(nèi)容啊

請(qǐng)問為什么這個(gè)爬蟲沒有爬出內(nèi)容啊

Python

BIG陽(yáng) 2019-02-26 12:45:33

item.py python-*- coding: utf-8 -* import scrapy class BokeItem(scrapy.Item): url=scrapy.Field() title=scrapy.Field() content=scrapy.Field() boke_spider.py python-*- coding: utf-8 -*- from scrapy.contrib.spiders import CrawlSpider ,Rule from scrapy.contrib.linkextractors import LinkExtractor from boke.items import BokeItem class BokeItem(CrawlSpider): name = 'blog' start_urls =['http://blog.sina.com.cn/s/blog_4701280b0102eo83.html'] def parse_torrent(self,response): torrent=BokeItem() torrent['url']=response.url torrent['title']=response.xpath("http://h2[@class='titName SG_txta']/text()").extract()[0] torrent['content']=response.xpath("http://div[@style='min-height:22px']/text()").extract()[0] return torrent

查看完整描述

3 回答

搖曳的薔薇

TA貢獻(xiàn)1793條經(jīng)驗(yàn) 獲得超6個(gè)贊

from scrapy.contrib.spiders import CrawlSpider ,Rule

你調(diào)用的是CrawlSpider類,但是顯然沒有寫任何的規(guī)則

建議改為Spider類,并將parse_torrent改名為parse,如下:

from scrapy.contrib.spiders import Spider
from boke.items import BokeItem
class BokeItem(Spider):

反對(duì) 回復(fù) 2019-03-01

慕后森

TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超5個(gè)贊

試試去看看官方doc

反對(duì) 回復(fù) 2019-03-01

忽然笑

TA貢獻(xiàn)1806條經(jīng)驗(yàn) 獲得超5個(gè)贊

試試看看這個(gè)博客，專門針對(duì)scrapy的

反對(duì) 回復(fù) 2019-03-01

3 回答
0 關(guān)注
847 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

請(qǐng)問為什么這個(gè)爬蟲沒有爬出內(nèi)容啊

請(qǐng)問為什么這個(gè)爬蟲沒有爬出內(nèi)容啊

3 回答

添加回答