課程
                    
                        /后端開發(fā)
                        
                            /Python
                        
                        /Python開發(fā)簡單爬蟲

每次運行爬取到的結(jié)果都不想相同，都到不了設(shè)置的數(shù)量，怎么回事？

#coding=utf-8
#爬蟲總調(diào)度程序

from?baike_spider?import?url_manager,?html_downloader,?html_parser,\
????html_outputer


class?SpiderMain(object):
????def?__init__(self):
????????self.urls=url_manager.UrlManager()
????????self.downloader?=?html_downloader.HtmlDownloader()
????????self.parser?=?html_parser.HtmlParser()
????????self.outputer?=?html_outputer.HtmlOutputer()
????????
????
????def?craw(self,?root_url):
????????count?=?1
????????self.urls.add_new_url(root_url)
????????while?self.urls.has_new_url():
????????????try:
????????????????new_url?=?self.urls.get_new_url()
????????????????print?"craw?%d?:%s"%(count,new_url)
????????????????html_cont?=?self.downloader.dowload(new_url)
????????????????new_urls,new_data?=?self.parser.parse(new_url,html_cont)
????????????????self.urls.add_new_urls(new_urls)
????????????????self.outputer.collect_data(new_data)
????????????
????????????????if?count?==?30:
????????????????????break
????????????????
????????????????count?=?count?+1
????????????except:
????????????????print?'craw?failed'
????????????
????????self.outputer.output_html()????
????
????
if?__name__?==?"__main__":
????root_url?=?"http://baike.baidu.com/view/21087.htm"?#設(shè)置爬取的入口URL
????obj_spider?=?SpiderMain()
????obj_spider.craw(root_url)??#調(diào)用爬蟲的craw來啟動爬蟲

迷你熊

2016-07-29

源自：Python開發(fā)簡單爬蟲 7-7

關(guān)注問題我要回答

737

操作

收起

1 回答

一顆菠蘿
2016-07-30

首先你需要知道程序在哪里報錯，報的什么錯，所以你可以在處理except部分打印出異常錯誤的信息，便于查看后續(xù)找錯，比如這樣

except?Exception?as?e:
????print?'craw?failed:%s'?%?e

然后運行程序，發(fā)現(xiàn)報

craw?failed:'HtmlDownloader'?object?has?no?attribute?'dowload'

錯誤，字面意思是HtmlDownloader對象沒有dowload這個的屬性，找到這個對象：

html_cont?=?self.downloader.dowload(new_url)

然后仔細(xì)觀察你就會發(fā)現(xiàn)你的方法名字拼寫錯誤，少了一個n，應(yīng)該是download，而不是dowload，改正后運行就可以了。

同是python小白，一起加油哈哈！?。?/p>

0 回復(fù) 有任何疑惑可以回復(fù)我~

收起回答

舉報

0/150

提交

取消

Python開發(fā)簡單爬蟲

參與學(xué)習(xí) 227603 人
解答問題 1288 個

本教程帶您解開python爬蟲這門神奇技術(shù)的面紗

進(jìn)入課程

每次運行爬取到的結(jié)果都不想相同，都到不了設(shè)置的數(shù)量，怎么回事？

我要回答關(guān)注問題

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學(xué)習(xí)伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

每次運行爬取到的結(jié)果都不想相同，都到不了設(shè)置的數(shù)量，怎么回事？

1 回答

每次運行爬取到的結(jié)果都不想相同，都到不了設(shè)置的數(shù)量，怎么回事？

每次運行爬取到的結(jié)果都不想相同，都到不了設(shè)置的數(shù)量，怎么回事？

每次運行爬取到的結(jié)果都不想相同，都到不了設(shè)置的數(shù)量，怎么回事？