第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定

page_url是從哪里出現(xiàn)的?

如題。好像是突然出現(xiàn)的,main里面沒有,也不是傳入的參數(shù)

正在回答

1 回答

spider_main中的 ?root_url ?通過urls.get_new_url()獲取的可爬取的URL

def?craw(self,root_url):
????????count=1
????????self.urls.add_new_url(root_url)
????????while?self.urls.has_new_url():
????????????try:
????????????????new_url=self.urls.get_new_url()
????????????????print?'craw?%d:%s'?%(count,new_url)
????????????????html_cont=self.downloader.download(new_url)
????????????????new_urls,new_data=self.parser.parser(new_url,html_cont)
????????????????self.urls.add_new_urls(new_urls)
????????????????self.outputer.collect_data(new_data)

????????????????if?count==1000:
????????????????????break
????????????????count=count+1
????????????except:
????????????????print?'craw?feild'
????????self.outputer.output_html()
????????

if?__name__=="__main__":
????root_url="http://baike.baidu.com/view/21087.htm"
????obj_spider=SpiderMain()
????obj_spider.craw(root_url)


0 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消
Python開發(fā)簡單爬蟲
  • 參與學習       227603    人
  • 解答問題       1284    個

本教程帶您解開python爬蟲這門神奇技術(shù)的面紗

進入課程

page_url是從哪里出現(xiàn)的?

我要回答 關(guān)注問題
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號