第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號安全,請及時綁定郵箱和手機立即綁定

爬了一個,第二個failed就停止了

爬了一個,第二個failed就停止了

正在回答

5 回答

我用著不是太好治療癲癇病的方法

0 回復 有任何疑惑可以回復我~

用這個方法爬出了10條數(shù)據(jù)


0 回復 有任何疑惑可以回復我~

我的用這個方法不行

0 回復 有任何疑惑可以回復我~

贊一個,我也遇到此問題,正準備求助

0 回復 有任何疑惑可以回復我~

你點擊第二的url會發(fā)現(xiàn)他是鎖定詞條的頁面,去看html代碼的話可以看出來“鎖定”這個href的模式也是/view/123.htm,所以按照視頻里的代碼第一條抓出來的就是鎖定,這個會出現(xiàn)錯誤。

http://img1.sycdn.imooc.com//57513e810001277d05510228.jpg

比較笨的方法,我在parser里面加入了個判斷:

for?link?in?links:
????new_url?=?link['href']
????new_full_url?=?urlparse.urljoin(page_url,?new_url)
????#?print?new_full_url
????if?new_full_url?==?'http://baike.baidu.com/view/10812319.htm':
????????continue
????new_urls.add(new_full_url)
return?new_urls

這樣就可以了

0 回復 有任何疑惑可以回復我~
#1

charsandrew

為什么鎖定詞條的頁面不能抓取?鎖定詞條也有標題,概要,和url 應該是可以抓取的啊!能解釋下嗎?
2016-06-26 回復 有任何疑惑可以回復我~

舉報

0/150
提交
取消
Python開發(fā)簡單爬蟲
  • 參與學習       227603    人
  • 解答問題       1288    個

本教程帶您解開python爬蟲這門神奇技術的面紗

進入課程

爬了一個,第二個failed就停止了

我要回答 關注問題
微信客服

購課補貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網(wǎng)微信公眾號