課程
/后端開發(fā)
/Python
/Python開發(fā)簡單爬蟲
換了幾個頁面都是這個結果,想問下史記是哪里來的???
還有就是這樣就中斷了可能有什么原因?。?/p>
上面的編碼問題怎么解決?
2018-04-15
源自:Python開發(fā)簡單爬蟲 7-7
正在回答
嗯。。。。因為python的那個百度百科的頁面的html代碼升級了一哈,原本的抓取URl的代碼不能用了,你把parser里面的_get_new_urls這個函數(shù)的re.compile語句后面的正則表達式改一下,改成這樣re.compile(r"/item/")就ok了
craw 1:https://baike.baidu.com/item/Python/407313
craw failed
還沒有爬呢,就死了?。?!求教
url編碼的問題
糖水_ 提問者
團子wwwxxx 回復 糖水_ 提問者
糖水_ 提問者 回復 團子wwwxxx
Masc 回復 團子wwwxxx
舉報
本教程帶您解開python爬蟲這門神奇技術的面紗
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網APP您的移動學習伙伴
掃描二維碼關注慕課網微信公眾號
2018-06-04
嗯。。。。因為python的那個百度百科的頁面的html代碼升級了一哈,原本的抓取URl的代碼不能用了,你把parser里面的_get_new_urls這個函數(shù)的re.compile語句后面的正則表達式改一下,改成這樣re.compile(r"/item/")就ok了
2018-07-02
craw 1:https://baike.baidu.com/item/Python/407313
craw failed
還沒有爬呢,就死了?。?!求教
2018-04-16
url編碼的問題