課程
/后端開發(fā)
/Python
/Python開發(fā)簡單爬蟲
我的只打印一個就跳出異常
2016-06-30
源自:Python開發(fā)簡單爬蟲 7-7
正在回答
我的一開始也是這個問題,然后把解析器里面的如圖的函數(shù)的urlparse.urljoin函數(shù)寫正確了,一開始我寫的是join,你們試試是不是這個原因。(我改過之后就在爬取網(wǎng)頁了)
流浪在海洋
DarkMan 回復 流浪在海洋
洋海灣江河湖池
解決了 ?謝謝一樓的方法
解決了 謝謝
這個問題很多同學都出現(xiàn)過,導包的時候要注意,兩種導入包的方式是有點區(qū)別的,我的是由于導入BeautifulSoup時寫成import?BeautifulSoup了,改成from bs4?import?BeautifulSoup就好了,你可以試一下
迷你熊
問題很多 慢慢找吧
我也遇到這個問題了,不過經(jīng)過調(diào)試已經(jīng)解決掉了,發(fā)出來供大家參考。
這個應(yīng)該是BeautifulSoup版本造成的格式問題,我將html_parser.py中涉及title_node和summary_node的語句,改成下面的格式,重新運行就可以正常輸出了。
title_node?=?soup.find("dd",?attrs={"class":"lemmaWgt-lemmaTitle-title"}).find("h1")
summary_node?=?soup.find('div',?attrs={"class":"lemma-summary"})
希望對你有所幫助。
沸騰cqcp
落云殤
熊孩子3657953
我的也是這樣,求解啊
craw 1 :http://baike.baidu.com/view/21087.htm
craw failed
Process finished with exit code 0
我也這樣
舉報
本教程帶您解開python爬蟲這門神奇技術(shù)的面紗
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號-11 京公網(wǎng)安備11010802030151號
購課補貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動學習伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號
2016-07-21
我的一開始也是這個問題,然后把解析器里面的如圖的函數(shù)的urlparse.urljoin函數(shù)寫正確了,一開始我寫的是join,你們試試是不是這個原因。(我改過之后就在爬取網(wǎng)頁了)
2016-08-13
解決了 ?謝謝一樓的方法
2016-07-30
解決了 謝謝
2016-07-19
這個問題很多同學都出現(xiàn)過,導包的時候要注意,兩種導入包的方式是有點區(qū)別的,我的是由于導入BeautifulSoup時寫成import?BeautifulSoup了,改成from bs4?import?BeautifulSoup就好了,你可以試一下
2016-07-18
問題很多 慢慢找吧
2016-07-18
我也遇到這個問題了,不過經(jīng)過調(diào)試已經(jīng)解決掉了,發(fā)出來供大家參考。
這個應(yīng)該是BeautifulSoup版本造成的格式問題,我將html_parser.py中涉及title_node和summary_node的語句,改成下面的格式,重新運行就可以正常輸出了。
希望對你有所幫助。
2016-07-10
我的也是這樣,求解啊
2016-07-02
craw 1 :http://baike.baidu.com/view/21087.htm
craw failed
Process finished with exit code 0
我也這樣