課程
                    
                        /后端開發(fā)
                        
                            /Python
                        
                        /Python開發(fā)簡單爬蟲

我的只打印一個就跳出異常

qq_安靜的忘記_0

2016-06-30

源自：Python開發(fā)簡單爬蟲 7-7

關(guān)注問題我要回答

1113

操作

收起

8 回答

DarkMan 回答被采納 +3 積分
2016-07-21

我的一開始也是這個問題，然后把解析器里面的如圖的函數(shù)的urlparse.urljoin函數(shù)寫正確了，一開始我寫的是join，你們試試是不是這個原因。（我改過之后就在爬取網(wǎng)頁了）

0 回復有任何疑惑可以回復我~

收起回答

流浪在海洋

請問一下你用的是python2.7還是3.x

2016-08-05 回復有任何疑惑可以回復我~

DarkMan 回復流浪在海洋

2.7

2016-08-17 回復有任何疑惑可以回復我~

洋海灣江河湖池

謝謝，解決了我的問題。我是上面截圖的for和return沒有對齊，導致抓取了5條以后就failed了。

2017-06-12 回復有任何疑惑可以回復我~

熊孩子3657953
2016-08-13

解決了 ?謝謝一樓的方法

0 回復有任何疑惑可以回復我~

收起回答

_Mr_su
2016-07-30

解決了謝謝

0 回復有任何疑惑可以回復我~

收起回答

mk908429705
2016-07-19

這個問題很多同學都出現(xiàn)過，導包的時候要注意，兩種導入包的方式是有點區(qū)別的，我的是由于導入BeautifulSoup時寫成import?BeautifulSoup了，改成from bs4?import?BeautifulSoup就好了，你可以試一下

0 回復有任何疑惑可以回復我~

收起回答

迷你熊

我這塊沒有問題但還是不行

2016-07-29 回復有任何疑惑可以回復我~

沸騰cqcp
2016-07-18

問題很多慢慢找吧

0 回復有任何疑惑可以回復我~

收起回答

達達里昂
2016-07-18

我也遇到這個問題了，不過經(jīng)過調(diào)試已經(jīng)解決掉了，發(fā)出來供大家參考。

這個應(yīng)該是BeautifulSoup版本造成的格式問題，我將html_parser.py中涉及title_node和summary_node的語句，改成下面的格式，重新運行就可以正常輸出了。

title_node?=?soup.find("dd",?attrs={"class":"lemmaWgt-lemmaTitle-title"}).find("h1")

summary_node?=?soup.find('div',?attrs={"class":"lemma-summary"})

希望對你有所幫助。

2 回復有任何疑惑可以回復我~

收起回答

沸騰cqcp

還是不行，好氣

2016-07-18 回復有任何疑惑可以回復我~

落云殤

可以了，多謝

2016-07-22 回復有任何疑惑可以回復我~

熊孩子3657953

謝謝終于解決了

2016-08-13 回復有任何疑惑可以回復我~

nickasan
2016-07-10

我的也是這樣，求解啊

0 回復有任何疑惑可以回復我~

收起回答

三俗
2016-07-02

craw 1 :http://baike.baidu.com/view/21087.htm

craw failed

Process finished with exit code 0

我也這樣

0 回復有任何疑惑可以回復我~

收起回答

舉報

0/150

提交

取消

Python開發(fā)簡單爬蟲

參與學習 227603 人
解答問題 1284 個

本教程帶您解開python爬蟲這門神奇技術(shù)的面紗

進入課程

我的只打印一個就跳出異常

我要回答關(guān)注問題

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

我的只打印一個就跳出異常

8 回答

我的只打印一個就跳出異常