最贊回答 / abc通配符123_
正則修改成:links=soup.find_all('a',href=re.compile(r"/item/"))
已采納回答 / Hanson_Meng
python3對(duì)urllib和urllib2進(jìn)行了重構(gòu),拆分成了urllib.request, urllib.response, urllib.parse, urllib.error等幾個(gè)子模塊,這樣的架構(gòu)從邏輯和結(jié)構(gòu)上說(shuō)更加合理。urljoin現(xiàn)在對(duì)應(yīng)的函數(shù)是urllib.parse.urljoin
最贊回答 / 時(shí)間的力量
我爬了一下 ?好像最多只能爬下549條數(shù)據(jù)。 ?對(duì)于正則表達(dá)式,可以參看圖片<...圖片...><...圖片...><...圖片...><...圖片...>
2017-03-17
已采納回答 / Silver_Magician
對(duì),最基本的是eclipse,但是如果你希望能在eclipse上編寫并且能運(yùn)行Python程序的話還要再下載一個(gè)PyDev插件,這樣子的話你就能成功在eclipse上編寫Python程序了,望采納,謝謝!
2017-03-10
已采納回答 / 風(fēng)起了_
#coding:utf-8import urllib2url = "http://www.baidu.com"print "第一種方法"#直接請(qǐng)求response1 = urllib2.urlopen(url)#獲取狀態(tài)碼print response1.getcode()#讀取內(nèi)容print len(response1.read())
2017-03-10
已采納回答 / 馬里奧的馬里奧
class UrlManager(object):??? def __init__(self):?????? self.new_urls=set()?????? self.old_urls=set()??? def add_new_url(self,url):??????? if url is None:??????????? return??????? if url not in self.new_urls and ur...
已采納回答 / 夢(mèng)醉西廂
剛爬成功的,你失敗肯定是哪出錯(cuò)了,對(duì)照這檢查一遍<...圖片...><...圖片...><...圖片...><...圖片...><...圖片...>
2017-02-20
已采納回答 / 狼狗斯特
官網(wǎng)下載 www.python.org/downloads/? 選擇系統(tǒng)和版本