第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定

為什么爬不到網(wǎng)頁(yè)的地址啊,顯示列表是空的

http://img1.sycdn.imooc.com//5a1973fb0001b78807030216.jpg

如圖,listurl是空的列表,用的python3

正在回答

3 回答

我用的pycharm,今天才手寫(xiě)的代碼,改了幾個(gè)小地方,都寫(xiě)在注釋里面,樓主看看注意到?jīng)]有,謝謝。

import re

import urllib


req = urllib.request.urlopen('http://idcbgp.cn/course/list')

#此處加上decode(),不然拿下來(lái)的數(shù)據(jù)都是亂碼

buf = req.read().decode("utf-8")


#老師講課的url地址已經(jīng)發(fā)生改變,改一下正則匹配就好

# listurl = re.findall(r'src=.+\.jpg', buf)

listurl = re.findall(r'//img.+?\.jpg', buf)

# 改成非貪婪模式就行了



#前面沒(méi)有了http:,那么這里手動(dòng)加上

for index,app_id in enumerate(listurl):

? ? listurl[index] = str(app_id).replace('//', 'http://')

? ? print(index, listurl[index])

print(listurl)



i = 0

for url in listurl:

? ? #寫(xiě)入模式修改為“wb+”,不然不支持將bytes寫(xiě)入,親測(cè)

? ? f = open(str(i)+".jpg", "wb+")

? ? req = urllib.request.urlopen(url)

? ? buf = req.read()

? ? f.write(buf)

? ? i+=1


1 回復(fù) 有任何疑惑可以回復(fù)我~

問(wèn)題就是老師講課的時(shí)候圖片地址是你所寫(xiě)的,但是現(xiàn)在已經(jīng)變成了

//img1.sycdn.imooc.com//598027a90001df8006000338-240-135.jpg

稍微修改一下就可以用了

0 回復(fù) 有任何疑惑可以回復(fù)我~

正則表達(dá)式寫(xiě)錯(cuò)了吧,是r''不是br''

0 回復(fù) 有任何疑惑可以回復(fù)我~

舉報(bào)

0/150
提交
取消

為什么爬不到網(wǎng)頁(yè)的地址啊,顯示列表是空的

我要回答 關(guān)注問(wèn)題
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢(xún)優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)