關(guān)于爬取到的圖片
為什么爬下來(lái)的圖片是原網(wǎng)頁(yè)中按照最熱排序的,而手動(dòng)打開(kāi)原網(wǎng)頁(yè)卻是自動(dòng)按最新排序的
#??Python?3.6.1
#?????????????????????????----By??Wang
import?re
import?urllib.request
req=urllib.request.urlopen('http://idcbgp.cn/course/list')
buf=req.read()
buf=buf.decode('utf-8')
listurl=re.findall(r'src=.+?\.jpg',buf)
i=0
for?url?in?listurl:
??????url=re.search(r'http:.+?\.jpg',url)
??????f=open(str(i)+'.jpg','wb')
??????req=urllib.request.urlopen(url.group())
??????buf=req.read()
??????f.write(buf)
??????f.close()
??????i+=1
2017-09-05
我猜,打開(kāi)最新的鏈接是這樣的http://idcbgp.cn/course/list?sort=last,如果鏈接沒(méi)有參數(shù)sort=last的話,慕課網(wǎng)就默認(rèn)返回的是最熱的顯示內(nèi)容吧,畢竟通過(guò)最熱,可以讓用戶更好的找到當(dāng)前熱門的自己喜歡的課程吧