關(guān)于爬取到的圖片
為什么爬下來的圖片是原網(wǎng)頁中按照最熱排序的,而手動(dòng)打開原網(wǎng)頁卻是自動(dòng)按最新排序的
#??Python?3.6.1 #?????????????????????????----By??Wang import?re import?urllib.request req=urllib.request.urlopen('http://idcbgp.cn/course/list') buf=req.read() buf=buf.decode('utf-8') listurl=re.findall(r'src=.+?\.jpg',buf) i=0 for?url?in?listurl: ??????url=re.search(r'http:.+?\.jpg',url) ??????f=open(str(i)+'.jpg','wb') ??????req=urllib.request.urlopen(url.group()) ??????buf=req.read() ??????f.write(buf) ??????f.close() ??????i+=1
2017-09-04
這個(gè)涉及寫的時(shí)候URL重定向類似的問題,沒影響的,是網(wǎng)頁本身的問題,和你爬的沒關(guān)系。