第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定

含有中文的url不能download,

包含中文的url都不能download,,,求解

https://img1.sycdn.imooc.com//5c39acc300019a9a24941820.jpg

https://img1.sycdn.imooc.com//5c39ad6700019fef16360910.jpg

正在回答

3 回答

import urllib.request
from urllib.parse import quote
import string


class HtmlDownloader(object):
???
???
??? def download(self,url):
??????? if url is None:
??????????? return None
??????? s=quote(url,safe=string.printable)
???????
??????? response=urllib.request.urlopen(s)
??????? if response.getcode()!=200:
??????????? return None
??????? return response.read()

urllib.quote 解決Python傳遞中文參數(shù)給URL

0 回復(fù) 有任何疑惑可以回復(fù)我~
def?_get_new_urls(self,?page_url,?soup):
????new_urls?=?set()
????#<a?target="_blank"?href="/item/%E9%98%BF%E5%A7%86%E6%96%AF%E7%89%B9%E4%B8%B9/2259975"?data-lemmaid="2259975">阿姆斯特丹</a>
????#https:?//?baike.baidu.com?/?item?/?阿姆斯特丹?/?2259975
????links?=?soup.find_all('a',href=re.compile(r"/item/"))
????for?link?in?links:
????????new_url?=?'/item/'+link.get_text()
????????new_full_url?=?urlparse.urljoin(page_url,new_url)
????????new_urls.add(new_full_url)
????return?new_urls

我也是這么寫的,有哪里寫錯(cuò)了嗎?

0 回復(fù) 有任何疑惑可以回復(fù)我~
#1

BSH

soup用URLEncoder.encode進(jìn)行編碼,soup = URLEncoder.encode(soup,"utf-8");
2019-02-16 回復(fù) 有任何疑惑可以回復(fù)我~

https://img1.sycdn.imooc.com//5c3b02c10001628204490125.jpg

這一步務(wù)必使用函數(shù)進(jìn)行url的拼接,帶有中文的url會(huì)有編碼問題

1 回復(fù) 有任何疑惑可以回復(fù)我~
#1

趙崇輝 提問者

我也是這么寫的,有哪里寫錯(cuò)了嗎?
2019-01-14 回復(fù) 有任何疑惑可以回復(fù)我~

舉報(bào)

0/150
提交
取消
Python開發(fā)簡單爬蟲
  • 參與學(xué)習(xí)       227603    人
  • 解答問題       1282    個(gè)

本教程帶您解開python爬蟲這門神奇技術(shù)的面紗

進(jìn)入課程

含有中文的url不能download,

我要回答 關(guān)注問題
微信客服

購課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)