第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定

運(yùn)行結(jié)果沒有問題 文件寫入正常 就是詞條的內(nèi)容亂碼

594693d70001faa006400360.jpg
594693dd0001cdad06400360.jpg
594693e2000101a806400360.jpg
594693e500019c5a06400360.jpg
594693e900012cb106400360.jpg
594693ed0001871712290346.jpg
594693f20001cfc212330607.jpg
弄了很久了 還沒找到解決方法 求解

正在回答

3 回答

  1. 如果是URL部分亂碼/item/%E7%BC%96%,是因?yàn)閡rl采用了再編碼-->16進(jìn)制編碼

    解決方法:調(diào)用urllib.parse.unquote("/item/%E7%BC%96%")來(lái)變回中文

    注意:變回中文的URL無(wú)法用urllib.request.urlopen(URL)來(lái)訪問,可以在最后輸出html的時(shí)候變回中文

  2. 輸出的html分url,title,data三列,title和data出現(xiàn)\x96\x12\x34(unicode編碼)

    原因:因?yàn)橄扔?strong>encoding='utf-8'新建html文件,然后又fout.write("<td>%s</td>" % data['title'].encode('utf-8))又編碼成unicode

    解決方法:直接fout.write("<td>%s</td>" % data['title'])

  3. 附源代碼,可對(duì)比學(xué)習(xí)

  4. http://img1.sycdn.imooc.com//594826c800016b7f07200824.jpg

  5. http://img1.sycdn.imooc.com//594826b90001d85c07270726.jpg

  6. http://img1.sycdn.imooc.com//594826e300012d0d07270442.jpg

  7. http://img1.sycdn.imooc.com//594826f600015dbe07260998.jpg

  8. http://img1.sycdn.imooc.com//594827060001b0e507260748.jpg


4 回復(fù) 有任何疑惑可以回復(fù)我~
#1

丶coding 提問者

我之前就是這樣弄的 因?yàn)閔tml默認(rèn)打開的方式是IE瀏覽器 打開后就亂碼 換成記事本或者chrome打開就正常顯示了 說(shuō)白了 就是被IE瀏覽器坑了
2017-06-20 回復(fù) 有任何疑惑可以回復(fù)我~
#2

小蟒蛇

謝謝,解決了我很多編碼方面的問題,不用頭大了
2017-11-17 回復(fù) 有任何疑惑可以回復(fù)我~

#<a target="_blank" href="/item/%E8%83%B6%E6%B0%B4%E8%AF%AD%E8%A8%80">膠水語(yǔ)言</a>

links = soup.find_all('a', href = re.compile(r'^/item/[\W\w]+'))

?求教正則匹配這兒應(yīng)該怎么寫呢?我的正則匹配不出來(lái)東西么!?。?/p>

0 回復(fù) 有任何疑惑可以回復(fù)我~

沒有指定編碼格式?課程中不是說(shuō)了要加上coding=utf-8

0 回復(fù) 有任何疑惑可以回復(fù)我~
#1

丶coding 提問者

指定了。。。
2017-06-18 回復(fù) 有任何疑惑可以回復(fù)我~
#2

丶coding 提問者

沒用。。。寫入文件的亂碼和那個(gè)無(wú)關(guān)
2017-06-19 回復(fù) 有任何疑惑可以回復(fù)我~

舉報(bào)

0/150
提交
取消
Python開發(fā)簡(jiǎn)單爬蟲
  • 參與學(xué)習(xí)       227603    人
  • 解答問題       1282    個(gè)

本教程帶您解開python爬蟲這門神奇技術(shù)的面紗

進(jìn)入課程

運(yùn)行結(jié)果沒有問題 文件寫入正常 就是詞條的內(nèi)容亂碼

我要回答 關(guān)注問題
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)