課程
/后端開發(fā)
/Python
/Python開發(fā)簡(jiǎn)單爬蟲
為什么我加了encode('utf-8') 但是爬取到的還是亂碼!
2016-09-20
源自:Python開發(fā)簡(jiǎn)單爬蟲 7-6
正在回答
已經(jīng)解決
win7 python3.6 遇到亂碼的情況
同明磊
只需要在fout = open('output.html', 'w', encoding = 'utf-8')
?fout.write("<td>%s</td>" % data['title'])
?fout.write("<td>%s</td>" % data['summary'])
這里面不能加.encode('utf-8'),加了會(huì)亂碼
fout.write("<head><meta charset = 'utf-8'></head>")這個(gè)寫不寫無(wú)所謂,不影響
打開的網(wǎng)頁(yè)格式默認(rèn)是簡(jiǎn)體中文,改成unicode(UTF-8)就行了。
用記事本保存為utf-8和fout.write("<meta charset='utf-8'>")都可以
謝謝你的回答。 你說(shuō)的修改是改瀏覽器的設(shè)置 還是 ?我是直接在寫入的時(shí)候加入語(yǔ)句:? ? fout.write("<meta charset='utf-8'>")?這樣就可以了。
薔薇旖夢(mèng)
Vsolution
導(dǎo)出的out.html頁(yè)面,瀏覽器默認(rèn)打開的是gbk編碼,修改下為utf-8編碼就好了
舉報(bào)
本教程帶您解開python爬蟲這門神奇技術(shù)的面紗
Copyright ? 2025 imooc.com All Rights Reserved | 京ICP備12003892號(hào)-11 京公網(wǎng)安備11010802030151號(hào)
購(gòu)課補(bǔ)貼聯(lián)系客服咨詢優(yōu)惠詳情
慕課網(wǎng)APP您的移動(dòng)學(xué)習(xí)伙伴
掃描二維碼關(guān)注慕課網(wǎng)微信公眾號(hào)
2017-10-03
已經(jīng)解決
win7 python3.6 遇到亂碼的情況
同明磊
只需要在fout = open('output.html', 'w', encoding = 'utf-8')
?fout.write("<td>%s</td>" % data['title'])
?fout.write("<td>%s</td>" % data['summary'])
這里面不能加.encode('utf-8'),加了會(huì)亂碼
fout.write("<head><meta charset = 'utf-8'></head>")這個(gè)寫不寫無(wú)所謂,不影響
2017-03-06
打開的網(wǎng)頁(yè)格式默認(rèn)是簡(jiǎn)體中文,改成unicode(UTF-8)就行了。
2016-09-28
用記事本保存為utf-8和fout.write("<meta charset='utf-8'>")都可以
2016-09-22
謝謝你的回答。 你說(shuō)的修改是改瀏覽器的設(shè)置 還是 ?
我是直接在寫入的時(shí)候加入語(yǔ)句:
? ? fout.write("<meta charset='utf-8'>")?
這樣就可以了。
2016-09-20
導(dǎo)出的out.html頁(yè)面,瀏覽器默認(rèn)打開的是gbk編碼,修改下為utf-8編碼就好了