首頁(yè) 猿問 python 編碼問題

python 編碼問題

Python

蝴蝶刀刀 2019-02-22 11:35:08

python 使用 requests 獲取到一個(gè)網(wǎng)頁(yè)，網(wǎng)頁(yè)本身是gbk編碼的，我將網(wǎng)頁(yè)存入本地文本文件，里面的內(nèi)容中文顯示都沒有問題，但是如果我想用print把網(wǎng)頁(yè)內(nèi)容輸出來(lái) ,中文卻是亂碼的，請(qǐng)問為什么會(huì)這樣呀？

查看完整描述

4 回答

萬(wàn)千封印

TA貢獻(xiàn)1891條經(jīng)驗(yàn) 獲得超3個(gè)贊

把內(nèi)容轉(zhuǎn)換為unicode編碼輸出試試看

content.decode("gbk")

不行再轉(zhuǎn)換為utf-8編碼

content.decode("gbk").encode("utf-8")

反對(duì) 回復(fù) 2019-03-04

ITMISS

TA貢獻(xiàn)1871條經(jīng)驗(yàn) 獲得超8個(gè)贊

 with open('t', 'r') as f:
     print f.read().decode('gbk')

print打印出來(lái)的是ascii類型的字符串，你必須指定用gbk進(jìn)行解碼才能正確顯示中文。

反對(duì) 回復(fù) 2019-03-04

慕容708150

TA貢獻(xiàn)1831條經(jīng)驗(yàn) 獲得超4個(gè)贊

樓上兩位分析的應(yīng)該是對(duì)的。
ascii編碼方式不能滿足中文（字符集遠(yuǎn)比256個(gè)多）的需求。

1，首先你要知道request獲取內(nèi)容的編碼是什么格式，比如是gbk編碼的。
2，解碼成unicode編碼，使用content = content.decode("gbk")。
3，然后編碼成utf-8格式的，使用content = content.encode("utf-8")。

ps：unicode像是一種中間狀態(tài)的編碼，只有解碼成unicode之后才能編碼成別的格式。

反對(duì) 回復(fù) 2019-03-04

largeQ

TA貢獻(xiàn)2039條經(jīng)驗(yàn) 獲得超8個(gè)贊

print會(huì)按照字符原來(lái)的編碼格式打印出來(lái)
但是保存到文件的話，用文件編輯器打開，文件編輯器就會(huì)自動(dòng)識(shí)別編碼，用gbk編碼打開。

所以print是亂碼，保存文件就不是。

反對(duì) 回復(fù) 2019-03-04

4 回答
0 關(guān)注
489 瀏覽

關(guān)注

添加回答

舉報(bào)

0/150

提交

取消

使用 Ctrl+D 可將網(wǎng)站添加到書簽

微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)

第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

熱搜

最近搜索清空

python 編碼問題

python 編碼問題

4 回答

添加回答