我爬的網(wǎng)頁源碼頂端寫的是 <meta charset="utf-8">我在瀏覽器打開源碼看到我想要的信息也是中文,不過在urllib2.urlopen(url).read()輸出來的卻是類似于陈颖這種unicode編碼(我的python程序是coding:utf-8)
3 回答

有只小跳蛙
TA貢獻(xiàn)1824條經(jīng)驗 獲得超8個贊
那可以試試這樣:
>>> h = HTMLParser.HTMLParser()>>> import HTMLParser>>> h = HTMLParser.HTMLParser()>>> print h.unescape('陈颖')

寶慕林4294392
TA貢獻(xiàn)2021條經(jīng)驗 獲得超8個贊
import HTMLParser h = HTMLParser.HTMLParser() print h.unescape("陈颖").encode("utf-8")
添加回答
舉報
0/150
提交
取消