第七色在线视频,2021少妇久久久久久久久久,亚洲欧洲精品成人久久av18,亚洲国产精品特色大片观看完整版,孙宇晨将参加特朗普的晚宴

為了賬號(hào)安全,請(qǐng)及時(shí)綁定郵箱和手機(jī)立即綁定
已解決430363個(gè)問(wèn)題,去搜搜看,總會(huì)有你想問(wèn)的

utf8編碼規(guī)則會(huì)受制于Unicode實(shí)際的字符對(duì)應(yīng)嗎?

utf8編碼規(guī)則會(huì)受制于Unicode實(shí)際的字符對(duì)應(yīng)嗎?

慕工程0101907 2019-02-22 16:47:33
我用python 寫'\xF5\x90\x90\x90'.decode('utf8') 但是報(bào)錯(cuò)了: UnicodeDecodeError: 'utf8' codec can't decode byte 0xf5 in position 0: invalid start byte 問(wèn)題是:\xF5\x90\x90\x90 是個(gè)標(biāo)準(zhǔn)的四字節(jié)的utf8編碼的字符啊 轉(zhuǎn)換成二進(jìn)制就是 11110101 10010000 10010000 10010000 完全符合utf8編碼規(guī)則:11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 我把\xF5換成\xF2就沒(méi)有問(wèn)題了,也就是11110010開(kāi)頭,難道是因?yàn)閁nicode實(shí)際上沒(méi)有用到這么多的字符,所以不能decode('utf8')?但是規(guī)則是對(duì)的呀,萬(wàn)一哪天Unicode又?jǐn)U充了很多字符集,那python的decode()函數(shù)豈不是要更新了?
查看完整描述

1 回答

?
婷婷同學(xué)_

TA貢獻(xiàn)1844條經(jīng)驗(yàn) 獲得超8個(gè)贊

因?yàn)閁nicode的范圍是0x0000-0x10FFFF,我測(cè)試了一下,python中比規(guī)范更為寬松,最大支持到0xFFFFF,而你題目中輸?shù)囊呀?jīng)超過(guò)這個(gè)范圍所以報(bào)錯(cuò)了。
附:UTF-8標(biāo)準(zhǔn) RFC3629

查看完整回答
反對(duì) 回復(fù) 2019-03-01
  • 1 回答
  • 0 關(guān)注
  • 616 瀏覽
慕課專欄
更多

添加回答

舉報(bào)

0/150
提交
取消
微信客服

購(gòu)課補(bǔ)貼
聯(lián)系客服咨詢優(yōu)惠詳情

幫助反饋 APP下載

慕課網(wǎng)APP
您的移動(dòng)學(xué)習(xí)伙伴

公眾號(hào)

掃描二維碼
關(guān)注慕課網(wǎng)微信公眾號(hào)